首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 469 毫秒
1.
关系数据库作为企业管理数据的主要工具,在信息系统运行过程中记录下大量事件日志。传统的流程挖掘技术主要处理用文件存储的XES格式日志数据,每次挖掘任务都需要手工从数据库导出最新日志文件,整个过程操作十分繁琐,且无法充分利用关系数据库强大的数据处理能力。针对该问题,研究了面向关系型日志数据的流程挖掘策略与算法。针对关系数据库中储存的大规模事件日志,利用关系数据库的快速排序能力,提出一种挖掘流程任务之间紧邻关系的近似线性挖掘算法,提高了关系型事件日志的流程挖掘效率。该算法对业务数据库侵入性小,具有较好的通用性。该算法已在开源软件平台ProM上实现,通过基于大规模事件日志的对比实验验证了该方法的高效性。  相似文献   

2.
传统过程挖掘算法是针对静态模型和静态日志进行设计的,不能直接用于演化过程的发现.为此,提出了一种过程挖掘算法,应用滑窗机制实现增量式算法设计,利用日志事件关系模型,引入日志事件关系计数和阈值机制,实现对事件日志流的持续挖掘,因而能够发现模型演化的历史及模型当前实际执行情况.分析了算法性质及相关参数的影响,并进行了实验验证.  相似文献   

3.
为了发现过程模型漂移的时间点,提出一种基于活动关系频繁度的日志分割方法。事件日志可以用活动关系抽象表示。通过关系抽取将事件日志转化为活动关系矩阵,然后分析每个活动关系的变化趋势并检测出候选变更点将所有候选变更点通过密度聚类的方式进行合并,得到模型漂移的时间点。在人工生成日志上的实验结果表明,算法具有良好的准确率、较小的误差和较低的时间消耗。  相似文献   

4.
为解决传统过程挖掘算法在处理蕴含复杂结构的海量日志时的低效低质问题,提出一种支持复杂结构的混成过程挖掘方法。该方法首先将事件日志转化为具有发生次数的直接后继图,以支持活动间基本关系的判定;通过过程树对已发现的两两活动间的基本关系进行抽象与合并,进而对日志进行更新,反复迭代直到整个日志中的所有具有基本关系的活动被全部发现。若待发现模型由基本块组成,则挖掘结果为基于块的过程模型;若待发现模型包含复杂结构,则通过混成使用基于区域的方法对复杂结构进行发现。最终利用活动重构操作对挖掘结果中已抽象为过程树的部分进行细化,从而获得最终结果。为了进一步提升挖掘效率,还提出并行化的发现与重构方法。大量基于真实数据的实验结果表明,该方法的挖掘效率和挖掘精确度达到了较好的水平。  相似文献   

5.
传统业务流程建模与分析任务中通常将活动表示为离散符号,损失了一定的语义信息。针对这一问题,提出了时序活动表示学习方法,使用多维实数向量对活动语义进行量化表示,为深度学习等现代人工智能技术在业务流程建模与分析中的应用提供基础支持。首先利用过程模型对事件日志的高层次抽象能力,通过过程模型挖掘及仿真对原始事件日志进行增强,扩大事件日志规模并强化活动关系统计信息;然后设计了融合活动关系和执行时间信息的向量表示学习算法,从增强后的事件日志中学习活动向量表示。通过在一个公开的真实医院诊疗日志语料上开展的实验研究验证了所提方法相比于传统的词向量学习方法具有明显优势。  相似文献   

6.
遗传过程挖掘算法以模型质量引导模型的发现,在挖掘模型的同时不断修正挖掘算法的执行,因此相比于其他挖掘算法,更容易生成高质量的过程模型。但由于其迭代发现的特性,对于大型日志,挖掘效率往往较低且生成模型质量不高。针对以上问题,提出一种基于轨迹聚类种群的遗传过程混成挖掘算法(GMTC)。该算法一方面通过轨迹聚类划分事件日志,简化挖掘环境,再使用归纳挖掘算法对事件日志进行预挖掘,为遗传挖掘算法准备高质初始种群;另一方面优化遗传算子,使用对齐日志得到的模型偏差信息指导突变操作,使得突变操作由随机变为有向,从而有效地提高种群的综合质量,使遗传挖掘算法加快收敛。基于过程日志生成器生成模拟日志、某市政府建筑许可申请过程的真实日志以及6个公开数据集的实验结果表明:基于轨迹聚类种群的遗传过程混成挖掘算法相较于其他挖掘算法不但在挖掘效率方面有较大提升,而且挖掘得到的模型质量也能够达到较高的水平。  相似文献   

7.
针对传统工作流模型挖掘算法不考虑模型中重复任务的存在,导致挖掘出的模型精确度不高的问题,提出一种基于关系矩阵的重复任务识别方法。通过分析工作流执行日志得到所有事件的前驱后继关系,根据不同的模型结构进行事件重命名,再基于同类别重复事件之间的相似度对重复事件进行聚类得到最优识别结果。实验表明,该方法能正确有效地识别工作流日志中的重复任务,减少模型中的不可见任务,最终提高工作流模型挖掘方法的精确度和可理解性。  相似文献   

8.
随着大数据时代的来临,为了高性能地转化海量分布式日志,提出事件日志在云平台上基于MapReduce架构的分布式转化算法.提出基于案例拆分的改进算法,以转化单机上的日志,使其变得可行;进一步提出基于MapReduce的并行转化算法.这是在过程挖掘领域中首次实现从海量原始日志到可扩展事件流事件日志的并行转化,极大地提高了转化性能.  相似文献   

9.
业务系统在演进过程中不可避免地引入变化因素,如何将演进中的变化因素对系统模型进行修复具有实际意义.现有模型修复主要针对原始参考模型和完备日志进行,存在原始参考模型未知和不完备日志的局限性.因此,提出基于不完备日志的变化检测方法,在系统原始模型未知的情形下,利用活动的比较矩阵(行为轮廓矩阵)描述事件日志的Delete、Insert和Move变化操作,从而发现原始事件日志同系统实际日志的局部变化偏差域,根据日志偏差域对原始日志发现的模型进行修复,提出7个实现模型修复的算法.最后,通过ProM工具对所提方法进行了仿真和实验,实验结果表明了方法的有效性和正确性.  相似文献   

10.
针对描述具体流程案例信息的自然文本,提出一种案例自动抽取方法,实现了无结构过程文本向结构化事件日志转换,从而为后续的过程挖掘研究提供数据支持。首先对过程文本案例抽取任务进行了形式化描述,抽象出活动/属性实体识别、活动/属性关系识别、活动顺序关系识别3个核心任务,然后应用半监督统计学习技术分别设计了解决方法。选取中文菜谱文档为实例开展了大规模实验研究,对所提出的案例信息抽取方法的有效性进行了全面评估。实验结果表明,所提方法能够在少量人工标注数据的基础上有效利用同领域内大量未标注过程文本提升案例抽取效果,且无需人工设计复杂的规则,具有良好的领域适用性。  相似文献   

11.
鉴于理想的完备日志很难被获取,针对特定次序关系完备的日志已成为评估挖掘算法表现的重要数据来源。提出了一种新颖的针对特定次序关系完备日志生成算法,基于完全有限前缀计算轨迹,使日志生成过程可控。扩展了完备日志的生成算法,使日志能够针对Δw关系和w关系完备,从而满足α谱系挖掘算法对日志的完备性要求。同时提出了一种日志生成算法的评估框架,并对日志生成算法进行评估。  相似文献   

12.
事件日志记录数量众多的事件,不仅包含与活动控制流相关的内容,还记录有关活动执行者的信息,即组织维度信息.控制流发现算法从事件日志中自动构建控制流过程模型,组织维度发现算法则构建社交网络模型.如果能合并两种维度,在同一个模型中进行展示,则能够提供更完整的过程组织视图,有助于更准确地对过程以及组织进行分析.因此,提出一种基于执行者过程树的双维度遗传过程挖掘方法(BdSm).一方面,使用Induc-tive Miner预挖掘以优化遗传挖掘算法初始种群,达到生成高质量的控制流模型的目的;另一方面提出日志中活动之间距离的度量方法,能有效度量活动在组织层面的相似度,同时使用执行者信息扩充控制流过程模型,基于执行者过程树生成双维度的过程模型.通过模拟日志以及4个公开事件日志集对所提方法进行验证,结果表明,在控制流维度,所提方法能够生成较高综合质量的过程模型,同时借助组织维度信息,还能够发现典型的工作模式及组织结构.  相似文献   

13.
为提高过程挖掘中计算最优对齐的效率,提出一种基于Petri网可达图的业务对齐方法。首先,根据给定事件日志,提取其包含的活动子集;然后,将子集中包含的活动映射到变迁,构建花型日志模型;进一步,计算花型日志模型与过程模型之间的乘积模型及其可达图;最后,给出算法在可达图中查找出事件日志中全部迹与过程模型之间基于给定代价函数的一个最优对齐和所有最优对齐。从理论上证明了该方法的适用性与有效性。通过仿真实验,验证了该方法的可行性与优越性。  相似文献   

14.
已有的过程挖掘方法通常以事件日志为输入,挖掘得到扁平过程模型,然而这些方法并不能很好地支持任务之间嵌套关系的识别和分层过程模型的挖掘。由此,提出一种从带有任务生命周期信息的事件日志中识别任务之间嵌套关系,进而挖掘分层业务过程模型的方法,挖掘得到的模型用分层Petri网来描述。在分层过程模型的基础上,给出了模型质量度量方法。为了提高所提方法的通用性和对事件日志中的噪声和低频行为的处理,定义了基本任务关系的频次和频率,并引入噪声阈值来过滤低频关系。所提方法均已在开源过程挖掘平台ProM工具中实现。基于仿真日志数据和真实日志数据,定量比较了所提方法与已有过程挖掘方法挖掘模型的质量,进一步验证了本文方法针对分层业务过程模型挖掘的优势。  相似文献   

15.
为了使包含活动数目较多的事件日志有效挖掘流程模型,提出基于行为特征网的流程模型分解挖掘方法,基于活动日志确定各活动间的行为足迹关系,推得相应的行为矩阵;结合行为矩阵计算行为关系图,从而产生活动聚类;通过现存挖掘算法过滤子日志挖掘子网,并对子网添加接口库所形成子网行为特征网;在行为特征网的基础上,运用合成网的观点合成整网,以此挖掘流程模型。最后通过仿真分析验证了该分解挖掘方法的有效性。  相似文献   

16.
为解决事件日志中含有循环任务、重复任务和同一任务的过程挖掘问题,进一步优化企业建模方法,改进了α算法,提出了τ算法.该算法重新定义了任务之间的关联关系,提出启发式判定规则,识别出事件日志中所包含的循环任务、重复任务和同一任务;然后对事件日志进行挖掘,提取出工作流网,并还原挖掘预处理阶段重命名的重复任务和删除的单循环任务,从而得到最终的工作流模型.最后,通过实例验证了τ算法的正确性.  相似文献   

17.
鉴于已有的过程挖掘方法在发现循环结构和隐藏行为上具有一定的局限性,提出一种基于后继关系的行为块挖掘算法。依据日志建立后继关系矩阵,分析了矩阵中变迁间对应的值,从而可以发现所有最小行为块和隐藏的行为关系,包括循环行为块;利用组合原理对带有重复变迁的最小行为块进行组合,得到结构行为块;组合所有行为块得到初始模型,利用已发现的隐藏行为关系修正初始模型得到更加精确的过程模型。通过实例分析和ProM的仿真实验验证了所提方法的可行性。  相似文献   

18.
针对现有过程挖掘技术在解决成批处理工作流模型挖掘问题上存在的不足,研究了相应的过程挖掘方法。利用系统事件日志中活动实例的输入输出、开始与结束时间等数据,通过引入成批处理特征等概念来发现成批处理区及隐含的事件记录,并结合现有过程挖掘方法来挖掘成批处理工作流模型。该方法充分利用现有过程挖掘方法的优越性能,解决了支持成批处理工作流系统中的模型自动构建问题。通过仿真实验验证了该方法的有效性。  相似文献   

19.
提出了一种基于马尔可夫转移矩阵的过程挖掘方法.在该方法中,业务过程被看作是一条有限齐次的马尔可夫链.基于日志建立转移矩阵,定义基本过程逻辑关系的挖掘规则,并据此规则设计了挖掘算法.此外,将过程形式化表示算法的设计从过程挖掘算法中分离出来,可以满足同一过程的不同形式化表示的需要,具体给出了基于工作流网的过程形式化表示算法.  相似文献   

20.
为了提高过程挖掘中计算最优对齐的效率,提出一种基于Petri网的事件日志与过程模型之间的快速对齐方法——RapidAlign方法。该方法在观察日志的同时运行模型,比对日志活动与模型活动,从而得到日志移动、模型移动和同步移动;根据移动类型计算代价值,并记录日志和模型的当前状态;选取代价值最小的状态继续日志的观察和模型的运行,直到日志和模型均到达结束状态。最终生成一个最优对齐图,其源节点到终节点之间的路径包含了基于标准似然代价函数的事件日志与业务过程模型之间的所有最优对齐。对RapidAlign方法的适用性进行了详细且严格的描述,从理论上证明了该方法的正确性与有效性。通过仿真实验,验证了RapidAlign方法的优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号