首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
低频行为的挖掘是业务流程管理的重要内容之一,区分有效低频和噪音在业务流程优化中显得尤为重要。已有挖掘方法多是从数据属性研究低频行为,较少根据不同模块间的行为属性来分析低频行为,由此提出基于Petri网的业务流程低频行为的挖掘与优化方法。首先,通过用流程树切的直接流图表示日志的行为关系,并与初始模型做匹配,发现所有的低频序列;然后,计算日志与模型的行为距离向量,基于行为紧密度区分有效低频日志和噪音日志,优化事件日志;其次,利用不包含噪音序列的事件日志通过融合交互模块网与特征网,挖掘得到一个优化的业务流程模型;最后,通过具体的实例分析和仿真实验验证了该方法的有效性。  相似文献   

2.
针对传统工作流模型挖掘算法不考虑模型中重复任务的存在,导致挖掘出的模型精确度不高的问题,提出一种基于关系矩阵的重复任务识别方法。通过分析工作流执行日志得到所有事件的前驱后继关系,根据不同的模型结构进行事件重命名,再基于同类别重复事件之间的相似度对重复事件进行聚类得到最优识别结果。实验表明,该方法能正确有效地识别工作流日志中的重复任务,减少模型中的不可见任务,最终提高工作流模型挖掘方法的精确度和可理解性。  相似文献   

3.
日志中发生的低频次行为与挖掘的流程模型中某些不必要的结构相对应,而这些结构的出现会引起挖掘模型在适应度和精确度等指标上的下降。为解决这些结构对流程挖掘模型质量造成的影响,提出一种基于依赖关联度的噪声日志过滤方法。该方法首先根据日志中事件及其依赖关系的统计频率,定义了依赖关系的局部关联度和整体关联度,并将两者归一化为混合关联度来筛选出噪声日志。然后通过轨迹可达性分析去除日志中的噪声,以便最大程度地保留日志轨迹中记录的其他行为。与传统噪声日志过滤算法过滤掉包含噪声日志的整条日志轨迹不同,所提算法在移除噪声日志的同时最大程度地保留了原始日志中的其他非噪声日志。  相似文献   

4.
过程发现的目的是基于记录在事件日志中的业务过程的执行数据发现过程模型,由于一些原因导致过程模型中可能会出现隐变迁,而这些隐变迁的执行又不出现在事件日志中,因此隐变迁的挖掘是过程挖掘的难点之一.已有隐变迁挖掘方法对解决并发结构中的隐变迁存在不足,且可能出现一些冗余的隐变迁.基于此,提出一种带隐变迁的过程模型挖掘新方法,首先基于日志分析活动的基本行为关系,通过并发交叉关系和循环交叉关系来发现and网关类型和循环类型的隐变迁.然后,根据活动基于日志的最小和最大行为距离寻找可能存在skip类型隐变迁的活动对,进一步分析该活动对基于模型和并发结构的最小行为距离,以发现skip类型的隐变迁,并不断优化初始模型,最终得到带多种类型隐变迁的过程模型.实验结果表明,该方法能正确地发现多类型隐变迁,相对现有隐变迁挖掘方法,所提方法能显著降低模型中冗余隐变迁的个数,同时在不降低模型精确度的前提下,有效地改善了模型的适合度.  相似文献   

5.
为解决事件日志中含有循环任务、重复任务和同一任务的过程挖掘问题,进一步优化企业建模方法,改进了α算法,提出了τ算法.该算法重新定义了任务之间的关联关系,提出启发式判定规则,识别出事件日志中所包含的循环任务、重复任务和同一任务;然后对事件日志进行挖掘,提取出工作流网,并还原挖掘预处理阶段重命名的重复任务和删除的单循环任务,从而得到最终的工作流模型.最后,通过实例验证了τ算法的正确性.  相似文献   

6.
流程相似度计算是业务流程管理不可缺少的任务,为了更准确地计算流程之间的相似性,本文提出一种将模型结构与日志行为综合考虑的流程相似度计算方法,先将流程模型结构转化为业务流程图,根据日志中的行为信息对业务流程图的有向边进行加权,进而构建加权业务流程图。加权业务流程图同时包含了流程模型和流程日志中的行为信息,弥补了单一基于流程模型计算流程相似度时的不足。在此基础上给出了加权业务流程图编辑距离的定义,从而得到一种新的流程相似度计算方法。通过实验与已有基于流程模型结构和模型行为相似度计算方法进行对比,证明了所提方法的有效性。所提方法已在开源流程挖掘平台ProM工具中实现。  相似文献   

7.
关系数据库作为企业管理数据的主要工具,在信息系统运行过程中记录下大量事件日志。传统的流程挖掘技术主要处理用文件存储的XES格式日志数据,每次挖掘任务都需要手工从数据库导出最新日志文件,整个过程操作十分繁琐,且无法充分利用关系数据库强大的数据处理能力。针对该问题,研究了面向关系型日志数据的流程挖掘策略与算法。针对关系数据库中储存的大规模事件日志,利用关系数据库的快速排序能力,提出一种挖掘流程任务之间紧邻关系的近似线性挖掘算法,提高了关系型事件日志的流程挖掘效率。该算法对业务数据库侵入性小,具有较好的通用性。该算法已在开源软件平台ProM上实现,通过基于大规模事件日志的对比实验验证了该方法的高效性。  相似文献   

8.
业务流程不频繁行为是指低频次事件轨迹记录的行为,从事件日志中挖掘条件不频繁行为是业务流程优化的关键点之一。已有的研究方法忽略低频次行为,也较少考虑数据流角度下的不频繁行为,本文考虑了事件间隐藏的数据依赖关系,提出基于数据意识的条件不频繁行为挖掘与优化。以模块间的通讯行为轮廓理论为基础,通过查询参考模型的可行迹对频次较低的轨迹添加属性值,计算交互特征间的数据依赖值并对不频繁行为进行分类处理,并根据处理后的优化日志构建模块网和特征网。模块网与特征网进行交互,挖掘出特征网与模块网的业务流程优化通讯模型。最后通过具体的实例分析验证了所提方法的有效性。  相似文献   

9.
为了进行流程发现,提出一种基于流程案例簇的任务关系挖掘方法.该方法首先将基本案例按照特征向量分为多个案例簇,根据基本案例的任务轨迹对案例簇中任务间的依赖关系进行挖掘;然后给出了基于循环基元的循环结构建模和挖掘方法,最终可以从事件日志导出流程中完整的任务依赖关系以及存在的循环结构.所提方法能正确处理任务依赖关系随案例属性取值不同而变化的情况.只要日志完备,基于挖掘到的任务关系和循环结构就能得到一个与原流程行为等价的流程模型.  相似文献   

10.
为了挖掘流程变迁过程中各时段的流程模型,提高流程挖掘结果的准确性,提出了一种基于时变滑窗的自适应流程挖掘方法。在分析了业务流程变化特点的基础上,定义了时变滑窗、相邻事件概率依赖关系等相关概念,研究了以流程实例时间为变量,来控制调整滑窗大小和滑动进度的日志更新规则;基于相邻事件概率依赖关系,给出了流程模型挖掘规则和一种新的流程挖掘算法,根据流程挖掘结果的变化频度和流程实例日志流的到达速率推动时变滑窗持续变更,进而挖掘出整个流程日志中各时段的流程模型。实验结果表明,与已有的流程挖掘方法相比,所提方法具有良好的自适应性和抗噪性。  相似文献   

11.
针对传统的过程发现算法对大规模事件日志挖掘效率低的问题,提出一种利用Spark集群进行加速过程挖掘的方法。该方法主要针对基于日志活动关系的过程挖掘算法,对抽取活动关系阶段进行加速。通过并行分布式抽取活动关系,将事件日志转化为活动关系矩阵。然后利用关系矩阵,按算法原本的后续步骤,挖掘出过程模型。利用Spark实现分布式α-Mine算法和分布式Flexible Heuristic Miner算法,结果表明:所提方法在时间消耗上优于目前最好的算法,挖掘效率明显提升。  相似文献   

12.
事件日志记录数量众多的事件,不仅包含与活动控制流相关的内容,还记录有关活动执行者的信息,即组织维度信息.控制流发现算法从事件日志中自动构建控制流过程模型,组织维度发现算法则构建社交网络模型.如果能合并两种维度,在同一个模型中进行展示,则能够提供更完整的过程组织视图,有助于更准确地对过程以及组织进行分析.因此,提出一种基于执行者过程树的双维度遗传过程挖掘方法(BdSm).一方面,使用Induc-tive Miner预挖掘以优化遗传挖掘算法初始种群,达到生成高质量的控制流模型的目的;另一方面提出日志中活动之间距离的度量方法,能有效度量活动在组织层面的相似度,同时使用执行者信息扩充控制流过程模型,基于执行者过程树生成双维度的过程模型.通过模拟日志以及4个公开事件日志集对所提方法进行验证,结果表明,在控制流维度,所提方法能够生成较高综合质量的过程模型,同时借助组织维度信息,还能够发现典型的工作模式及组织结构.  相似文献   

13.
传统业务流程建模与分析任务中通常将活动表示为离散符号,损失了一定的语义信息。针对这一问题,提出了时序活动表示学习方法,使用多维实数向量对活动语义进行量化表示,为深度学习等现代人工智能技术在业务流程建模与分析中的应用提供基础支持。首先利用过程模型对事件日志的高层次抽象能力,通过过程模型挖掘及仿真对原始事件日志进行增强,扩大事件日志规模并强化活动关系统计信息;然后设计了融合活动关系和执行时间信息的向量表示学习算法,从增强后的事件日志中学习活动向量表示。通过在一个公开的真实医院诊疗日志语料上开展的实验研究验证了所提方法相比于传统的词向量学习方法具有明显优势。  相似文献   

14.
为解决从日志中挖掘业务系统行为变化的问题,提出一种基于不完备日志和日志联合发生关系的挖掘方法。在业务系统原始参考模型未知的情况下,利用系统不含隐变迁的不完备日志,得到日志中活动的联合发生关系;通过提取活动发生的不变集,挖掘日志中的删除(delete)、插入(Insert)和移动(Move)变化操作,实现日志驱动下的系统行为变化挖掘。通过ProM仿真验证了所提方法可以实现系统行为变化的日志挖掘,实验结果表明了该方法的有效性和正确性。  相似文献   

15.
遗传过程挖掘算法以模型质量引导模型的发现,在挖掘模型的同时不断修正挖掘算法的执行,因此相比于其他挖掘算法,更容易生成高质量的过程模型。但由于其迭代发现的特性,对于大型日志,挖掘效率往往较低且生成模型质量不高。针对以上问题,提出一种基于轨迹聚类种群的遗传过程混成挖掘算法(GMTC)。该算法一方面通过轨迹聚类划分事件日志,简化挖掘环境,再使用归纳挖掘算法对事件日志进行预挖掘,为遗传挖掘算法准备高质初始种群;另一方面优化遗传算子,使用对齐日志得到的模型偏差信息指导突变操作,使得突变操作由随机变为有向,从而有效地提高种群的综合质量,使遗传挖掘算法加快收敛。基于过程日志生成器生成模拟日志、某市政府建筑许可申请过程的真实日志以及6个公开数据集的实验结果表明:基于轨迹聚类种群的遗传过程混成挖掘算法相较于其他挖掘算法不但在挖掘效率方面有较大提升,而且挖掘得到的模型质量也能够达到较高的水平。  相似文献   

16.
为了提高过程挖掘中计算最优对齐的效率,提出一种基于Petri网的事件日志与过程模型之间的快速对齐方法——RapidAlign方法。该方法在观察日志的同时运行模型,比对日志活动与模型活动,从而得到日志移动、模型移动和同步移动;根据移动类型计算代价值,并记录日志和模型的当前状态;选取代价值最小的状态继续日志的观察和模型的运行,直到日志和模型均到达结束状态。最终生成一个最优对齐图,其源节点到终节点之间的路径包含了基于标准似然代价函数的事件日志与业务过程模型之间的所有最优对齐。对RapidAlign方法的适用性进行了详细且严格的描述,从理论上证明了该方法的正确性与有效性。通过仿真实验,验证了RapidAlign方法的优越性。  相似文献   

17.
针对描述具体流程案例信息的自然文本,提出一种案例自动抽取方法,实现了无结构过程文本向结构化事件日志转换,从而为后续的过程挖掘研究提供数据支持。首先对过程文本案例抽取任务进行了形式化描述,抽象出活动/属性实体识别、活动/属性关系识别、活动顺序关系识别3个核心任务,然后应用半监督统计学习技术分别设计了解决方法。选取中文菜谱文档为实例开展了大规模实验研究,对所提出的案例信息抽取方法的有效性进行了全面评估。实验结果表明,所提方法能够在少量人工标注数据的基础上有效利用同领域内大量未标注过程文本提升案例抽取效果,且无需人工设计复杂的规则,具有良好的领域适用性。  相似文献   

18.
过程模型描述的行为与事件日志记录的行为之间存在很多偏差,为了使模型可以重演日志中记录的行为,需要对现有模型进行修正。对于存在循环并发结构的模型,现有修正方法得到的模型结构比较复杂,且不能正确地描述活动之间的关系,导致模型精确度较低。因此,针对循环并发结构,提出一种基于逻辑Petri网的动态模型修正方法。基于过程树,提出并发变迁集概念,通过连续日志动作的标识库所集与相应变迁前集之间的关系,进行偏差定位,并根据逻辑Petri网对模型进行动态修正。最后,通过实例验证了所提修正方法的正确性和有效性。  相似文献   

19.
鉴于已有的过程挖掘方法在发现循环结构和隐藏行为上具有一定的局限性,提出一种基于后继关系的行为块挖掘算法。依据日志建立后继关系矩阵,分析了矩阵中变迁间对应的值,从而可以发现所有最小行为块和隐藏的行为关系,包括循环行为块;利用组合原理对带有重复变迁的最小行为块进行组合,得到结构行为块;组合所有行为块得到初始模型,利用已发现的隐藏行为关系修正初始模型得到更加精确的过程模型。通过实例分析和ProM的仿真实验验证了所提方法的可行性。  相似文献   

20.
为提高过程挖掘中计算最优对齐的效率,提出一种基于Petri网可达图的业务对齐方法。首先,根据给定事件日志,提取其包含的活动子集;然后,将子集中包含的活动映射到变迁,构建花型日志模型;进一步,计算花型日志模型与过程模型之间的乘积模型及其可达图;最后,给出算法在可达图中查找出事件日志中全部迹与过程模型之间基于给定代价函数的一个最优对齐和所有最优对齐。从理论上证明了该方法的适用性与有效性。通过仿真实验,验证了该方法的可行性与优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号