首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
针对现有的漂移检测算法不适用于解决单触发序列的漂移问题,提出一种基于活动距离变化的突发漂移检测方法.首先,提取每个滑动窗口中活动的关系矩阵来获取关系的特征向量;其次,为了降低关系矩阵的维度,通过计算滑动窗口之间活动的杰卡德距离,将活动的关系矩阵转换为杰卡德距离分布矩阵;然后,采用KL散度比较相邻距离矩阵中概率分布的变化来定位漂移区间;最后,为了解决粒度大小引起的不确定性问题,以循环关系的位置为窗口大小依次遍历并求得漂移区间的交集来定位漂移点.通过实验对包含12种变更模式且每种模式有5个不同大小日志的模拟数据集和两个软件仓库的执行日志的真实数据集进行了评估.结果表明,该方法可以对单触发序列的突发漂移进行有效定位.  相似文献   

2.
传统业务流程建模与分析任务中通常将活动表示为离散符号,损失了一定的语义信息。针对这一问题,提出了时序活动表示学习方法,使用多维实数向量对活动语义进行量化表示,为深度学习等现代人工智能技术在业务流程建模与分析中的应用提供基础支持。首先利用过程模型对事件日志的高层次抽象能力,通过过程模型挖掘及仿真对原始事件日志进行增强,扩大事件日志规模并强化活动关系统计信息;然后设计了融合活动关系和执行时间信息的向量表示学习算法,从增强后的事件日志中学习活动向量表示。通过在一个公开的真实医院诊疗日志语料上开展的实验研究验证了所提方法相比于传统的词向量学习方法具有明显优势。  相似文献   

3.
针对传统的过程发现算法对大规模事件日志挖掘效率低的问题,提出一种利用Spark集群进行加速过程挖掘的方法。该方法主要针对基于日志活动关系的过程挖掘算法,对抽取活动关系阶段进行加速。通过并行分布式抽取活动关系,将事件日志转化为活动关系矩阵。然后利用关系矩阵,按算法原本的后续步骤,挖掘出过程模型。利用Spark实现分布式α-Mine算法和分布式Flexible Heuristic Miner算法,结果表明:所提方法在时间消耗上优于目前最好的算法,挖掘效率明显提升。  相似文献   

4.
过程漂移是指过程模型在服务期间发生了变更或演化,分为突发漂移和渐变漂移两种类型。传统的过程发现技术假定业务过程是稳定不变的,忽略了过程漂移的存在。目前突发漂移已有较好的检测方法,但渐变漂移没有。以突发漂移检测为基础提出一种渐变漂移检测方法。该方法利用突发漂移点将日志划分为多个阶段,然后通过日志的行为语义混合判断某个阶段是否为渐变漂移。实验结果表明,所提算法的检测效果优于目前最好的算法。  相似文献   

5.
模型修复通过对偏差行为的合理调整,改善事件日志与业务流程之间的一致性性能.采用自循环插入方式对日志中可观测的偏差活动进行模型修复,将优先考虑适合度的提升而忽视精度.为获得事件日志与过程模型之间不可回放的行为模式,根据行为关系将其可达活动图表划分为若干个片段并进行服从性校验.利用回放过程中行为模式所产生的最优对齐检测偏差的发生、位置以及潜在行为关系,将具有直接跟随关系的偏差元素构建为可修复的子结构,从而通过减少事件日志中的偏差个数而改善精度.通过实验使用M-repair插件在不同数据集上进行评估,结果表明该方法相较于现存方法在保证适合度的前提下可显著提升精度.  相似文献   

6.
为了使包含活动数目较多的事件日志有效挖掘流程模型,提出基于行为特征网的流程模型分解挖掘方法,基于活动日志确定各活动间的行为足迹关系,推得相应的行为矩阵;结合行为矩阵计算行为关系图,从而产生活动聚类;通过现存挖掘算法过滤子日志挖掘子网,并对子网添加接口库所形成子网行为特征网;在行为特征网的基础上,运用合成网的观点合成整网,以此挖掘流程模型。最后通过仿真分析验证了该分解挖掘方法的有效性。  相似文献   

7.
为了挖掘流程变迁过程中各时段的流程模型,提高流程挖掘结果的准确性,提出了一种基于时变滑窗的自适应流程挖掘方法。在分析了业务流程变化特点的基础上,定义了时变滑窗、相邻事件概率依赖关系等相关概念,研究了以流程实例时间为变量,来控制调整滑窗大小和滑动进度的日志更新规则;基于相邻事件概率依赖关系,给出了流程模型挖掘规则和一种新的流程挖掘算法,根据流程挖掘结果的变化频度和流程实例日志流的到达速率推动时变滑窗持续变更,进而挖掘出整个流程日志中各时段的流程模型。实验结果表明,与已有的流程挖掘方法相比,所提方法具有良好的自适应性和抗噪性。  相似文献   

8.
为了提高过程挖掘中计算最优对齐的效率,提出一种基于Petri网的事件日志与过程模型之间的快速对齐方法——RapidAlign方法。该方法在观察日志的同时运行模型,比对日志活动与模型活动,从而得到日志移动、模型移动和同步移动;根据移动类型计算代价值,并记录日志和模型的当前状态;选取代价值最小的状态继续日志的观察和模型的运行,直到日志和模型均到达结束状态。最终生成一个最优对齐图,其源节点到终节点之间的路径包含了基于标准似然代价函数的事件日志与业务过程模型之间的所有最优对齐。对RapidAlign方法的适用性进行了详细且严格的描述,从理论上证明了该方法的正确性与有效性。通过仿真实验,验证了RapidAlign方法的优越性。  相似文献   

9.
为提高过程挖掘中计算最优对齐的效率,提出一种基于Petri网可达图的业务对齐方法。首先,根据给定事件日志,提取其包含的活动子集;然后,将子集中包含的活动映射到变迁,构建花型日志模型;进一步,计算花型日志模型与过程模型之间的乘积模型及其可达图;最后,给出算法在可达图中查找出事件日志中全部迹与过程模型之间基于给定代价函数的一个最优对齐和所有最优对齐。从理论上证明了该方法的适用性与有效性。通过仿真实验,验证了该方法的可行性与优越性。  相似文献   

10.
为解决传统过程挖掘算法在处理蕴含复杂结构的海量日志时的低效低质问题,提出一种支持复杂结构的混成过程挖掘方法。该方法首先将事件日志转化为具有发生次数的直接后继图,以支持活动间基本关系的判定;通过过程树对已发现的两两活动间的基本关系进行抽象与合并,进而对日志进行更新,反复迭代直到整个日志中的所有具有基本关系的活动被全部发现。若待发现模型由基本块组成,则挖掘结果为基于块的过程模型;若待发现模型包含复杂结构,则通过混成使用基于区域的方法对复杂结构进行发现。最终利用活动重构操作对挖掘结果中已抽象为过程树的部分进行细化,从而获得最终结果。为了进一步提升挖掘效率,还提出并行化的发现与重构方法。大量基于真实数据的实验结果表明,该方法的挖掘效率和挖掘精确度达到了较好的水平。  相似文献   

11.
过程模型描述的行为与事件日志记录的行为之间存在很多偏差,为了使模型可以重演日志中记录的行为,需要对现有模型进行修正。对于存在循环并发结构的模型,现有修正方法得到的模型结构比较复杂,且不能正确地描述活动之间的关系,导致模型精确度较低。因此,针对循环并发结构,提出一种基于逻辑Petri网的动态模型修正方法。基于过程树,提出并发变迁集概念,通过连续日志动作的标识库所集与相应变迁前集之间的关系,进行偏差定位,并根据逻辑Petri网对模型进行动态修正。最后,通过实例验证了所提修正方法的正确性和有效性。  相似文献   

12.
传统过程挖掘算法是针对静态模型和静态日志进行设计的,不能直接用于演化过程的发现.为此,提出了一种过程挖掘算法,应用滑窗机制实现增量式算法设计,利用日志事件关系模型,引入日志事件关系计数和阈值机制,实现对事件日志流的持续挖掘,因而能够发现模型演化的历史及模型当前实际执行情况.分析了算法性质及相关参数的影响,并进行了实验验证.  相似文献   

13.
过程发现的目的是基于记录在事件日志中的业务过程的执行数据发现过程模型,由于一些原因导致过程模型中可能会出现隐变迁,而这些隐变迁的执行又不出现在事件日志中,因此隐变迁的挖掘是过程挖掘的难点之一.已有隐变迁挖掘方法对解决并发结构中的隐变迁存在不足,且可能出现一些冗余的隐变迁.基于此,提出一种带隐变迁的过程模型挖掘新方法,首先基于日志分析活动的基本行为关系,通过并发交叉关系和循环交叉关系来发现and网关类型和循环类型的隐变迁.然后,根据活动基于日志的最小和最大行为距离寻找可能存在skip类型隐变迁的活动对,进一步分析该活动对基于模型和并发结构的最小行为距离,以发现skip类型的隐变迁,并不断优化初始模型,最终得到带多种类型隐变迁的过程模型.实验结果表明,该方法能正确地发现多类型隐变迁,相对现有隐变迁挖掘方法,所提方法能显著降低模型中冗余隐变迁的个数,同时在不降低模型精确度的前提下,有效地改善了模型的适合度.  相似文献   

14.
过程挖掘中漂移检测的目的是通过检测日志的变化来断定模型是否发生了改变,然而现有方法存在抽取特征量大、检测延迟及无法准确定位变化区域的局限。针对突发漂移检测提出一种基于完备性的漂移检测算法。首先,将突发漂移检测转换为日志中局部完备性计算问题;然后,利用切比雪夫不等式推断完备性表达式;进一步,通过可选参数的窗口来训练完备性初始值,避免选择及并发结构的干扰;最后,定义了切割操作对漂移之前的完备值进行清除,进而对日志进行迭代检测。通过多组模型数据进行了实验评估,并与已有方法进行对比,验证了所提方法的有效性。  相似文献   

15.
业务系统在演进过程中不可避免地引入变化因素,如何将演进中的变化因素对系统模型进行修复具有实际意义.现有模型修复主要针对原始参考模型和完备日志进行,存在原始参考模型未知和不完备日志的局限性.因此,提出基于不完备日志的变化检测方法,在系统原始模型未知的情形下,利用活动的比较矩阵(行为轮廓矩阵)描述事件日志的Delete、Insert和Move变化操作,从而发现原始事件日志同系统实际日志的局部变化偏差域,根据日志偏差域对原始日志发现的模型进行修复,提出7个实现模型修复的算法.最后,通过ProM工具对所提方法进行了仿真和实验,实验结果表明了方法的有效性和正确性.  相似文献   

16.
事件日志记录数量众多的事件,不仅包含与活动控制流相关的内容,还记录有关活动执行者的信息,即组织维度信息.控制流发现算法从事件日志中自动构建控制流过程模型,组织维度发现算法则构建社交网络模型.如果能合并两种维度,在同一个模型中进行展示,则能够提供更完整的过程组织视图,有助于更准确地对过程以及组织进行分析.因此,提出一种基于执行者过程树的双维度遗传过程挖掘方法(BdSm).一方面,使用Induc-tive Miner预挖掘以优化遗传挖掘算法初始种群,达到生成高质量的控制流模型的目的;另一方面提出日志中活动之间距离的度量方法,能有效度量活动在组织层面的相似度,同时使用执行者信息扩充控制流过程模型,基于执行者过程树生成双维度的过程模型.通过模拟日志以及4个公开事件日志集对所提方法进行验证,结果表明,在控制流维度,所提方法能够生成较高综合质量的过程模型,同时借助组织维度信息,还能够发现典型的工作模式及组织结构.  相似文献   

17.
针对传统工作流模型挖掘算法不考虑模型中重复任务的存在,导致挖掘出的模型精确度不高的问题,提出一种基于关系矩阵的重复任务识别方法。通过分析工作流执行日志得到所有事件的前驱后继关系,根据不同的模型结构进行事件重命名,再基于同类别重复事件之间的相似度对重复事件进行聚类得到最优识别结果。实验表明,该方法能正确有效地识别工作流日志中的重复任务,减少模型中的不可见任务,最终提高工作流模型挖掘方法的精确度和可理解性。  相似文献   

18.
日志中发生的低频次行为与挖掘的流程模型中某些不必要的结构相对应,而这些结构的出现会引起挖掘模型在适应度和精确度等指标上的下降。为解决这些结构对流程挖掘模型质量造成的影响,提出一种基于依赖关联度的噪声日志过滤方法。该方法首先根据日志中事件及其依赖关系的统计频率,定义了依赖关系的局部关联度和整体关联度,并将两者归一化为混合关联度来筛选出噪声日志。然后通过轨迹可达性分析去除日志中的噪声,以便最大程度地保留日志轨迹中记录的其他行为。与传统噪声日志过滤算法过滤掉包含噪声日志的整条日志轨迹不同,所提算法在移除噪声日志的同时最大程度地保留了原始日志中的其他非噪声日志。  相似文献   

19.
已有的过程挖掘方法通常以事件日志为输入,挖掘得到扁平过程模型,然而这些方法并不能很好地支持任务之间嵌套关系的识别和分层过程模型的挖掘。由此,提出一种从带有任务生命周期信息的事件日志中识别任务之间嵌套关系,进而挖掘分层业务过程模型的方法,挖掘得到的模型用分层Petri网来描述。在分层过程模型的基础上,给出了模型质量度量方法。为了提高所提方法的通用性和对事件日志中的噪声和低频行为的处理,定义了基本任务关系的频次和频率,并引入噪声阈值来过滤低频关系。所提方法均已在开源过程挖掘平台ProM工具中实现。基于仿真日志数据和真实日志数据,定量比较了所提方法与已有过程挖掘方法挖掘模型的质量,进一步验证了本文方法针对分层业务过程模型挖掘的优势。  相似文献   

20.
针对现有过程挖掘技术在解决成批处理工作流模型挖掘问题上存在的不足,研究了相应的过程挖掘方法。利用系统事件日志中活动实例的输入输出、开始与结束时间等数据,通过引入成批处理特征等概念来发现成批处理区及隐含的事件记录,并结合现有过程挖掘方法来挖掘成批处理工作流模型。该方法充分利用现有过程挖掘方法的优越性能,解决了支持成批处理工作流系统中的模型自动构建问题。通过仿真实验验证了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号