首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
过程挖掘中漂移检测的目的是通过检测日志的变化来断定模型是否发生了改变,然而现有方法存在抽取特征量大、检测延迟及无法准确定位变化区域的局限。针对突发漂移检测提出一种基于完备性的漂移检测算法。首先,将突发漂移检测转换为日志中局部完备性计算问题;然后,利用切比雪夫不等式推断完备性表达式;进一步,通过可选参数的窗口来训练完备性初始值,避免选择及并发结构的干扰;最后,定义了切割操作对漂移之前的完备值进行清除,进而对日志进行迭代检测。通过多组模型数据进行了实验评估,并与已有方法进行对比,验证了所提方法的有效性。  相似文献   

2.
日志中发生的低频次行为与挖掘的流程模型中某些不必要的结构相对应,而这些结构的出现会引起挖掘模型在适应度和精确度等指标上的下降。为解决这些结构对流程挖掘模型质量造成的影响,提出一种基于依赖关联度的噪声日志过滤方法。该方法首先根据日志中事件及其依赖关系的统计频率,定义了依赖关系的局部关联度和整体关联度,并将两者归一化为混合关联度来筛选出噪声日志。然后通过轨迹可达性分析去除日志中的噪声,以便最大程度地保留日志轨迹中记录的其他行为。与传统噪声日志过滤算法过滤掉包含噪声日志的整条日志轨迹不同,所提算法在移除噪声日志的同时最大程度地保留了原始日志中的其他非噪声日志。  相似文献   

3.
为了进行流程发现,提出一种基于流程案例簇的任务关系挖掘方法.该方法首先将基本案例按照特征向量分为多个案例簇,根据基本案例的任务轨迹对案例簇中任务间的依赖关系进行挖掘;然后给出了基于循环基元的循环结构建模和挖掘方法,最终可以从事件日志导出流程中完整的任务依赖关系以及存在的循环结构.所提方法能正确处理任务依赖关系随案例属性取值不同而变化的情况.只要日志完备,基于挖掘到的任务关系和循环结构就能得到一个与原流程行为等价的流程模型.  相似文献   

4.
鉴于理想的完备日志很难被获取,针对特定次序关系完备的日志已成为评估挖掘算法表现的重要数据来源。提出了一种新颖的针对特定次序关系完备日志生成算法,基于完全有限前缀计算轨迹,使日志生成过程可控。扩展了完备日志的生成算法,使日志能够针对Δw关系和w关系完备,从而满足α谱系挖掘算法对日志的完备性要求。同时提出了一种日志生成算法的评估框架,并对日志生成算法进行评估。  相似文献   

5.
为解决从日志中挖掘业务系统行为变化的问题,提出一种基于不完备日志和日志联合发生关系的挖掘方法。在业务系统原始参考模型未知的情况下,利用系统不含隐变迁的不完备日志,得到日志中活动的联合发生关系;通过提取活动发生的不变集,挖掘日志中的删除(delete)、插入(Insert)和移动(Move)变化操作,实现日志驱动下的系统行为变化挖掘。通过ProM仿真验证了所提方法可以实现系统行为变化的日志挖掘,实验结果表明了该方法的有效性和正确性。  相似文献   

6.
过程发现的目的是基于记录在事件日志中的业务过程的执行数据发现过程模型,由于一些原因导致过程模型中可能会出现隐变迁,而这些隐变迁的执行又不出现在事件日志中,因此隐变迁的挖掘是过程挖掘的难点之一.已有隐变迁挖掘方法对解决并发结构中的隐变迁存在不足,且可能出现一些冗余的隐变迁.基于此,提出一种带隐变迁的过程模型挖掘新方法,首先基于日志分析活动的基本行为关系,通过并发交叉关系和循环交叉关系来发现and网关类型和循环类型的隐变迁.然后,根据活动基于日志的最小和最大行为距离寻找可能存在skip类型隐变迁的活动对,进一步分析该活动对基于模型和并发结构的最小行为距离,以发现skip类型的隐变迁,并不断优化初始模型,最终得到带多种类型隐变迁的过程模型.实验结果表明,该方法能正确地发现多类型隐变迁,相对现有隐变迁挖掘方法,所提方法能显著降低模型中冗余隐变迁的个数,同时在不降低模型精确度的前提下,有效地改善了模型的适合度.  相似文献   

7.
业务系统在演进过程中不可避免地引入变化因素,如何将演进中的变化因素对系统模型进行修复具有实际意义.现有模型修复主要针对原始参考模型和完备日志进行,存在原始参考模型未知和不完备日志的局限性.因此,提出基于不完备日志的变化检测方法,在系统原始模型未知的情形下,利用活动的比较矩阵(行为轮廓矩阵)描述事件日志的Delete、Insert和Move变化操作,从而发现原始事件日志同系统实际日志的局部变化偏差域,根据日志偏差域对原始日志发现的模型进行修复,提出7个实现模型修复的算法.最后,通过ProM工具对所提方法进行了仿真和实验,实验结果表明了方法的有效性和正确性.  相似文献   

8.
鉴于已有的过程挖掘方法在发现循环结构和隐藏行为上具有一定的局限性,提出一种基于后继关系的行为块挖掘算法。依据日志建立后继关系矩阵,分析了矩阵中变迁间对应的值,从而可以发现所有最小行为块和隐藏的行为关系,包括循环行为块;利用组合原理对带有重复变迁的最小行为块进行组合,得到结构行为块;组合所有行为块得到初始模型,利用已发现的隐藏行为关系修正初始模型得到更加精确的过程模型。通过实例分析和ProM的仿真实验验证了所提方法的可行性。  相似文献   

9.
为了使包含活动数目较多的事件日志有效挖掘流程模型,提出基于行为特征网的流程模型分解挖掘方法,基于活动日志确定各活动间的行为足迹关系,推得相应的行为矩阵;结合行为矩阵计算行为关系图,从而产生活动聚类;通过现存挖掘算法过滤子日志挖掘子网,并对子网添加接口库所形成子网行为特征网;在行为特征网的基础上,运用合成网的观点合成整网,以此挖掘流程模型。最后通过仿真分析验证了该分解挖掘方法的有效性。  相似文献   

10.
过程模型描述的行为与事件日志记录的行为之间存在很多偏差,为了使模型可以重演日志中记录的行为,需要对现有模型进行修正。对于存在循环并发结构的模型,现有修正方法得到的模型结构比较复杂,且不能正确地描述活动之间的关系,导致模型精确度较低。因此,针对循环并发结构,提出一种基于逻辑Petri网的动态模型修正方法。基于过程树,提出并发变迁集概念,通过连续日志动作的标识库所集与相应变迁前集之间的关系,进行偏差定位,并根据逻辑Petri网对模型进行动态修正。最后,通过实例验证了所提修正方法的正确性和有效性。  相似文献   

11.
低频行为的挖掘是业务流程管理的重要内容之一,区分有效低频和噪音在业务流程优化中显得尤为重要。已有挖掘方法多是从数据属性研究低频行为,较少根据不同模块间的行为属性来分析低频行为,由此提出基于Petri网的业务流程低频行为的挖掘与优化方法。首先,通过用流程树切的直接流图表示日志的行为关系,并与初始模型做匹配,发现所有的低频序列;然后,计算日志与模型的行为距离向量,基于行为紧密度区分有效低频日志和噪音日志,优化事件日志;其次,利用不包含噪音序列的事件日志通过融合交互模块网与特征网,挖掘得到一个优化的业务流程模型;最后,通过具体的实例分析和仿真实验验证了该方法的有效性。  相似文献   

12.
为解决事件日志中含有循环任务、重复任务和同一任务的过程挖掘问题,进一步优化企业建模方法,改进了α算法,提出了τ算法.该算法重新定义了任务之间的关联关系,提出启发式判定规则,识别出事件日志中所包含的循环任务、重复任务和同一任务;然后对事件日志进行挖掘,提取出工作流网,并还原挖掘预处理阶段重命名的重复任务和删除的单循环任务,从而得到最终的工作流模型.最后,通过实例验证了τ算法的正确性.  相似文献   

13.
关系数据库作为企业管理数据的主要工具,在信息系统运行过程中记录下大量事件日志。传统的流程挖掘技术主要处理用文件存储的XES格式日志数据,每次挖掘任务都需要手工从数据库导出最新日志文件,整个过程操作十分繁琐,且无法充分利用关系数据库强大的数据处理能力。针对该问题,研究了面向关系型日志数据的流程挖掘策略与算法。针对关系数据库中储存的大规模事件日志,利用关系数据库的快速排序能力,提出一种挖掘流程任务之间紧邻关系的近似线性挖掘算法,提高了关系型事件日志的流程挖掘效率。该算法对业务数据库侵入性小,具有较好的通用性。该算法已在开源软件平台ProM上实现,通过基于大规模事件日志的对比实验验证了该方法的高效性。  相似文献   

14.
针对传统工作流模型挖掘算法不考虑模型中重复任务的存在,导致挖掘出的模型精确度不高的问题,提出一种基于关系矩阵的重复任务识别方法。通过分析工作流执行日志得到所有事件的前驱后继关系,根据不同的模型结构进行事件重命名,再基于同类别重复事件之间的相似度对重复事件进行聚类得到最优识别结果。实验表明,该方法能正确有效地识别工作流日志中的重复任务,减少模型中的不可见任务,最终提高工作流模型挖掘方法的精确度和可理解性。  相似文献   

15.
流程相似度计算是业务流程管理不可缺少的任务,为了更准确地计算流程之间的相似性,本文提出一种将模型结构与日志行为综合考虑的流程相似度计算方法,先将流程模型结构转化为业务流程图,根据日志中的行为信息对业务流程图的有向边进行加权,进而构建加权业务流程图。加权业务流程图同时包含了流程模型和流程日志中的行为信息,弥补了单一基于流程模型计算流程相似度时的不足。在此基础上给出了加权业务流程图编辑距离的定义,从而得到一种新的流程相似度计算方法。通过实验与已有基于流程模型结构和模型行为相似度计算方法进行对比,证明了所提方法的有效性。所提方法已在开源流程挖掘平台ProM工具中实现。  相似文献   

16.
针对需要优化的业务流程,提出基于数据库日志之间关联规则挖掘的解决方法。通过对数据库日志向量化使其变为可几何度量的流程日志,并从角度和距离两方面综合分析数据库日志的相似性。采用基于相似性的关联分析算法获得用户行为模式以指导节点的分裂或合并,实现节点结构重塑从而优化流程。该方法还通过多阶迭代的方式评价关联分析的准确性,使算法可以在合理范围内执行。  相似文献   

17.
针对日志数据海量性、繁杂性特征,提出一种基于大数据日志智能分析模型的日志审计分析平台。从网络安全和系统运维的需求出发,提出基于多元日志分析的智能安全感知算法,拥有日志切割提取、可视化多维分析等核心功能,采用B/S架构,通过JDBC及SSH采集提取网络、中间件、数据库、设备等机器的实时日志数据,通过前端WEB界面进行分析与展示,实现统一管理、隐患分析、故障定位、安全预警等分析功能,收集多元日志数据并充分利用IT设备基础结构日志和安全日志进行数据分析和挖掘,给运维人员提供价值最大化的日志数据信息。  相似文献   

18.
基于用户兴趣的Web日志挖掘算法   总被引:1,自引:0,他引:1  
为有效地从Web日志中挖掘出用户访问模式,在分析用户访问行为的基础上,充分考虑用户在路径选择及在页面浏览中表现出的必趣,提出了路径选择兴趣度以及页面浏览兴趣度的概念.设计了路径选择兴趣矩阵和页面浏览兴趣矩阵.并基于两个矩阵,设计了浏览兴趣路径挖掘算法.该算法先通过对两个矩阵进行路径兴趣度计算得到所有的浏览兴趣子路径,然后进行子路径合并生成浏览兴趣路径.实验表明了该算法的有效性.  相似文献   

19.
为了挖掘流程变迁过程中各时段的流程模型,提高流程挖掘结果的准确性,提出了一种基于时变滑窗的自适应流程挖掘方法。在分析了业务流程变化特点的基础上,定义了时变滑窗、相邻事件概率依赖关系等相关概念,研究了以流程实例时间为变量,来控制调整滑窗大小和滑动进度的日志更新规则;基于相邻事件概率依赖关系,给出了流程模型挖掘规则和一种新的流程挖掘算法,根据流程挖掘结果的变化频度和流程实例日志流的到达速率推动时变滑窗持续变更,进而挖掘出整个流程日志中各时段的流程模型。实验结果表明,与已有的流程挖掘方法相比,所提方法具有良好的自适应性和抗噪性。  相似文献   

20.
目前的挖掘算法单纯考虑了用户的访问频度,而忽略了用户对访问路径的兴趣度。本文通过分析目前用户偏爱路径挖掘算法存在的问题,结合事物聚类算法,将雅克比系数与最长公共路径系数相乘,得到更准确地用户相似集,并基于一个三元组模型构造以页面兴趣度为元素值的网站浏览数据矩阵,采用改进的挖掘算法计算用户偏爱度和访问兴趣度,降低访问页面闲置及链接等因素对数据挖掘的影响;实验结果表明,该算法针对Web日志海量数据进行挖掘,具有较高的效率和准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号