首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
为了在不完备的日志中挖掘含有多并发的三角形二度循环结构的过程模型,在扩展Alpha算法的基础上提出AlphaMatch算法。该算法可以在不包含重复行为序列的日志中,将两个活动匹配成三角形二度循环,并挖掘出含有多并发三角形二度循环的过程模型。首先,根据活动数量关系将构成三角形二度循环的活动分为两类;然后,再根据活动位置关系,使用三角形二度循环活动的首尾标记位置矩阵匹配这两类活动,并且给出足迹矩阵显示活动之间的关系;最后,在ProM平台上进行了大量仿真实验,从模型正确性、挖掘效率、拟合度和精确度四个角度验证了算法能有效挖掘含有多并发的三角形二度循环的Petri网模型。  相似文献   

2.
林雷蕾  周华  代飞  朱锐  李彤 《软件学报》2018,29(11):3278-3294
现有过程挖掘算法依赖于“aba”模式来挖掘2度循环,而满足局部完备性的日志文件中不一定出现该模式.为此,本文扩展经典alpha算法,提出了αL+算法,用于从没有“aba”模式的日志文件中挖掘出2度循环.首先,建立任务间的次序向量矩阵,用于抽象2度循环结构的变体结构.然后,从全局视角,根据事件的出现次数及位置,来区分2度循环和并发关系.最后,提出紧邻度和回路抽象,以排除并发分支上同类型循环带来的干扰.实验表明,与现有挖掘算法相比,αL+算法能从具有“aba”模式或不具有“aba”模式的日志文件中挖出2度循环.此外,该算法实现且集成在开源框架ProM中.  相似文献   

3.
对于不完备日志挖掘这一过程挖掘的难题,在传统α算法的基础上,提出了一种不完备日志的过程挖掘算法。该算法在α算法给出的并行关系定义的基础上,提出了一组隐含并行关系的推导规则,利用已知的任务关系推导出日志中缺失的隐含并行关系,在此基础上构造出过程的结构模型。实验结果证明,该算法对不完备日志的挖掘效果优于传统α系列算法。  相似文献   

4.
通过分析当前工作流挖掘中存在的多种复杂结构并存的问题,基于α**算法中对重复任务处理的方法,提出一种能够发现工作流日志中包含循环、重复以及非自由选择等复杂结构的算法。该算法首先对α**算法中对重复任务处理的方法进行改进,进而对非自由选择结构进行分析,给出判定非自由选择任务的方法,并用Petri网进行建模;最后对本算法进行了初步实现并验证其可行性。  相似文献   

5.
过程挖掘对于部署新的商业流程以及审计、分析和改进已有的流程是非常有帮助的。在商业流程系统日志中,同名任务和重复任务是大量存在的。现有的挖掘算法都不能很好地区分,这导致在过程挖掘的结果中往往会产生不准确的流程模型。为了提高过程挖掘的准确性,提出了一种改进方法,它不仅能够挖掘日志中的循环结构、非自由选择结构等复杂结构,还能够挖掘日志中的同名任务和重复任务。  相似文献   

6.
为了提高流程挖掘的准确性和抗噪性,针对目前流程挖掘的基本结构有限、抗噪能力弱、计算耗时长等问题,提出了一种基于相邻事件概率统计的流程挖掘方法。该方法基于挖掘规则,仅需做一次日志遍历和矩阵的简单运算,就可生成挖掘的流程模型。与α算法和启发式算法的实验验证结果表明,该算法不仅能够挖掘顺序、选择、并行、短循环、递归等流程基本结构,而且具有计算复杂度低、抗噪能力强等优势。  相似文献   

7.
黄红梅  章云 《计算机应用》2008,28(12):3235-3239
强循环、弱循环、跳、不可见任务等复杂结构是业务流程中常见的流程结构,从事件日志中挖掘这些复杂结构是亟待解决的问题。分析了强循环、弱循环、跳、不可见任务的特征并给出了它们的判定定理,在此基础上结合同步管理器模型提出了γ+算法,该算法克服了目前过程挖掘算法的限制,在挖掘流程结构的同时挖掘管理行为,能够处理强循环、弱循环、跳、不可见任务等复杂结构,实例分析表明了算法的有效性与可适用性。  相似文献   

8.
过程挖掘中一种能发现重复任务的扩展α算法   总被引:2,自引:0,他引:2  
李嘉菲  刘大有  杨博 《计算机学报》2007,30(8):1436-1445
基于α-算法,提出了能发现工作流日志中重复任务的过程挖掘算法α**,并给出了正确性证明.该算法先通过机器学习的方法分析重复任务的性质,给出了判定重复任务的定理并证明了其正确性;然后使用这些定理判断并标识出日志中的所有重复任务;最后,采用α-算法从标识后的日志中提取出工作流网,并对其进行调整得到包含重复任务的工作流网模型.通过模拟实验验证了算法的有效性,与现有的重复任务挖掘方法的实验结果相比证实了文中提出的方法具有更高的效率.  相似文献   

9.
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的访问模式.数据预处理和日志挖掘算法是Web日志挖掘中的关键技术.文章就此进行了深入的研究,在已知用户访问路径的基础上,提出一种基于MFP算法的日志挖掘算法,并结合实例具体介绍了该算法的执行过程.  相似文献   

10.
朱锐  李彤  莫启  何臻力  于倩  王一荃 《软件学报》2018,29(11):3455-3483
为了解决软件过程数据因活动信息及案例属性的缺失而无法应用传统过程挖掘方法的问题,以软件过程数据为研究对象,提出了一种双层次的软件过程挖掘方法.在活动层,提出加权结构连接向量模型对过程日志进行向量化,通过平均活动熵来确定过程日志模糊聚类的结果,将聚类结果作为活动信息支持后续挖掘工作的开展;在过程层,以启发式关系度量为基础,针对非完全循环进行研究,提出了过程层单触发序列循环划分的日志完备性条件,并进一步给出了循环归属的度量方法.基于大量真实软件过程数据的实验结果表明了双层次的软件过程挖掘方法的可行性及正确性.  相似文献   

11.
为了从工作流日志中挖掘组织结构设置和执行者之间的交互信息,分析了工作流日志中的活动执行者的信息,并引入多种距离公制用以刻画日志中活动执行者间的各种关系度的强弱,提出了组织结构的三种挖掘方法,即默认挖掘、基于活动相似度的挖掘和基于过程实例相似度的挖掘。通过以上方法对工作流日志进行组织结构挖掘得到组织网络,组织网络能够客观地反映出参与工作流程的组织实体并正确表示出组织结构。通过一个挖掘实例对挖掘过程进行了验证和说明。  相似文献   

12.
黄红梅  章云 《计算机应用》2008,28(11):2922-2925
任务间非确定选择平行关系是业务流程中一种普遍存在的流程逻辑关系,利用传统的工作流网建模这种逻辑关系会导致模型中出现重复任务,为过程挖掘带来困难。基于事件日志定义了非确定选择平行关系,结合同步管理器给出了判定非确定选择平行关系的定理以及γ算法。γ算法克服了目前挖掘算法的限制,挖掘流程结构的同时挖掘管理操作行为,加强了过程挖掘的可适用性。实例分析表明了算法的有效性。  相似文献   

13.
广泛地从Web获取信息是信息时代的一个重要特征,借助数据挖掘的知识,从Web日志中发现用户的访问模式,可以帮助管理站点,更好地满足用户的要求,本文介绍了从原始的日志数据中发现用户访问模式的方法,提出了数据预处理的方法和一种新的用于挖掘的数据结构-序列访问树SAT,以及基于此结构的挖掘算法。  相似文献   

14.
徐杨  袁峰  林琪  汤德佑  李东 《软件学报》2018,29(2):396-416
流程挖掘是流程管理和数据挖掘交叉领域中的一个研究热点.在实际业务环境中,流程执行的数据往往分散记录到不同的事件日志中,需要将这些事件日志融合成为单一事件日志文件,才能应用当前基于单一事件日志的流程挖掘技术.然而,由于流程日志间存在着执行实例的多对多匹配关系、融合所需信息可能缺失等问题,导致事件日志融合问题具有较高挑战性.本文对事件日志融合问题进行了形式化定义,指出该问题是一个搜索优化问题,并提出了一种基于混合人工免疫算法的事件日志融合方法:以启发式方法生成初始种群,人工免疫系统的克隆选择理论基础,通过免疫进化获得“最佳”的融合解,从而支持包含多对多的实例匹配关系的日志融合;考虑两个实例级别的因素:流程执行路径出现的频次和流程实例间的时间匹配关系,分别从“量”匹配和“时间”匹配两个维度来评价进化中的个体;通过设置免疫记忆库、引入模拟退火机制,保证新一代种群的多样性,减少进化早熟几率.实验结果表明,本文的方法能够实现多对多的实例匹配关系的事件日志融合的目标,相比随机方法生成初始种群,启发式方法能加快免疫进化的速度.文中还针对利用分布式技术提高事件日志融合性能,探讨了大规模事件日志的分布式融合中的数据划问题.  相似文献   

15.
基于隐马尔可夫模型的兴趣迁移模式发现   总被引:17,自引:0,他引:17  
王实  高文 《计算机学报》2001,24(2):152-157
Web挖掘的一个重要研究方向是发现用户的迁移模式。一般来说,用户的迁移具有某种目的性。这种目的性表现为用户对某种概念的兴趣。文中提出基于隐马尔可夫模型的兴趣迁移模式发现方法,用于发现这种带有某种兴趣的用户迁移模式,这种模式实质上是一种特殊的关联规则。在这种方法中,作者首先根据用户的访问记录定义一个隐马尔可夫模型,然后提出一种新的增量发现算法Increase_R用于发现兴趣迁移模式,同时给出了证明以说明该算法可以发现所有的兴趣迁移模式。  相似文献   

16.
黄珍  叶水生  吴霄 《计算机工程与设计》2007,28(21):5108-5109,5114
提出了一个基于数据挖掘的系统审计机制.该机制是基于Windows操作系统的,用于审计系统日志以及记录用户对系统所做的任何操作,从并数据挖掘中的相关算法中找出规律,发现攻击事件以及隐患事件.通过对Apriori算法进行深入研究,提出了综合划分数据及临时表的Apriori改进算法.比较分析表明,该机制有较好的效率和性能.  相似文献   

17.
Web日志挖掘是将数据挖掘技术应用到Web服务器的日志中,发现Web用户的行为模式,以便进一步改善网站结构或为用户提供个性化的服务。文中探讨了Web日志挖掘中的用户识别算法,提出了一种多重约束条件的用户识别算法。  相似文献   

18.
白雪骢  朱焱 《计算机科学》2016,43(4):214-218, 240
为了满足高效率的自动化生产需要,支持流程控制的工作流管理系统 的应用越来越广泛。流程挖掘可以使用事件日志等历史数据生成抽象流程模型,为工作流系统的部署提供有利条件。首先总结归纳了一种较通用的基于启发式优化算法的流程挖掘框架;然后依照该流程挖掘框架将禁忌搜索算法用于流程挖掘领域,针对禁忌搜索中程序初始化、邻域构建方法和禁忌表构造等几个关键问题进行了详细阐述和论证;最后将算法实现为ProM的插件并进行了对比实验。实验验证了该流程挖掘框架的正确性,表明了禁忌搜索流程挖掘方法对不同流程结构具有良好支持,对数据噪声具有较强的鲁棒性和更少的时间消耗。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号