共查询到18条相似文献,搜索用时 218 毫秒
1.
为了在不完备的日志中挖掘含有多并发的三角形二度循环结构的过程模型,在扩展Alpha算法的基础上提出AlphaMatch算法。该算法可以在不包含重复行为序列的日志中,将两个活动匹配成三角形二度循环,并挖掘出含有多并发三角形二度循环的过程模型。首先,根据活动数量关系将构成三角形二度循环的活动分为两类;然后,再根据活动位置关系,使用三角形二度循环活动的首尾标记位置矩阵匹配这两类活动,并且给出足迹矩阵显示活动之间的关系;最后,在ProM平台上进行了大量仿真实验,从模型正确性、挖掘效率、拟合度和精确度四个角度验证了算法能有效挖掘含有多并发的三角形二度循环的Petri网模型。 相似文献
2.
现有过程挖掘算法依赖于“aba”模式来挖掘2度循环,而满足局部完备性的日志文件中不一定出现该模式.为此,本文扩展经典alpha算法,提出了αL+算法,用于从没有“aba”模式的日志文件中挖掘出2度循环.首先,建立任务间的次序向量矩阵,用于抽象2度循环结构的变体结构.然后,从全局视角,根据事件的出现次数及位置,来区分2度循环和并发关系.最后,提出紧邻度和回路抽象,以排除并发分支上同类型循环带来的干扰.实验表明,与现有挖掘算法相比,αL+算法能从具有“aba”模式或不具有“aba”模式的日志文件中挖出2度循环.此外,该算法实现且集成在开源框架ProM中. 相似文献
3.
瞿华 《计算机工程与应用》2012,48(15):16-20
对于不完备日志挖掘这一过程挖掘的难题,在传统α算法的基础上,提出了一种不完备日志的过程挖掘算法。该算法在α算法给出的并行关系定义的基础上,提出了一组隐含并行关系的推导规则,利用已知的任务关系推导出日志中缺失的隐含并行关系,在此基础上构造出过程的结构模型。实验结果证明,该算法对不完备日志的挖掘效果优于传统α系列算法。 相似文献
4.
通过分析当前工作流挖掘中存在的多种复杂结构并存的问题,基于α**算法中对重复任务处理的方法,提出一种能够发现工作流日志中包含循环、重复以及非自由选择等复杂结构的算法。该算法首先对α**算法中对重复任务处理的方法进行改进,进而对非自由选择结构进行分析,给出判定非自由选择任务的方法,并用Petri网进行建模;最后对本算法进行了初步实现并验证其可行性。 相似文献
5.
6.
7.
强循环、弱循环、跳、不可见任务等复杂结构是业务流程中常见的流程结构,从事件日志中挖掘这些复杂结构是亟待解决的问题。分析了强循环、弱循环、跳、不可见任务的特征并给出了它们的判定定理,在此基础上结合同步管理器模型提出了γ+算法,该算法克服了目前过程挖掘算法的限制,在挖掘流程结构的同时挖掘管理行为,能够处理强循环、弱循环、跳、不可见任务等复杂结构,实例分析表明了算法的有效性与可适用性。 相似文献
8.
9.
10.
为了解决软件过程数据因活动信息及案例属性的缺失而无法应用传统过程挖掘方法的问题,以软件过程数据为研究对象,提出了一种双层次的软件过程挖掘方法.在活动层,提出加权结构连接向量模型对过程日志进行向量化,通过平均活动熵来确定过程日志模糊聚类的结果,将聚类结果作为活动信息支持后续挖掘工作的开展;在过程层,以启发式关系度量为基础,针对非完全循环进行研究,提出了过程层单触发序列循环划分的日志完备性条件,并进一步给出了循环归属的度量方法.基于大量真实软件过程数据的实验结果表明了双层次的软件过程挖掘方法的可行性及正确性. 相似文献
11.
12.
任务间非确定选择平行关系是业务流程中一种普遍存在的流程逻辑关系,利用传统的工作流网建模这种逻辑关系会导致模型中出现重复任务,为过程挖掘带来困难。基于事件日志定义了非确定选择平行关系,结合同步管理器给出了判定非确定选择平行关系的定理以及γ算法。γ算法克服了目前挖掘算法的限制,挖掘流程结构的同时挖掘管理操作行为,加强了过程挖掘的可适用性。实例分析表明了算法的有效性。 相似文献
13.
广泛地从Web获取信息是信息时代的一个重要特征,借助数据挖掘的知识,从Web日志中发现用户的访问模式,可以帮助管理站点,更好地满足用户的要求,本文介绍了从原始的日志数据中发现用户访问模式的方法,提出了数据预处理的方法和一种新的用于挖掘的数据结构-序列访问树SAT,以及基于此结构的挖掘算法。 相似文献
14.
流程挖掘是流程管理和数据挖掘交叉领域中的一个研究热点.在实际业务环境中,流程执行的数据往往分散记录到不同的事件日志中,需要将这些事件日志融合成为单一事件日志文件,才能应用当前基于单一事件日志的流程挖掘技术.然而,由于流程日志间存在着执行实例的多对多匹配关系、融合所需信息可能缺失等问题,导致事件日志融合问题具有较高挑战性.本文对事件日志融合问题进行了形式化定义,指出该问题是一个搜索优化问题,并提出了一种基于混合人工免疫算法的事件日志融合方法:以启发式方法生成初始种群,人工免疫系统的克隆选择理论基础,通过免疫进化获得“最佳”的融合解,从而支持包含多对多的实例匹配关系的日志融合;考虑两个实例级别的因素:流程执行路径出现的频次和流程实例间的时间匹配关系,分别从“量”匹配和“时间”匹配两个维度来评价进化中的个体;通过设置免疫记忆库、引入模拟退火机制,保证新一代种群的多样性,减少进化早熟几率.实验结果表明,本文的方法能够实现多对多的实例匹配关系的事件日志融合的目标,相比随机方法生成初始种群,启发式方法能加快免疫进化的速度.文中还针对利用分布式技术提高事件日志融合性能,探讨了大规模事件日志的分布式融合中的数据划问题. 相似文献
15.
基于隐马尔可夫模型的兴趣迁移模式发现 总被引:17,自引:0,他引:17
Web挖掘的一个重要研究方向是发现用户的迁移模式。一般来说,用户的迁移具有某种目的性。这种目的性表现为用户对某种概念的兴趣。文中提出基于隐马尔可夫模型的兴趣迁移模式发现方法,用于发现这种带有某种兴趣的用户迁移模式,这种模式实质上是一种特殊的关联规则。在这种方法中,作者首先根据用户的访问记录定义一个隐马尔可夫模型,然后提出一种新的增量发现算法Increase_R用于发现兴趣迁移模式,同时给出了证明以说明该算法可以发现所有的兴趣迁移模式。 相似文献
16.
提出了一个基于数据挖掘的系统审计机制.该机制是基于Windows操作系统的,用于审计系统日志以及记录用户对系统所做的任何操作,从并数据挖掘中的相关算法中找出规律,发现攻击事件以及隐患事件.通过对Apriori算法进行深入研究,提出了综合划分数据及临时表的Apriori改进算法.比较分析表明,该机制有较好的效率和性能. 相似文献
17.
Web日志挖掘是将数据挖掘技术应用到Web服务器的日志中,发现Web用户的行为模式,以便进一步改善网站结构或为用户提供个性化的服务。文中探讨了Web日志挖掘中的用户识别算法,提出了一种多重约束条件的用户识别算法。 相似文献
18.
为了满足高效率的自动化生产需要,支持流程控制的工作流管理系统 的应用越来越广泛。流程挖掘可以使用事件日志等历史数据生成抽象流程模型,为工作流系统的部署提供有利条件。首先总结归纳了一种较通用的基于启发式优化算法的流程挖掘框架;然后依照该流程挖掘框架将禁忌搜索算法用于流程挖掘领域,针对禁忌搜索中程序初始化、邻域构建方法和禁忌表构造等几个关键问题进行了详细阐述和论证;最后将算法实现为ProM的插件并进行了对比实验。实验验证了该流程挖掘框架的正确性,表明了禁忌搜索流程挖掘方法对不同流程结构具有良好支持,对数据噪声具有较强的鲁棒性和更少的时间消耗。 相似文献