摘 要: | 为解决传统过程挖掘算法在处理蕴含复杂结构的海量日志时的低效低质问题,提出一种支持复杂结构的混成过程挖掘方法。该方法首先将事件日志转化为具有发生次数的直接后继图,以支持活动间基本关系的判定;通过过程树对已发现的两两活动间的基本关系进行抽象与合并,进而对日志进行更新,反复迭代直到整个日志中的所有具有基本关系的活动被全部发现。若待发现模型由基本块组成,则挖掘结果为基于块的过程模型;若待发现模型包含复杂结构,则通过混成使用基于区域的方法对复杂结构进行发现。最终利用活动重构操作对挖掘结果中已抽象为过程树的部分进行细化,从而获得最终结果。为了进一步提升挖掘效率,还提出并行化的发现与重构方法。大量基于真实数据的实验结果表明,该方法的挖掘效率和挖掘精确度达到了较好的水平。
|