首页 | 本学科首页   官方微博 | 高级检索  
     

基于轨迹聚类种群的遗传过程混成挖掘算法
引用本文:汤雅惠,朱锐,李彤,南峰涛,郑明,马自飞.基于轨迹聚类种群的遗传过程混成挖掘算法[J].计算机集成制造系统,2020,26(6):1510-1524.
作者姓名:汤雅惠  朱锐  李彤  南峰涛  郑明  马自飞
作者单位:云南大学 信息学院,云南 昆明 650500;云南省软件工程重点实验室,云南 昆明 650091;云南大学 软件学院,云南 昆明 650091;云南省软件工程重点实验室,云南 昆明 650091;云南农业大学 大数据学院,云南 昆明 650201;云南大学 软件学院,云南 昆明 650091
基金项目:云南大学研究生科研创新项目;教育厅科学研究项目;云南大学东陆中青年骨干教师培养计划资助项目;云南大学数据驱动的软件工程省科技创新团队资助项目;国家自然科学基金;云南省自然科学基金
摘    要:遗传过程挖掘算法以模型质量引导模型的发现,在挖掘模型的同时不断修正挖掘算法的执行,因此相比于其他挖掘算法,更容易生成高质量的过程模型。但由于其迭代发现的特性,对于大型日志,挖掘效率往往较低且生成模型质量不高。针对以上问题,提出一种基于轨迹聚类种群的遗传过程混成挖掘算法(GMTC)。该算法一方面通过轨迹聚类划分事件日志,简化挖掘环境,再使用归纳挖掘算法对事件日志进行预挖掘,为遗传挖掘算法准备高质初始种群;另一方面优化遗传算子,使用对齐日志得到的模型偏差信息指导突变操作,使得突变操作由随机变为有向,从而有效地提高种群的综合质量,使遗传挖掘算法加快收敛。基于过程日志生成器生成模拟日志、某市政府建筑许可申请过程的真实日志以及6个公开数据集的实验结果表明:基于轨迹聚类种群的遗传过程混成挖掘算法相较于其他挖掘算法不但在挖掘效率方面有较大提升,而且挖掘得到的模型质量也能够达到较高的水平。

关 键 词:过程挖掘  归纳挖掘算法  轨迹聚类  遗传过程挖掘算法
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号