首页 | 本学科首页   官方微博 | 高级检索  
     

数据驱动的双层次软件过程挖掘方法
引用本文:朱锐,李彤,莫启,何臻力,于倩,王一荃. 数据驱动的双层次软件过程挖掘方法[J]. 软件学报, 2018, 29(11): 3455-3483
作者姓名:朱锐  李彤  莫启  何臻力  于倩  王一荃
作者单位:云南大学 软件学院, 云南 昆明 650091;云南省软件工程重点实验室(云南大学), 云南 昆明 650091,云南大学 软件学院, 云南 昆明 650091;云南省软件工程重点实验室(云南大学), 云南 昆明 650091,云南大学 软件学院, 云南 昆明 650091,云南大学 软件学院, 云南 昆明 650091,云南大学 软件学院, 云南 昆明 650091,云南大学 软件学院, 云南 昆明 650091
基金项目:国家自然科学基金(61662085,61862065);云南省教育厅科学研究基金(2017ZZX227);云南大学数据驱动的软件工程省科技创新团队项目(2017HC012);阿里巴巴青年学者支持计划
摘    要:为了解决软件过程数据因活动信息及案例属性的缺失而无法应用传统过程挖掘方法的问题,以软件过程数据为研究对象,提出了一种双层次的软件过程挖掘方法.在活动层,提出加权结构连接向量模型对过程日志进行向量化,通过平均活动熵来确定过程日志模糊聚类的结果,将聚类结果作为活动信息支持后续挖掘工作的开展;在过程层,以启发式关系度量为基础,针对非完全循环进行研究,提出了过程层单触发序列循环划分的日志完备性条件,并进一步给出了循环归属的度量方法.基于大量真实软件过程数据的实验结果表明了双层次的软件过程挖掘方法的可行性及正确性.

关 键 词:软件过程数据  软件过程挖掘  模糊聚类  启发式关系度量
收稿时间:2017-01-06
修稿时间:2017-04-14

Data-Driven Bilayer Software Process Mining
ZHU Rui,LI Tong,MO Qi,HE Zhen-Li,YU Qian and WANG Yi-Quan. Data-Driven Bilayer Software Process Mining[J]. Journal of Software, 2018, 29(11): 3455-3483
Authors:ZHU Rui  LI Tong  MO Qi  HE Zhen-Li  YU Qian  WANG Yi-Quan
Affiliation:School of Software, Yunnan University, Kunming 650091, China;Key Laboratory in Software Engineering of Yunnan Province(Yunnan University), Kunming 650091, China,School of Software, Yunnan University, Kunming 650091, China;Key Laboratory in Software Engineering of Yunnan Province(Yunnan University), Kunming 650091, China,School of Software, Yunnan University, Kunming 650091, China,School of Software, Yunnan University, Kunming 650091, China,School of Software, Yunnan University, Kunming 650091, China and School of Software, Yunnan University, Kunming 650091, China
Abstract:To address the issue of difficulty in applying the traditional process mining on software process data due to the deficiency of activity and case attribute, this paper focus on the software process data and proposes a bilayer software process mining approach. In the mining activity layer, a weighted structured linked vector mode is proposed to vectorize the process log. The result of fuzzy clustering, which can be regarded as activity information, is determined by the average activity entropy. In the process layer, based on the heuristic relation metrics, this paper studies the non-complete cycle situation and presents the single firing sequence of loop dividing condition of log completeness, and then proposes a method to measure the affiliation of loop. The real-world data sets are used to show the effectiveness and correctness of the proposed bilayer software process mining.
Keywords:software process data  software process mining  fuzzy clustering  heuristic relation metrics
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号