首页 | 本学科首页   官方微博 | 高级检索  
     

将KFCM算法应用于源代码挖掘的研究
引用本文:孟美芝,张阳. 将KFCM算法应用于源代码挖掘的研究[J]. 计算机工程与设计, 2010, 31(10)
作者姓名:孟美芝  张阳
作者单位:西北农林科技大学,信息工程学院,陕西,杨凌,712100;西北农林科技大学,信息工程学院,陕西,杨凌,712100
摘    要:为解决软件工程数据量大、属性多且多为离散型数据的特点,提高软件工程数据的挖掘效率,寻求更快速、高效的聚类算法,提出了将基于核函数的模糊聚类算法应用于源代码挖掘;同时采用TF-IDF方法对离散型文本数据进行处理,解决了核模糊聚类算法不能对文本数据直接进行聚类的问题.将遗传算法与KFCM算法相结合,克服了KFCM只能求解局部极小值的问题.实验结果表明,改进的KFCM算法对软件工程数据的挖掘有很好的聚类效果,且有较高的效率.

关 键 词:源代码挖掘  特征空间  核函数  遗传算法  目标函数

Research on applying KFCM algorithm to source code mining
MENG Mei-zhi,ZHANG Yang. Research on applying KFCM algorithm to source code mining[J]. Computer Engineering and Design, 2010, 31(10)
Authors:MENG Mei-zhi  ZHANG Yang
Affiliation:MENG Mei-zhi,ZHANG Yang(College of Information Engineering,Northwest Agriculture , Forestry University,Yangling 712100,China)
Abstract:It provides that Kernelized fuzzy C-means uses on the research of source code mining for solving the significant number of quantities,multiple attributes and most of the attributes are discrete data and improving the efficiency of mining software engineering data,also seeking faster and more effective cluster approaches;meanwhile,to solve the problem that the KFCM algorithm can not cluster text data directly,the TF-IDF method is used to process the discrete text data.Then we integrate KFCM and genetic algor...
Keywords:source code mining  feature space  kernel function  genetic algorithm  object function  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号