首页 | 本学科首页   官方微博 | 高级检索  
     

基于模糊粒度计算的K-means文本聚类算法研究
作者姓名:张霞  王素贞  尹怡欣  赵海龙
作者单位:1. 河北经贸大学计算机中心,石家庄,050061;北京科技大学信息工程学院,北京,100083
2. 河北经贸大学计算机中心,石家庄,050061
3. 北京科技大学信息工程学院,北京,100083
基金项目:国家自然科学基金项目(60374032);;河北省教育厅科研计划项目(2009116)资助
摘    要:传统的K-means算法对初始聚类中心非常敏感,聚类结果随不同的初始输入而波动,算法的稳定性下降。针对这个问题,提出了一种优化初始聚类中心的新算法:在数据对象的模糊粒度空间上给定一个归一化的距离函数,用此函数对所有距离小于粒度d_λ的数据对象进行初始聚类,对初始聚类簇计算其中心,得到一组优化的聚类初始值。实验对比证明,新算法有效地消除了传统K-means算法对初始输入的敏感性,提高了算法的稳定性和准确率。

关 键 词:模糊  粒度  K-means  文本聚类  归一化距离函数  
收稿时间:2009-03-09
修稿时间:2009-07-20
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号