基于模糊粒度计算的K-means文本聚类算法研究 |
| |
作者姓名: | 张霞 王素贞 尹怡欣 赵海龙 |
| |
作者单位: | 1. 河北经贸大学计算机中心,石家庄,050061;北京科技大学信息工程学院,北京,100083 2. 河北经贸大学计算机中心,石家庄,050061 3. 北京科技大学信息工程学院,北京,100083 |
| |
基金项目: | 国家自然科学基金项目(60374032);;河北省教育厅科研计划项目(2009116)资助 |
| |
摘 要: | 传统的K-means算法对初始聚类中心非常敏感,聚类结果随不同的初始输入而波动,算法的稳定性下降。针对这个问题,提出了一种优化初始聚类中心的新算法:在数据对象的模糊粒度空间上给定一个归一化的距离函数,用此函数对所有距离小于粒度d_λ的数据对象进行初始聚类,对初始聚类簇计算其中心,得到一组优化的聚类初始值。实验对比证明,新算法有效地消除了传统K-means算法对初始输入的敏感性,提高了算法的稳定性和准确率。
|
关 键 词: | 模糊 粒度 K-means 文本聚类 归一化距离函数 |
收稿时间: | 2009-03-09 |
修稿时间: | 2009-07-20 |
本文献已被 CNKI 万方数据 等数据库收录! |
|