首页 | 本学科首页   官方微博 | 高级检索  
     

加权模糊C均值文本聚类算法研究及仿真
引用本文:谭营军,李翠霞.加权模糊C均值文本聚类算法研究及仿真[J].计算机仿真,2011,28(5).
作者姓名:谭营军  李翠霞
作者单位:1. 河南职业技术学院信息工程系,河南,郑州,450046
2. 郑州大学软件技术学院,河南,郑州,450002
摘    要:研究文本聚类问题.传统的文本聚类算法存在着假设各特征词对聚类结果影响相同,聚类准确率较低的缺陷.还有一些算法通过加权的方法,能赋予重要特征词较大的权重,却造成了算法时间复杂度的增加.为解决上述问题,提出了一种新的属性加权模糊C均值文本聚类算法.算法能在迭代过程中标注出每一特征词的权重,却不影响算法的执行效率.使得类内距离之和较小的属性,权值较大;反之则权值较小.经多次仿真证明,提出的文本聚类算法在运算速度、准确率和标注不同属性的重要程度方面都有一定的优势.为文档自动文摘、数字图书馆服务和文档集合自动整理等系统的设计提供了可靠的依据.

关 键 词:聚类  文本聚类  属性加权  聚类算法

Study and Simulation of Text Clustering Using Attribute Weighted Fuzzy C-means Algorithm
TAN Ying-jun,LI Cui-xia.Study and Simulation of Text Clustering Using Attribute Weighted Fuzzy C-means Algorithm[J].Computer Simulation,2011,28(5).
Authors:TAN Ying-jun  LI Cui-xia
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号