首页 | 本学科首页   官方微博 | 高级检索  
     

基于初始中心迭代收敛的文本聚类方法
引用本文:刘金岭,刘国香,杨凤霞.基于初始中心迭代收敛的文本聚类方法[J].计算机工程与科学,2012,34(6):153-157.
作者姓名:刘金岭  刘国香  杨凤霞
作者单位:1. 淮阴工学院计算机工程学院,江苏淮安,223003
2. 沧州师范学院计算机系,河北沧州,061001
基金项目:河北省科技支撑计划资助项目,淮安科技计划资助项目,淮阴工学院重点基金资助项目
摘    要:利用两三次的K-Means迭代得到初始簇的中心,选择一组具有良好区分度的方向构建IMIC坐标系,在该坐标系下,构造出各坐标轴的重新标度函数用以提高聚类决策的有效性。算法IMIC经过多次迭代,最后收敛到最终解。IMIC算法的时间复杂度与K-Means保持在同一量级上。实验结果表明,IMIC算法有较好的聚类质量。

关 键 词:迭代收敛  文本  聚类

A Text Clustering Algorithm for Iteration Convergence Based on Initial Centers
LIU Jin-ling , LIU Guo-xiang , YANG Feng-xia.A Text Clustering Algorithm for Iteration Convergence Based on Initial Centers[J].Computer Engineering & Science,2012,34(6):153-157.
Authors:LIU Jin-ling  LIU Guo-xiang  YANG Feng-xia
Affiliation:1.School of Computer Engineering,Huaiyin Institute of Technology,Huai’an 223003;2.Department of Computer,Cangzhou Normal University,Cangzhou 061001,China)
Abstract:Using K-Means iterative twice K-Means iterative to get an initial cluster center,in the text clustering process,a set of discriminative directions are chosen to construct the IMIC coordinate,each axis is constructed to re-scaling function in order to improve the effectiveness of cluster policy,according to the distribution characteristics of the initial clusters.The IMIC iterative algorithm converges to the final solution.The time complexity of IMIC remains the same as K-Means by using a K-Means-like iteration strategy.The experimental results show that the IMIC algorithm has better clustering quality.
Keywords:iteration convergence  text  clustering
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号