首页 | 本学科首页   官方微博 | 高级检索  
     

文本聚类集成问题中的谱算法
作者姓名:徐森  卢志茂  顾国昌
作者单位:哈尔滨工程大学计算机科学与技术学院 150001
摘    要:

聚类集成中的关键问题是如何根据不同的聚类成员组合为更好的聚类结果.引入谱聚类算法解决该问题,提出了基于相似度矩阵的谱算法(SMSA),但该算法高昂的计算代价使其不适合大规模文本集.进一步研究了谱聚类算法的特性,对超边的相似度矩阵进行谱分析,提出了基于超边相似度矩阵的元聚类算法(HSM-MCLA).真实文本数据集的实验结果表明:SMSA 和HSM-MCLA 比其他基于图划分的集成算法更优越;HSM-MCLA 可获得与SMSA 相当的结果,而计算需求却明显低于SMSA.



关 键 词:

聚类分析  聚类集成  谱聚类  文本聚类  矩阵近似

收稿时间:2008-08-25
修稿时间:2008-12-22
点击此处可从《控制与决策》浏览原始摘要信息
点击此处可从《控制与决策》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号