首页 | 本学科首页   官方微博 | 高级检索  
     

文本聚类集成问题中的谱算法
引用本文:徐森,卢志茂,顾国昌.文本聚类集成问题中的谱算法[J].控制与决策,2009,24(8).
作者姓名:徐森  卢志茂  顾国昌
作者单位:1. 哈尔滨工程大学,计算机科学与技术学院,哈尔滨,150001
2. 哈尔滨工程大学,信息与通信工程学院,哈尔滨,150001
基金项目:国家自然科学基金项目,高等学校博士学科点专项科研基金项目 
摘    要:聚类集成中的关键问题是如何根据不同的聚类成员组合为更好的聚类结果.引入谱聚类算法解决该问题,提出了基于相似度矩阵的谱算法(SMSA),但该算法高昂的计算代价使其不适合大规模文本集.进一步研究了谱聚类算法的特性,对超边的相似度矩阵进行谱分析.提出了基于超边相似度矩阵的元聚类算法(HSM-MCLA).真实文本数据集的实验结果表明:SMSA和HSM-MCLA比其他基于图划分的集成算法更优越;HSM-MCLA可获得与SMSA相当的结果,而计算需求却明显低于SMSA.

关 键 词:聚类分析  聚类集成  谱聚类  文本聚类  矩阵近似

Spectral algorithms in document cluster ensemble
XU Sen,LU Zhi-mao,GU Guo-chang.Spectral algorithms in document cluster ensemble[J].Control and Decision,2009,24(8).
Authors:XU Sen  LU Zhi-mao  GU Guo-chang
Affiliation:a.College of Computer Science and Technology;b.College of Information and Communication Engineering;Harbin Engineering University;Harbin 150001;China.
Abstract:A critical problem in cluster ensemble is how to combine multiple clusterers to yield a superior result.Spectral clustering is brought forth into solving this problem and similarity matrix spectral algorithm(SMSA) is proposed.Since the computational cost of SMSA is too high for large document datasets,the charactiristic of spectral clustering algorithm is further investigated.The hyperedges' similarity matrix are spectral analysed and hyperedges similarity matrix-based meta clustering algorithm(HSM-MCLA) is...
Keywords:Clustering analysis  Cluster ensemble  Spectral clustering  Document clustering  Matrix approximation  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号