首页 | 本学科首页   官方微博 | 高级检索  
     

使用谱聚类算法解决文本聚类集成问题
引用本文:徐 森,卢志茂,顾国昌.使用谱聚类算法解决文本聚类集成问题[J].通信学报,2010,31(6):58-66.
作者姓名:徐 森  卢志茂  顾国昌
作者单位:1. 哈尔滨工程大学模式识别与自然计算研究室,黑龙江,哈尔滨,150001;盐城工学院,信息工程学院,江苏,盐城,224000
2. 哈尔滨工程大学模式识别与自然计算研究室,黑龙江,哈尔滨,150001
基金项目:国家自然科学基金资助项目,高等学校博士学科点专项科研基金资助项目 
摘    要:采用2个不同的谱聚类算法解决文本聚类集成问题.为使算法可扩展到大规模应用,基于代数变换,通过求解小规模矩阵的特征值分解问题避免了大规模矩阵的特征值分解问题,有效降低了2个谱聚类算法的计算复杂度.分别从矩阵扰动理论和图上的随机游走的角度解释了2个算法的有效性.在真实文本集上的实验结果表明:提出的代数变换方法是有效的,该方法可以有效提高谱聚类算法的运行效率;该聚类集成谱算法比其他常见的聚类集成算法更优越、更高效,可以有效解决文本聚类集成问题.

关 键 词:聚类集成  文本聚类  谱聚类  矩阵扰动理论  图上的随机游动

Spectral clustering algorithms for document cluster ensemble problem
XU Sen,LU Zhi-mao,GU Guo-chang.Spectral clustering algorithms for document cluster ensemble problem[J].Journal on Communications,2010,31(6):58-66.
Authors:XU Sen  LU Zhi-mao  GU Guo-chang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
点击此处可从《通信学报》浏览原始摘要信息
点击此处可从《通信学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号