首页 | 本学科首页   官方微博 | 高级检索  
     

使用证据累积的文本聚类谱算法
引用本文:徐森,卢志茂,张春祥,顾国昌,张琦.使用证据累积的文本聚类谱算法[J].哈尔滨工程大学学报,2010,31(8).
作者姓名:徐森  卢志茂  张春祥  顾国昌  张琦
作者单位:1. 盐城工学院信息工程学院,江苏盐城224000;哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨150001
2. 盐城工学院信息工程学院,江苏盐城,224000
3. 哈尔滨理工大学计算机科学与技术学院,黑龙江哈尔滨,150001
基金项目:国家自然科学基金资助项目,高等学校博士学科点专项科研基金资助项目 
摘    要:针对谱聚类算法相似度函数设置困难问题,提出了一种使用证据累积的文本聚类谱算法.该算法使用超球K均值算法对文本集进行多次聚类,并将每次得到的划分结果作为判断2个文本是否应该放在一个簇中的证据,由此构建文本的相似度矩阵和正则化拉普拉斯矩阵.在TREC和Reuters文本集上进行了实验,验证了本文算法的有效性,它比层次聚类算法和CLUTO提供的K均值算法更加优越.

关 键 词:聚类分析  文本聚类  聚类谱  证据累积  超球K均值

A document clustering spectral algorithm that uses evidence accumulation
XU Sen,LU Zhi-mao,ZHANG Chun-xiang,GU Guo-chang,ZHANG Qi.A document clustering spectral algorithm that uses evidence accumulation[J].Journal of Harbin Engineering University,2010,31(8).
Authors:XU Sen  LU Zhi-mao  ZHANG Chun-xiang  GU Guo-chang  ZHANG Qi
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号