首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于NMFSC的文本聚类方法
引用本文:王永贵,高月.一种基于NMFSC的文本聚类方法[J].计算机系统应用,2011,20(9):78-81,156.
作者姓名:王永贵  高月
作者单位:辽宁工程技术大学软件学院,葫芦岛,125105
摘    要:通过分析文本的特征,提出了一种基于稀疏约束非负矩阵分解(NMFsc)的文本聚类新方法。该方法用NMFSC分解词.文本矩阵来降低特征空间的维度,并依照稀疏约束更好地控制稀疏度,然后利用簇中文本的相似性进一步细化簇。实验表明,与基于k-means的文本聚类方法和基于NMF的文本聚类方法相比,此方法具有较高的归一化互信息值(NMI),从而具有良好的聚类性能。

关 键 词:文本聚类  细化簇  非负矩阵分解  稀疏表示  归一化互信息值
收稿时间:2010/12/12 0:00:00
修稿时间:2011/4/10 0:00:00

Document Clustering Method Based on NMFSC
WANG Yong-Gui and GAO Yue.Document Clustering Method Based on NMFSC[J].Computer Systems& Applications,2011,20(9):78-81,156.
Authors:WANG Yong-Gui and GAO Yue
Affiliation:WANG Yong-Gui,GAO Yue(College of Software Engineering,Liaoning Technical University,Huludao 125105,China)
Abstract:Through analyzing the characteristics of the text,a novel text clustering approach based on Non-negative Matrix Factorization with sparseness constraint(NMFSC) is presented.The method uses NMFSC decomposing word-text matrix to reduce the dimension of the feature space,and better controls sparsity with sparseness constraint,and then further refines clusters by using the similarity of documents in clusters.Compared with text clustering method based on k-means and text clustering method based on NMF,the result...
Keywords:text clustering  refine clusters  non-negative matrix factorization  sparse representation  normalized mutual information  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号