首页 | 本学科首页   官方微博 | 高级检索  
     

基于NMF的文本聚类方法
引用本文:黄钢石,陆建江,张亚非.基于NMF的文本聚类方法[J].计算机工程,2004,30(11):113-114,176.
作者姓名:黄钢石  陆建江  张亚非
作者单位:1. 解放军理工大学通信工程学院,南京,210007
2. 解放军理工大学通信工程学院,南京,210007;东南大学计算机科学与工程系,南京,210096
基金项目:国家自然科学基金资助项目(60073012),国家自然科学基金重点资助项目(69931040)
摘    要:提出一种基于非负矩阵分解的文本聚类方法。该方法利用NMF分解项-文本矩阵来降低特征空间维数,并得到文本向量在概念空间上的表示,在此基础上应用聚类算法。实验表明,基于NMF的文本聚类方法能够提高文本聚类精度。

关 键 词:文本聚类  非负矩阵分解  球形的k-均值算法  自然语言处理
文章编号:1000-3428(2004)11-0113-02

Text Clustering Method Based on Non-negative Matrix Factorization
HUANG Gangshi,LU Jianjiang,ZHANG Yafei.Text Clustering Method Based on Non-negative Matrix Factorization[J].Computer Engineering,2004,30(11):113-114,176.
Authors:HUANG Gangshi  LU Jianjiang    ZHANG Yafei
Affiliation:HUANG Gangshi1,LU Jianjiang1,2,ZHANG Yafei1
Abstract:A new text clustering approach based on non-negative matrix factorization is presented. The method applies non-negative matrix factorization to dimensionality reduction of the term space, represents original text vectors in new concept space and clusters it with clustering algorithm. The results of experiment show that the algorithm can improve the clustering precision.
Keywords:Text clustering  Non-negative matrix factorization  Sphericalk-means algorithm  Natural language processing  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号