首页 | 本学科首页   官方微博 | 高级检索  
     

基于非负矩阵分解的中文文本主题分类
引用本文:张磊,冯晓森,项学智.基于非负矩阵分解的中文文本主题分类[J].计算机工程,2009,35(13):26-27,5.
作者姓名:张磊  冯晓森  项学智
作者单位:哈尔滨工程大学信息与通信工程学院,哈尔滨,150001
基金项目:国家自然科学基金资助项目"基于Lattice的汉语语音主题分类方法研究",国家自然科学基金资助项目"基于子词网格的汉语语音检索关键技术研究" 
摘    要:提出基于非负矩阵分解(NMF)的中文文本主题分类方法,应用NMF算法分解词.文本矩阵获取词之间的相关性,有效地解决同义词、多义词的影响。实验结果表明,与基于奇异值分解的潜在语义索引方法相比,该方法计算速度快、占用存储空间较少。在潜在语义数据降低较大的情况下,NMF方法具有更好的分类精度。

关 键 词:主题分类  非负矩阵分解  潜在语义索引
修稿时间: 

Topic Classification of Chinese Document Based on NMF
ZHANG Lei,FENG Xiao-sen,XIANG Xue-zhi.Topic Classification of Chinese Document Based on NMF[J].Computer Engineering,2009,35(13):26-27,5.
Authors:ZHANG Lei  FENG Xiao-sen  XIANG Xue-zhi
Affiliation:Information and Communication Engineering College;Harbin Engineering University;Harbin 150001
Abstract:This paper presents a method based on Non-negative Matrix Factorization(NMF) for Chinese document topic classification.According to NMF, the term-document matrix is decomposed to reveal the relationship between terms.This method solves the problem of synonym and polysemy effectively.Compared with Latent Semantic Indexing(LSI) based on Singular Value Decomposition(SVD), experimental results show that this method has faster computing speed and less memory occupancy.It can improve classification precision when...
Keywords:topic classification  Non-negative Matrix Factorization(NMF)  Latent Semantic Indexing(LSI)
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号