首页 | 本学科首页   官方微博 | 高级检索  
     

基于潜在语义索引的中文文本聚类的研究
引用本文:马国俊,贠卫国. 基于潜在语义索引的中文文本聚类的研究[J]. 现代电子技术, 2005, 28(10): 58-59
作者姓名:马国俊  贠卫国
作者单位:西安建筑科技大学,信控学院,陕西,西安,710055
摘    要:讨论了中文文本聚类的现状以及存在的问题,介绍了向量空间模型,详细阐述了潜在语义索引理论以及采用该模型进行中文文本聚类的主要步骤,最后采用两种模型进行了实验对比,实验表明采用潜在语义索引模型可以取得更好的聚类效果。

关 键 词:文本聚类 潜在语义索引 向量空间模型 信息检索
文章编号:1004-373X(2005)10-058-02
修稿时间:2005-01-10

Researching of Chinese Text Clustering Based on Latent Semantic Index
Ma Guojun,YUN Weiguo. Researching of Chinese Text Clustering Based on Latent Semantic Index[J]. Modern Electronic Technique, 2005, 28(10): 58-59
Authors:Ma Guojun  YUN Weiguo
Abstract:This paper discusses the status quo and some problems of Chinese Text Clustering, introduces vector space model, expatiates the theory of Latent Semantic Index and the process of Chinese text clustering based on the model,finally compares the two models with an experiment,results of the experiment show that Latent Semantic Index can get better effect.
Keywords:text clustering  latent semantic index  vector space model  information index
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号