首页 | 本学科首页   官方微博 | 高级检索  
     

基于潜在语义分析和自组织特征映射神经网络的文本聚类研究
引用本文:王剑锋,麻丽娜,李新叶,乔冬. 基于潜在语义分析和自组织特征映射神经网络的文本聚类研究[J]. 计算机与现代化, 2010, 0(2): 77-79. DOI: 10.3969/j.issn.1006-2475.2010.02.021
作者姓名:王剑锋  麻丽娜  李新叶  乔冬
作者单位:华北电力大学科技学院,河北,保定,071051
基金项目:华北电力大学青年教师科研基金资助项目(200811036)
摘    要:基于潜在语义分析和自组织特征映射神经网络(LSA—SOM),本文提出一种文本聚类方法。采用潜在语义分析的理论表示文本特征向量,以体现特征词的语义关系并实现特征向量的降维。利用SOM网络算法进行无监督自组织学习,并通过不断调节网络节点间的权向量来实现文本聚类。该方法不必预先给定聚类个数,可以在任意合适的位置生成一个新的类,克服传统方法中文本种类需要预先给定的缺点。

关 键 词:自组织特征映射神经网络  潜在语义分析  文本聚类

Research on Text Clustering Based on LSA-SOM
WANG Jian-feng,MA Li-na,LI Xin-ye,QIAO Dong. Research on Text Clustering Based on LSA-SOM[J]. Computer and Modernization, 2010, 0(2): 77-79. DOI: 10.3969/j.issn.1006-2475.2010.02.021
Authors:WANG Jian-feng  MA Li-na  LI Xin-ye  QIAO Dong
Affiliation:Technology College/a>;North China Electric Power University/a>;Baoding 071051/a>;China
Abstract:A text clustering method based on LSA-SOM is proposed.The text eigenvector is represented by Latent Semantic Analysis(LSA),which embodies the semantic relation of the eigen words,and realizes the dimension reduction of the eigenvector.SOM network algorithm is used to non-supervised self-organizing study,and the weight vectors of neural network are continuously adjusted in order to achieving the cluster targets.It requires no predefined number of clusters and can create a new species of text in any right pos...
Keywords:self-organizing feature map  Latent Semantic Analysis  text clustering  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号