首页 | 本学科首页   官方微博 | 高级检索  
     

基于免疫网络和SOM的文本聚类算法研究
引用本文:张立文,徐家宁,李进,李孝闯.基于免疫网络和SOM的文本聚类算法研究[J].计算机应用与软件,2010,27(5):118-120,124.
作者姓名:张立文  徐家宁  李进  李孝闯
作者单位:1. 河南科技大学电子信息工程学院,河南,洛阳,471003
2. 河南科技大学招生就业处,河南,洛阳,471003
3. 太原科技大学计算机与科学技术学院,山西,太原,030024
基金项目:河南省教育厅科研项目(2008A510007)
摘    要:文本聚类的核心问题是找到一种优化的聚类算法对文本向量进行聚类,是典型的高维数据聚类,提出一种基于自组织神经网络SOM和人工免疫网络aiNet的两阶段文本聚类算法TCBSA。新算法先用SOM神经网络进行聚类,把高维的文本数据映射到二维的平面上,然后再用aiNet对文本聚类。该方法利用SOM神经网络对高维数据降维的优点,克服了人工免疫网络对高维数据的聚类能力差的缺点。仿真实验结果表明该文本聚类算法不仅是可行的,而且具有一定的自适应能力和较好的聚类效果。

关 键 词:文本聚类  相似度  向量空间模型  人工免疫网络  自组织神经网络  

RESEARCH ON TEXT CLUSTERING ALGORITHM BASED ON ARTIFICIAL IMMUNE NETWORK AND SOM
Zhang Liwen,Xu Jianing,Li Jin,Li Xiaochuang.RESEARCH ON TEXT CLUSTERING ALGORITHM BASED ON ARTIFICIAL IMMUNE NETWORK AND SOM[J].Computer Applications and Software,2010,27(5):118-120,124.
Authors:Zhang Liwen  Xu Jianing  Li Jin  Li Xiaochuang
Affiliation:Electronic and Information Engineering College/a>;Henan University of Science and Technology/a>;Luoyang 471003/a>;Henan/a>;China;Enrollment and Employment Consultation Section/a>;China;School of Computer Science and Technology/a>;Taiyuan University of Science and Technology/a>;Taiyuan 030024/a>;Shanxi/a>;China
Abstract:The core of text clustering is to find an optimised clustering algorithm to cluster the text vectors.Text clustering is a typical high dimensional data clustering.In this thesis we put forward a two-phase text clustering algorithm TCBSA based on self-organising neural network SOM and artificial immune network aiNet.First,the SOM neural network is used by the new algorithm for clustering and is used to map the high dimensional text data to 2-dimensional plane,in the second phase the aiNet is then used to clu...
Keywords:Text clustering Similarity Vector special model Artificial immune network Self-organising neural network  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号