首页 | 本学科首页   官方微博 | 高级检索  
     

基于免疫网络的k-means文档聚类算法研究
引用本文:陈曦,徐家宁,杨建雄. 基于免疫网络的k-means文档聚类算法研究[J]. 计算机工程与设计, 2008, 29(10): 2629-2631
作者姓名:陈曦  徐家宁  杨建雄
作者单位:长沙理工大学计算机与通信工程学院,湖南长沙,410076;长沙理工大学计算机与通信工程学院,湖南长沙,410076;长沙理工大学计算机与通信工程学院,湖南长沙,410076
基金项目:湖南省科技计划 , 湖南省教育厅资助项目
摘    要:提出了一种把人工免疫网络(aiNet)和k-means算法结合的文档聚类算法.先把文档集预处理成向量集表示,基于向量之间的余弦相似度,用aiNet算法对文档进行聚类,用得到的相似度矩阵初始化k-means的聚类中心,再用k-means算法对文档聚类.实验结果表明,该算法是可行的,并且能改善聚类质量.

关 键 词:聚类分析  文档聚类  人工免疫网络  向量空间模型  余弦相似度
文章编号:1000-7024(2008)10-2629-03
修稿时间:2007-06-11

Research on document clustering algorithm of k-means based on aiNet
CHEN Xi,XU Jia-ning,YANG Jian-xiong. Research on document clustering algorithm of k-means based on aiNet[J]. Computer Engineering and Design, 2008, 29(10): 2629-2631
Authors:CHEN Xi  XU Jia-ning  YANG Jian-xiong
Affiliation:CHEN Xi,XU Jia-ning,YANG Jian-xiong(College of Computer , Communication Engineering,Changsha University of Science , Technology,Changsha 410076,China)
Abstract:A document algorithm based on aiNet and k-means is proposed.Firstly,a set of documents is converted into a set of vectors.Based on cosine similarity between vectors,the aiNet algorithm is used to cluster document,and the similarity matrix is used to initialize the center points in the k-means algorithm,the k-means algorithm is used to cluster documents secondly.The experimental results in the end prove that new algorithm is feasible and improve the document clustering performance.
Keywords:clustering analysis  document clustering  artificial immune system  vector space model  cosine similarity  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号