首页 | 本学科首页   官方微博 | 高级检索  
     

一种适用于短消息文本的聚类算法
引用本文:吴勇,徐峰.一种适用于短消息文本的聚类算法[J].计算机与现代化,2012(2):31-34.
作者姓名:吴勇  徐峰
作者单位:湖南机电职业技术学院信息工程系,湖南长沙410151
基金项目:湖南省教育厅资助科研项目(09C1163)
摘    要:针对短消息文本聚类,设计基于频繁词集和Ant-Tree的混合聚类方法。该算法利用基于频繁词集聚类算法处理文本数据的效率优势,生成初始聚簇,计算轮廓系数消除重叠文档,在此基础上再通过Ant-Tree算法继续精化,最终得到高质量的结果输出。而且聚类结果保留了描述信息和树状层级结构,提供了更广阔的应用。

关 键 词:频繁词集  Ant-Tree算法  轮廓系数  短消息  聚类

A Text Clustering Algorithm for Short Message
WU Yong,XU Feng.A Text Clustering Algorithm for Short Message[J].Computer and Modernization,2012(2):31-34.
Authors:WU Yong  XU Feng
Affiliation:(Department of Information Engineering,Hunan Mechanical & Electrical Polytechnic,Changsha 410151,China)
Abstract:
Keywords:frequent term-sets  Ant-Tree algorithm  silhouette coefficient  short message  clustering
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号