首页 | 本学科首页   官方微博 | 高级检索  
     

基于K-means算法改进的短文本聚类研究与实现
作者单位:;1.华北计算技术研究所
摘    要:文中讨论在文本类目数未知的情况下,如何对数据量过少的短文本进行有效聚类的问题。短文本的特点是每一份样本文章数据少,数据稀疏,用常规的聚类方法进行文本聚类不能取得很好的效果。文中提出了一种基于K-means的改进算法,提出一种简单降维方式和新的判别样本点距离的方法,经实验验证,文中改进算法比原K-means算法有更高的准确性。

关 键 词:短文本  K-means  聚类  无监督

Research and implementation of short text clustering based on improved K-means algorithm
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号