基于K-means算法改进的短文本聚类研究与实现 |
| |
作者单位: | ;1.华北计算技术研究所 |
| |
摘 要: | 文中讨论在文本类目数未知的情况下,如何对数据量过少的短文本进行有效聚类的问题。短文本的特点是每一份样本文章数据少,数据稀疏,用常规的聚类方法进行文本聚类不能取得很好的效果。文中提出了一种基于K-means的改进算法,提出一种简单降维方式和新的判别样本点距离的方法,经实验验证,文中改进算法比原K-means算法有更高的准确性。
|
关 键 词: | 短文本 K-means 聚类 无监督 |
Research and implementation of short text clustering based on improved K-means algorithm |
| |
Abstract: | |
| |
Keywords: | |
|
|