首页 | 本学科首页   官方微博 | 高级检索  
     

基于聚类改进的KNN文本分类算法
引用本文:周庆平,谭长庚.基于聚类改进的KNN文本分类算法[J].计算机应用研究,2016,33(11).
作者姓名:周庆平  谭长庚
作者单位:中南大学,中南大学
基金项目:国家自然科学基金资助项目;国家教育部博士点基金
摘    要:传统的KNN文本分类算法是一种无监督的、无参数的、简单的、较流行的且容易实现的分类算法,但是KNN算法在处理文本分类的过程中需要不断的计算待测文本与样本的相似度,当文本数量更大时,算法的效率就会更差。为了提高传统KNN算法在文本分类中的效率,提出一种基于聚类的改进KNN算法。算法开始之前采用改进统计量方法进行文本特征提取,再依据聚类方法将文本集聚类成几个簇,最后利用改进的KNN方法对簇类进行文本分类。实验对比与分析结果表明,该方法可以较好的进行文本分类。

关 键 词:文本分类  KNN  聚类化  训练集
收稿时间:2015/7/10 0:00:00
修稿时间:2016/9/13 0:00:00

Improved KNN text classification algorithm based on clustering
zhouqingping and tanchanggeng.Improved KNN text classification algorithm based on clustering[J].Application Research of Computers,2016,33(11).
Authors:zhouqingping and tanchanggeng
Affiliation:Central South University,
Abstract:
Keywords:text classification  knn  clustering  training set
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号