首页 | 本学科首页   官方微博 | 高级检索  
     

基于K-Medoids聚类的改进KNN文本分类算法
引用本文:罗贤锋,祝胜林,陈泽健,袁玉强.基于K-Medoids聚类的改进KNN文本分类算法[J].计算机工程与设计,2014(11):3864-3867,3937.
作者姓名:罗贤锋  祝胜林  陈泽健  袁玉强
作者单位:华南农业大学信息学院
摘    要:为有效提高传统KNN算法(K最近邻算法)在海量数据的分类效率,分析传统KNN算法的分类过程,提出基于K-Medoids聚类的改进KNN算法。利用K-Medoids算法对文本训练集进行聚类,把文本训练集分成相似度较高的簇;根据待分类文本与簇的相对位置,对文本训练集进行裁剪,解决传统KNN算法在文本训练集过大时速度慢的问题。分析与实验结果表明,该裁剪方法能够合理有效地裁剪文本训练集,提高了KNN算法的运行效率和分类能力。

关 键 词:文本分类  隶属度  K最近邻  样本裁剪  K-Medoids聚类
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号