基于聚类的加速k-近邻分类方法 SPEEDING K-NN CLASSIFICATION METHOD BASED ON CLUSTERING期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于聚类的加速k-近邻分类方法

作者单位：	;1.山西财经大学应用数学学院

摘要：	实际生活中,经常会遇到大规模数据的分类问题,传统k-近邻k-NN(k-Nearest Neighbor)分类方法需要遍历整个训练样本集,因此分类效率较低,无法处理具有大规模训练集的分类任务。针对这个问题,提出一种基于聚类的加速k-NN分类方法 C_kNN(Speeding k-NN Classification Method Based on Clustering)。该方法首先对训练样本进行聚类,得到初始聚类结果,并计算每个类的聚类中心,选择与聚类中心相似度最高的训练样本构成新的训练样本集,然后针对每个测试样本,计算新训练样本集中与其相似度最高的k个样本,并选择该k个近邻样本中最多的类别标签作为该测试样本的预测模式类别。实验结果表明,C_k-NN分类方法在保持较高分类精度的同时大幅度提高模型的分类效率。
关键词：	k-近邻分类聚类相似度训练样本集 C_k-NN算法
SPEEDING K-NN CLASSIFICATION METHOD BASED ON CLUSTERING

Abstract:

Keywords:
本文献已被万方数据等数据库收录！