首页 | 本学科首页   官方微博 | 高级检索  
     

K-最近邻分类技术的改进算法
引用本文:王晓晔, 王正欧. K-最近邻分类技术的改进算法[J]. 电子与信息学报, 2005, 27(3): 487-491.
作者姓名:王晓晔  王正欧
作者单位:天津大学系统工程研究所,天津,300072;河北工业大学自动化系358#,天津,300130;天津大学系统工程研究所,天津,300072
基金项目:国家自然科学基金;河北省教育厅科研项目
摘    要:该文提出了一种改进的K-最近邻分类算法。该算法首先将训练事例集中的每一类样本进行聚类,既减小了训练事例集的数据量,又去除了孤立点,大大提高了算法的快速性和预测精度,从而使该算法适用于海量数据集的情况。同时,在算法中根据每个属性对分类贡献的大小,采用神经网络计算其权重,将这些属性权重用在最近邻计算中,从而提高了算法的分类精度。在几个标准数据库和实际数据库上的实验结果表明,该算法适合于对复杂而数据量比较大的数据库进行分类。

关 键 词:K-最近邻   聚类   权值调整   分类
文章编号:1009-5896(2005)03-0487-05
收稿时间:2003-11-13
修稿时间:2003-11-13

An Improved K-Nearest Neighbor Algorithm
Wang Xiao-ye, Wang Zheng-ou. An Improved K-Nearest Neighbor Algorithm[J]. Journal of Electronics & Information Technology, 2005, 27(3): 487-491.
Authors:WANG Xiao-ye  Wang Zheng-ou
Affiliation:Institute of Systems Engineering Tianjin University Tianjin 300072 China;Automation Department Hebei University of Technology Tianjin 300130 China
Abstract:This paper presents a improved K.-NN algorithm. The CURE clustering is carried out to select the subset of the training set. It can reduce the volume of the training set and omit the outlier. Therefore it can lead both to computational efficiency and to higher classification accuracy. In the algorithm, the weights of each feature are learned using neural network. The feature weights are used in the nearest measure computation such that the important features contribute more in the nearest measure. Experiments on several UCI databases and practical data sets show the efficiency of the algorithm.
Keywords:K-nearest neighbor   Cluster   Weight adjustment   Classification
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《电子与信息学报》浏览原始摘要信息
点击此处可从《电子与信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号