首页 | 本学科首页   官方微博 | 高级检索  
     

数据挖掘中两种简单分类算法的比较
引用本文:王一夫,许鹏,杨小林,韩宇. 数据挖掘中两种简单分类算法的比较[J]. 长沙通信职业技术学院学报, 2010, 9(4): 22-25. DOI: 10.3969/j.issn.1671-9581.2010.04.006
作者姓名:王一夫  许鹏  杨小林  韩宇
作者单位:湖南师范大学数学与计算机科学学院,湖南,长沙,410081
基金项目:湖南省科技厅项目(2009GK3014); 湖南省教育厅项目(09c636)资助
摘    要:
分类是一类重要的数据挖掘问题,它的一般过程是先根据样本数据利用一定的分类算法得到分类规则,再依据该规则对新的数据进行类别的划分。文章详细介绍了两种简单但有效的分类方法:基于最小二乘法的线性分类器和k-最近邻分类器。通过对这两种分类器的比较,发现线性分类器计算简便、拟合具有低方差,适合处理类别之间相互重叠的区域比较小的数据。KNN分类器分类灵活,拟合偏差比较小,由于计算量比较大,该算法更适合于类别界限不是很明显,数据之间交叉或重叠比较多的数据集。

关 键 词:最小二乘  最近邻  分类

Comparison of two simple classification algorithm in data mining
WANG Yi-fu,XU Peng,YANG Xiao-lin,HAN Yu. Comparison of two simple classification algorithm in data mining[J]. Journal of Changsha Telecommunications and Technology Vocational, 2010, 9(4): 22-25. DOI: 10.3969/j.issn.1671-9581.2010.04.006
Authors:WANG Yi-fu  XU Peng  YANG Xiao-lin  HAN Yu
Affiliation:WANG Yi-fu,XU Peng,YANG Xiao-lin,HAN Yu(Mathematics , Computer Science College,Hu'nan Normal University,Changsha,Hu'nan China 410081)
Abstract:
Classification is an important question in data mining.Its general procedure is to obtain the classification rules according to the classification algorithm from the sample data firstly,then categorize the new data according to the classification rules.The author introduces two simple but effective classification algorithms in this paper: the linear classifier based on the least squares method and k-nearest neighbor classifier.Through comparison of these two classifiers,we draw the conclusion that the linea...
Keywords:least square  nearest neighbor  classification  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号