首页 | 本学科首页   官方微博 | 高级检索  
     

基于属性值的ID3算法改进
引用本文:孙爱东,朱梅阶,涂淑琴.基于属性值的ID3算法改进[J].计算机工程与设计,2008,29(12).
作者姓名:孙爱东  朱梅阶  涂淑琴
作者单位:华南农业大学,信息学院,广东,广州,510642;华南农业大学,信息学院,广东,广州,510642;华南农业大学,信息学院,广东,广州,510642
基金项目:华南农业大学校科研和教改项目
摘    要:ID3算法是数据挖掘中经典的决策树分类算法.针对ID3算法所存在的属性取值偏向问题及只时较小的数据集有效的缺点提出改进.当训练样本各属性的取值个数相差较大的情况下,在计算划分标准时引入了属性取值个数N,在一定程度上克服了ID3算法易偏向于取值较多的属性这一缺陷,得到了结构更简洁的、较为理想的决策树.采用先剪枝的方法实现改进,设定一个阈值避免决策树的完全生长,在保持分类准确率的同时,大大地提高了算法的速度.实验结果表明,改进后的算法(AVID3)对许多数据集比传统ID3算法更有效.

关 键 词:决策树  ID3算法  剪枝  属性值  

Improved ID3 algorithm based on attribute values
SUN Ai-dong,ZHU Mei-jie,TU Shu-qin.Improved ID3 algorithm based on attribute values[J].Computer Engineering and Design,2008,29(12).
Authors:SUN Ai-dong  ZHU Mei-jie  TU Shu-qin
Affiliation:SUN Ai-dong,ZHU Mei-jie,TU Shu-qin(College of Informatics,South China Agricultural University,Guangzhou 510642,China)
Abstract:ID3 is a classical decision tree induction algorithm in data mining.It has the preference bias in selecting attributes with multiple values and is related to the number of training examples.A new approach to solving these drawbacks is given.At first,the threshold of attributes value's number is assigned to optimize the decision tree in calculating the entropy.At the meantime,a tree pruning method is implemented by adopting another threshold to reduce the error rate of the fully expanded tree.Experimental re...
Keywords:decision tree  ID3 algorithm  tree pruning  attribute value  entropy  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号