首页 | 本学科首页   官方微博 | 高级检索  
     

决策树算法的研究及优化
引用本文:王静红,王熙照,邵艳华,王伍伶.决策树算法的研究及优化[J].微机发展,2004,14(9):30-32.
作者姓名:王静红  王熙照  邵艳华  王伍伶
作者单位:河北大学数学与计算机学院,河北大学数学与计算机学院,河北大学数学与计算机学院,河北师范大学计算机教学部 河北保定071002河北师范大学计算机教学部河北石家庄050091,河北保定071002,河北保定071002,河北石家庄050091
摘    要:决策树算法是数据挖掘中的一个比较活跃的研究领域,是对分类问题进行深入分析的一种方法,但构造最优决策树是一个NP困难问题。文中首先介绍了ID3算法的基本思想,然后讨论了决策树算法中的难点问题,针对ID3算法中所存在的不足,提出了一种利用优化法的思想来改进信息增益的算法,并且与ID3算法进行了实验对比。通过实验表明,这种方法从树的规模和分类精度都优于许多决策树算法,使决策效率明显提高。

关 键 词:数据挖掘  决策树  
文章编号:1005-3751(2004)09-0030-03
修稿时间:2003年12月17

Research and Optimization of Decision Tree Algorithm
WANG Jing-hong.Research and Optimization of Decision Tree Algorithm[J].Microcomputer Development,2004,14(9):30-32.
Authors:WANG Jing-hong
Affiliation:WANG Jing-hong~
Abstract:Decision tree is one of heated fields in data mning in recent years,and it is a widely-used solution for classification problems. But the design of the optimal decision tree has been proved to be NP-hard. This paper first introduces the main thoughts of algorithm of ID3, then discusses some difficult problems of selecting value on division in decision tree,and puts forward an algorithm to improve the gain of information, and makes a contrast to ID3 by experiments. Results demonstrated this algorithm outdoes the others in the size of decision tree and classification accuracy.
Keywords:data mining  decision tree  entropy
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号