首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于信息熵建立决策树的算法
引用本文:朱宇光,黄树成.一种基于信息熵建立决策树的算法[J].常州工学院学报,2006,19(1):55-59.
作者姓名:朱宇光  黄树成
作者单位:常州工学院计算机信息工程学院,江苏,常州213002
摘    要:信息论给出了信息的数学本质,提出了用热力学中的熵来度量信息量的大小。分类是一个重要的数据挖掘问题,在训练数据集上建立分类树的关键是如何选择决策树每一个内部结点的测试属性。传统的决策树建立算法利用信息论中熵的概念选择属性,具有偏向于取值较多属性的缺点。本文分析了信息论中有关熵的一些基本概念和含义,讨论了它们在挖掘分类树中的应用,利用互信息设计了一个建立分类树的算法,克服了传统算法的缺点。

关 键 词:信息论    数据挖掘  决策树
文章编号:1671-0436(2006)01-0055-05
收稿时间:2005-09-16
修稿时间:2005年9月16日

An Algorithms to Construct Decision Tree Based on Information Entropy
ZHU Yu-guang,HUANG Shu-cheng.An Algorithms to Construct Decision Tree Based on Information Entropy[J].Journal of Changzhou Institute of Technology,2006,19(1):55-59.
Authors:ZHU Yu-guang  HUANG Shu-cheng
Abstract:Information theory provides us what mathematic essence of information is and borrows Entropy concept from thermodynamics to quantify information.Classification plays a big role in data mining.The key of constructing classifier tree based on training set is how to identify the test attribute for each internal node of the tree.Traditional algorithm of decision tree utilizes Entropy to address the issue,which trend to bias towards attributes with more different values.In this paper,we examine some concepts relating to Entropy and discuss their applications in classification tree problem of data mining, and design a decision tree based on mutual information,which eliminates the disadvantages with the old algorithms.
Keywords:information theory  entropy  data mining  decision trees  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号