首页 | 本学科首页   官方微博 | 高级检索  
     

数据挖掘中的属性处理方法比较研究
引用本文:许俊.数据挖掘中的属性处理方法比较研究[J].福建电脑,2006(12):34-35.
作者姓名:许俊
作者单位:南京工程学院计算机工程系,江苏,南京,210000
摘    要:决策树是分类数据挖掘的重要方法。其中,经典ID3算法根据具有最大信息增益的属性对训练样本集进行分类,适用于离散型属性。C4.5算法延用了ID3算法的基本策略,增加了处理连续数值型属性的方法。本文在其基础上讨论了新的基于属性变换的离散化处理方法。该方法基于统计概率信息,依据概率属性的最佳分裂对应分裂连续属性,增加了决策树的分类精度。

关 键 词:决策树  信息增益  连续属性  概率属性
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号