数据挖掘中的属性处理方法比较研究 |
| |
引用本文: | 许俊.数据挖掘中的属性处理方法比较研究[J].福建电脑,2006(12):34-35. |
| |
作者姓名: | 许俊 |
| |
作者单位: | 南京工程学院计算机工程系,江苏,南京,210000 |
| |
摘 要: | 决策树是分类数据挖掘的重要方法。其中,经典ID3算法根据具有最大信息增益的属性对训练样本集进行分类,适用于离散型属性。C4.5算法延用了ID3算法的基本策略,增加了处理连续数值型属性的方法。本文在其基础上讨论了新的基于属性变换的离散化处理方法。该方法基于统计概率信息,依据概率属性的最佳分裂对应分裂连续属性,增加了决策树的分类精度。
|
关 键 词: | 决策树 信息增益 连续属性 概率属性 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|