一种基于属性相关的C4.5决策树改进算法 |
| |
引用本文: | 魏浩,丁要军.一种基于属性相关的C4.5决策树改进算法[J].中北大学学报,2014(4):402-406. |
| |
作者姓名: | 魏浩 丁要军 |
| |
作者单位: | 咸阳师范学院信息工程学院 |
| |
摘 要: | 针对在C4.5决策树构造过程中,测试属性选择未考虑属性之间影响的缺点,提出了一种改进的C4.5决策算法.该算法使用一个属性与其他属性的平均信息熵表示这个属性与其他属性的冗余度,然后在选择测试属性的过程中,加入测试属性与其他属性的冗余度,通过信息增益、分裂熵和冗余度三个因素的评价,选择信息增益率高而与其他属性冗余度低的测试属性.实验结果表明,在选定的实验数据集上,改进后的C4.5决策树算法平均分类正确率提高.
|
关 键 词: | C4.5决策树 属性相关 信息熵 信息增益率 冗余度 |
本文献已被 CNKI 等数据库收录! |
|