基于改进决策树的数据挖掘与分析算法设计 |
| |
引用本文: | 王建琴.基于改进决策树的数据挖掘与分析算法设计[J].电子设计工程,2024(4):84-88. |
| |
作者姓名: | 王建琴 |
| |
作者单位: | 河北北方学院附属第二医院 |
| |
摘 要: | 针对海量数据中存在的造假与欺诈问题,文中提出了一种基于数据挖掘与改进决策树的数据分析算法来识别其中的异常数据。该算法将主成分分析法与改进决策树算法C4.5相结合,利用数据挖掘技术对海量数据进行预处理,并提取重要特征,通过加入信息增益率的改进决策树算法C4.5识别出异常数据。在海量医疗财务数据中进行的实验仿真结果表明,所提算法的准确率达到了96.91%,且其对数据的预处理操作也使算法的识别速度提升了1.25 s。同时还对各种机器学习算法与数据挖掘技术进行了对比,进而证明了该文算法的识别准确率最高,且与SVM算法相比提升了10.8%。
|
关 键 词: | 异常检测 数据分析 数据挖掘 决策树 医疗财务数据 |
|
|