首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于Spark的改进随机森林算法
引用本文:段文杰,童孟军.一种基于Spark的改进随机森林算法[J].计算机应用与软件,2021,38(8):275-279.
作者姓名:段文杰  童孟军
作者单位:浙江农林大学信息工程学院 浙江 杭州311300;浙江省林业智能监测与信息技术研究重点实验室 浙江 杭州311300;浙江省林业智能监测与信息技术研究重点实验室 浙江 杭州311300
摘    要:提出一种改进随机森林算法(SP-RF).通过建立数据抽样索引表和随机特征索引表来实现随机森林算法在Spark上的并行化;通过计算随机森林算法中每个决策树的AUC值来给分类能力不同的决策树分配权重;提高随机森林算法在投票环节的分类精度.实验结果表明改进后的随机森林算法分类精度平均提高5%,运行时间平均减少25%以上.

关 键 词:随机森林  Spark  AUC  并行化  大数据

AN IMPROVED RANDOM FOREST ALGORITHM BASED ON SPARK
Duan Wenjie,Tong Mengjun.AN IMPROVED RANDOM FOREST ALGORITHM BASED ON SPARK[J].Computer Applications and Software,2021,38(8):275-279.
Authors:Duan Wenjie  Tong Mengjun
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号