首页 | 本学科首页   官方微博 | 高级检索  
     

一种用于大规模数据集的决策树采样策略
引用本文:赵国强,王会进. 一种用于大规模数据集的决策树采样策略[J]. 微型机与应用, 2010, 29(21)
作者姓名:赵国强  王会进
摘    要:为提高大规模数据集生成树的准确率,提出一种预生成一棵基于这个数据集的决策树,采用广度优先遍历将其划分为满足预定义的限制的数据集,再对各数据集按照一定比例进行随机采样,最后将采样结果整合为目标数据集的数据采样方法.通过对一UCI数据集进行采样,并用现有决策树算法实验证明,该采样方法优于传统随机采样方法,基于该采样方法的生成树准确率有所提高.

关 键 词:决策树  样本选取  广度优先遍历

A sampling strategy on decision tree for large data sets
ZHAO Guo Qiang,WANG Hui Jin. A sampling strategy on decision tree for large data sets[J]. Microcomputer & its Applications, 2010, 29(21)
Authors:ZHAO Guo Qiang  WANG Hui Jin
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号