首页 | 本学科首页   官方微博 | 高级检索  
     

基于数据挖掘的启发式抽样方法研究
引用本文:黎娅,郭江娜. 基于数据挖掘的启发式抽样方法研究[J]. 微计算机信息, 2009, 25(12)
作者姓名:黎娅  郭江娜
作者单位:黎娅,LI Ya(信息管理系,河南郑州河南经贸职业学院,450053);郭江娜,GUO Jiang-na(河南郑州郑州大学计算机科学与技术,450002)  
摘    要:在数据挖掘中应用抽样技术,可以显著提高数据挖掘任务的效率.通过采用不同的抽样方法,使得数据挖掘算法可以针对比原始数据集小得多的样本数据集进行分析,从而大幅度提高性能.随之而来的问题就是,由于采用了抽样方法,在大幅提高性能的同时,对分析的精确性就会产生影响.如何选取合适的反映总体数据水平的样本成为数据挖掘中的关键问题.传统意义上的抽样大多采用单一的抽样方法,进行单一抽样,抽取的样本在一定程度上具有局限性.本文对传统抽样方法和样本容量的选取进行总结,对传统的分层抽样思想进行改进,提出了一种新的基于数据挖掘的启发式抽样思想,大大提高了抽取样本的精确性.

关 键 词:数据挖掘  启发式  抽样  样本容量

Research of heuristic sampling algorithm based on Data Mining
LI Ya,GUO Jiang-na. Research of heuristic sampling algorithm based on Data Mining[J]. Control & Automation, 2009, 25(12)
Authors:LI Ya  GUO Jiang-na
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号