首页 | 本学科首页   官方微博 | 高级检索  
     

基于累积正样本的偏斜数据流集成分类方法
引用本文:郭文锋,王勇.基于累积正样本的偏斜数据流集成分类方法[J].计算机与现代化,2015,0(3):41-47.
作者姓名:郭文锋  王勇
作者单位:西北工业大学计算机学院;西北工业大学理学院
基金项目:西北工业大学基础研究基金资助项目(JC201273)
摘    要:针对现有处理偏斜数据流的方法存在过拟合或者未充分利用现有数据这一问题,提出一种基于累积正样本的偏斜数据流集成分类方法 EAMIDS。该算法把目前达到的所有数据块的正样本收集起来生成集合AP,然后采用KNN算法和Over-sampling方法来平衡数据块的类分布。当基分类器数量超过最大值时,根据F-Measure值来更新集成分类器。通过在模拟数据集SEA和SPH上的实验,与IDSL算法和SMOTE算法相比,表明EAMIDS具有更高的准确率。

关 键 词:偏斜数据流  累积正样本  集成分类器  概念漂移

Classifier Ensemble for Imbalanced Data Stream Classification Based on Accumulated Minorities
GUO Wen-feng;WANG Yong.Classifier Ensemble for Imbalanced Data Stream Classification Based on Accumulated Minorities[J].Computer and Modernization,2015,0(3):41-47.
Authors:GUO Wen-feng;WANG Yong
Affiliation:GUO Wen-feng;WANG Yong;School of Computer Science,Northwestern Polytechnical University;School of Natural and Applied Sciences,Northwestern Polytechnical University;
Abstract:
Keywords:imbalanced data streams  accumulated positive samples  ensemble classifiers  concept drift  
本文献已被 CNKI 等数据库收录!
点击此处可从《计算机与现代化》浏览原始摘要信息
点击此处可从《计算机与现代化》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号