首页 | 本学科首页   官方微博 | 高级检索  
     

一种挖掘概念漂移数据流的选择性集成算法
引用本文:关菁华,刘大有.一种挖掘概念漂移数据流的选择性集成算法[J].计算机科学,2010,37(1):205-207.
作者姓名:关菁华  刘大有
作者单位:1. 吉林大学符号计算与知识工程教育部重点实验室,长春,130012
2. 吉林大学计算机科学与技术学院,长春,130012
基金项目:国家自然科学基金重大项目(60496321);;国家自然科学基金项目(60373098,60573073);;国家高技术研究发展计划项目(20060110Z2037);;吉林省科技发展计划重大项目(20020303);;吉林省科技发展计划项目(20030523);;欧盟项目TH/AsiaLink/010(111084)资助
摘    要:提出一种挖掘概念漂移数据流的选择性集成学习算法。该算法根据各基分类器在验证集上的输出结果向量方向与参考向量方向之间的偏离程度,选择参与集成的基分类器。分别在具有突发性和渐进性概念漂移的人造数据集SEA和Hyperplane上进行实验分析。实验结果表明,这种基分类器选择方法大幅度提高了集成算法在处理概念漂移数据流时的分类准确性。使用error-ambiguity分解对算法构建的naive Bayes集成在解决分类问题时的性能进行了分析。实验结果表明,算法成功的主要原因是它能显著降低平均泛化误差。

关 键 词:概念漂移  选择性集成  朴素贝叶斯  error-ambiguity分解  
收稿时间:2009/2/20 0:00:00
修稿时间:6/2/2009 12:00:00 AM

Selected Ensemble of Classifiers for Handling Concept-drifting Data Streams
GUAN Jing-hu,LIU Da-you.Selected Ensemble of Classifiers for Handling Concept-drifting Data Streams[J].Computer Science,2010,37(1):205-207.
Authors:GUAN Jing-hu  LIU Da-you
Affiliation:Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education/a>;Jilin University/a>;Changchun 130012/a>;China;College of Computer Science and Technology/a>;China
Abstract:In data streams concept is often not stable but change with time.We proposed a selective integration algorithm OSEN (Orientation based Selected ENsemble) for handling concept drift data streams.This algorithm selects a near optimal subset of base classifiers based on the output of each base classifier on validation dataset.Our experiments with synthetic data sets simulating abrupt (SEA) and gradual (Hyperplane) concept drifts demonstrate that selective integration of classifiers built over small time interv...
Keywords:Concept drift  Selective ensemble  Naive bayes  Error-ambiguity decomposition  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号