面向概念漂移数据流的自适应分类算法 |
| |
引用本文: | 蔡桓, 陆克中, 伍启荣, 吴定明. 面向概念漂移数据流的自适应分类算法[J]. 计算机研究与发展, 2022, 59(3): 633-646. DOI: 10.7544/issn1000-1239.20201017 |
| |
作者姓名: | 蔡桓 陆克中 伍启荣 吴定明 |
| |
作者单位: | (深圳大学计算机与软件学院 广东深圳 518061) (caihuan2018@email.szu.edu.cn) |
| |
基金项目: | 国家自然科学基金项目(61502310);;广东省自然科学基金项目(2019A1515011064)~~; |
| |
摘 要: | 数据流分类是数据挖掘中最重要的任务之一,而数据流的概念漂移特性给分类算法带来了巨大的挑战.基于极限学习机算法进行优化是解决数据流分类问题的一个热门方向,但目前大多数算法都采用提前指定模型参数的方式进行学习,这种做法使得分类模型只能在特定的数据集上才能发挥较好的性能.针对这一问题,提出了一种简单有效的处理概念漂移的算法——自适应在线顺序极限学习机分类算法.算法通过引入自适应模型复杂度机制,从而具有更好的分类性能.然后通过引入自适应遗忘因子与概念漂移检测机制,能够根据动态变化的数据流进行自适应学习,从而可以更好地适应概念漂移.进一步还引入异常点检测机制,避免分类决策边界被异常点破坏.仿真实验表明,所提出算法比同类算法具有更好的稳定性、分类准确性以及概念漂移适应能力.此外,还通过消融实验证实了算法所引入3个机制的有效性.
|
关 键 词: | 数据流分类 在线学习 极限学习机 概念漂移 自适应机制 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《计算机研究与发展》浏览原始摘要信息 |
|
点击此处可从《计算机研究与发展》下载免费的PDF全文 |
|