首页 | 本学科首页   官方微博 | 高级检索  
     

基于核极限学习机的多标签数据流半监督在线分类方法
作者姓名:王雨晨  邱士远  李培培  胡学钢
作者单位:1.合肥工业大学 计算机与信息学院 合肥 230601;
2.合肥工业大学 大数据知识工程教育部重点实验室 合肥 230009;
3.合肥综合性国家科学中心大健康研究院 健康大数据与群体医学研究所 合肥 230032;
4.合肥工业大学 安徽省工业安全与应急技术重点实验室 合肥 230009
基金项目:国家自然科学基金项目(No.62376085,62076085,62120106008)、合肥综合性国家科学中心大健康研究院健康大数据与群体医学研究所专项资金项目(No.JKS20230030)资助
摘    要:实际应用中涌现的大量流数据具有高速到达、海量、动态变化等特点,同时,这些数据流常含有多个标签且只有少量数据被标记,从而带来多标签数据环境下的概念漂移与标签缺失问题.为此,文中提出基于核极限学习机的多标签数据流半监督在线分类方法.首先,针对多标签数据流的标签缺失问题,根据滑动窗口将数据流划分为k块,对每块数据构造特征相似性矩阵和标签相似性矩阵,并加入核极限学习机的训练中.同时为了适应流数据的特点,设计增量式更新机制,构建半监督在线核极限学习机.然后,为了适应数据流中的概念漂移问题,采用基于时间戳丢弃更新的机制,预先设定数据规模,当数据到达指定规模后,丢弃最旧的无标签数据,将新的数据加入更新.最后,在10个多标签数据集上的实验表明,文中方法对标签缺失和概念漂移问题具有较强的适应能力,并能保持较优的分类效果.

关 键 词:数据流分类  半监督分类  多标签分类  核极限学习机  概念漂移  
收稿时间:2024-06-15
点击此处可从《模式识别与人工智能》浏览原始摘要信息
点击此处可从《模式识别与人工智能》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号