首页 | 本学科首页   官方微博 | 高级检索  
     

基于Bootstrap方法最大熵优化过采样算法
引用本文:雷天纲,陈刚.基于Bootstrap方法最大熵优化过采样算法[J].数据采集与处理,2023,38(3):727-740.
作者姓名:雷天纲  陈刚
作者单位:大连海事大学理学院,大连 116026
基金项目:国家自然科学基金(11571056)。
摘    要:随着数据时代的到来,非平衡数据的分类问题受到越来越多的关注。在非平衡数据的分类问题中,往往因为少数类样本与多数类样本比例失衡而导致分类结果错误。因此,提出了一种在最大熵原理下基于自助法(Bootstrap method)的过采样算法。首先,通过自助法获得数据样本的概率分布,并用最大熵原理对概率分布进行优化;其次,根据少数类生成新的少数类的能力不同,提出基于少数类样本分布的概率增强算法。该算法使数据随机性得到了充分体现,保证了少数类样本的概率密度在数据集平衡前后保持一致性,从而提高分类算法的有效性;最后,通过从UCI和KEEL数据库选取8组数据进行实验,实验结果表明所提出的新算法比现有的其他算法更有效。

关 键 词:非平衡数据  自助法  最大熵原理  概率增强  分类
收稿时间:2022/1/20 0:00:00
修稿时间:2023/4/20 0:00:00

An Over-Sampling Algorithm for Maximum Entropy Optimization Based on Bootstrap Method
LEI Tiangang,CHEN Gang.An Over-Sampling Algorithm for Maximum Entropy Optimization Based on Bootstrap Method[J].Journal of Data Acquisition & Processing,2023,38(3):727-740.
Authors:LEI Tiangang  CHEN Gang
Affiliation:School of Science, Dalian Maritime University, Dalian 116026, China
Abstract:
Keywords:unbalanced data  Bootstrap method  principle of maximum entropy  probability enhancement  classification
点击此处可从《数据采集与处理》浏览原始摘要信息
点击此处可从《数据采集与处理》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号