首页 | 本学科首页   官方微博 | 高级检索  
     

基于分类不确定性最小化的半监督集成学习算法
作者姓名:何玉林  朱鹏辉  黄哲学  Fournier-Viger PHILIPPE
作者单位:1. 人工智能与数字经济广东省实验室(深圳);2. 深圳大学计算机与软件学院
基金项目:国家自然科学基金面上项目(61972261);;广东省自然科学基金面上项目(2023A1515011667);
摘    要:半监督集成是将半监督学习与集成学习相结合的一种学习范式,它一方面通过无标记样本来提高集成学习的多样性,同时解决集成学习样本量不足的问题,另一方面集成多个分类器能够进一步提升半监督学习模型的性能。现有的研究从理论和实践两个角度证明了半监督学习与集成学习之间的互益性。针对当前半监督集成学习算法对无标记样本信息利用不完全的缺陷,文中提出了一种新的基于分类不确定性最小化的半监督集成学习(Classification Uncertainty Minimization-Based Semi-Supervised Ensemble Learning, CUM-SSEL)算法,它引入信息熵作为对无标记样本进行打标的置信度评判标准,通过最小化无标记样本打标过程中的不确定性迭代地训练分类器,实现对无标记样本的高效利用,以增强分类器的泛化性能。在标准的实验数据集上对CUM-SSEL算法的可行性、合理性和有效性进行了验证,实验表明:随着基分类器的增加,CUM-SSEL算法的训练呈现收敛的趋势,同时它能够获得优于Self-Training, Co-Training, Tri-Training, Semi-Boo...

关 键 词:半监督集成学习  集成学习  半监督学习  分类不确定性  置信度  信息熵
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号