首页 | 本学科首页   官方微博 | 高级检索  
     

面向小样本情感分类任务的弱监督对比学习框架
引用本文:卢绍帅, 陈龙, 卢光跃, 管子玉, 谢飞. 面向小样本情感分类任务的弱监督对比学习框架[J]. 计算机研究与发展, 2022, 59(9): 2003-2014. DOI: 10.7544/issn1000-1239.20210699
作者姓名:卢绍帅  陈龙  卢光跃  管子玉  谢飞
作者单位:1(西安邮电大学通信与信息工程学院 西安 710121);2(西安电子科技大学计算机科学与技术学院 西安 710071);3(西安电子科技大学前沿交叉研究院 西安 710071) (199509@stu.xupt.edu.cn)
基金项目:国家自然科学基金项目(61936006,61876144,61876145,62103314);;陕西省重点研发计划项目(2021ZDLGY02-06);;陕西省自然科学基础研究计划项目(2020JQ-850)~~;
摘    要:文本情感分类是自然语言处理领域的挑战性研究课题.基于词典的方法和传统基于机器学习方法分别依赖高质量的情感词典和鲁棒的特征工程,而多数深度学习方法的性能则依赖大规模人工标注数据集.幸运的是,不同社交平台用户生成了大量带标签的舆情文本,这些文本可以作为弱标注数据集被用于情感分类任务,但是弱标注数据集中的噪声样本会对训练过程产生负面影响.提出了一种用于小样本情感分类任务的弱监督对比学习(weakly-supervised contrastive learning, WCL)框架,旨在学习海量带噪声的用户标记数据中的情感语义,同时挖掘少量人工标注数据中潜在的类间对比模式.该框架包括2个步骤:首先,设计了一种弱监督预训练策略来削弱噪声数据的影响;其次,在有监督微调阶段引入对比学习策略来捕获少量有标注数据的对比模式.在亚马逊评论数据集上评估了所提出的方法,实验结果表明所提出的方法显著优于其他同类对比方法.在仅使用0.5%(即32个样本)比例的有标注数据集进行微调的情况下,所提出方法的性能依然超出其他深度方法.

关 键 词:情感分类  弱监督学习  有监督对比学习  小样本学习  迁移学习
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机研究与发展》浏览原始摘要信息
点击此处可从《计算机研究与发展》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号