适用于方面级情感分析的多级数据增强方法 |
| |
作者姓名: | 张蓉 刘渊 |
| |
作者单位: | 1. 江苏信息职业技术学院,物联网工程学院;2. 江南大学,人工智能与计算机学院 |
| |
基金项目: | 国家自然科学基金资助项目“面向天地一体化信息网络的可伸缩与可重构仿真技术”(61972182);;江苏省高校“青蓝工程”优秀教学团队“物联网应用技术”(苏教办师函[2021]23号); |
| |
摘 要: | 【目的】方面级情感分析能够更好地洞察用户评论,是近年来研究的热点。针对方面级情感分析领域中标签数据较难获取的问题,设计简单而有效的多级数据增强方法。【方法】在不改变情感极性的前提下,针对一个评论中特定几个目标方面进行句子级相邻词、领域级同类词和词向量级同义词替换,既保证了标签不变性,又能够生成多样化的合成训练样本。每种数据增强方法能够单独运用或者随机组合运用。【结果】提出的方案分别运用在基于注意力机制+预训练模型和基于依赖树+预训练模型上,并应用于对比学习框架。在SemEval 2014 Task 4 Sub Task 2上进行实验,实验结果表明提出的数据增强方法是有效的,Accuracy和Macro-f1指标优于基准指标。【结论】多级数据增强方法可以有效缓解方面级情感分析任务中数据不足问题,既可以作为原训练数据的有效补充实施共同训练,也可以构建正样本用于对比学习实施多任务训练。
|
关 键 词: | 方面级情感分析 预训练模型 数据增强 依赖树 注意力机制 对比学习 |
|