基于栈式降噪编码器的跨语言多标签情感分类 |
| |
引用本文: | 唐诗琪,周瑞平,谢仕斌,刘梦赤,肖文.基于栈式降噪编码器的跨语言多标签情感分类[J].计算机与现代化,2023(11):6-12. |
| |
作者姓名: | 唐诗琪 周瑞平 谢仕斌 刘梦赤 肖文 |
| |
作者单位: | 1. 广州大数据智能教育重点实验室;2. 华南师范大学计算机学院 |
| |
基金项目: | 国家自然科学基金资助项目(61672389); |
| |
摘 要: | 多标签情感分类任务旨在处理一个实例可能与多个情感标签关联的问题。现有的大多数多标签情感分类模型都是基于完整的数据设计,模型性能和语义易受到数据本身存在的不完全性影响。针对此问题本文提出一种基于栈式降噪自编码器的跨语言多标签情感分类模型,引入标签感知损失函数弥补训练带来的损失。该模型通过栈式降噪自编码器对词向量去噪以构建原始数据的低维特征,降低特征空间的噪声干扰,为下游任务提供有效特征表示。在SemEval2018的3种语言数据集(即英语、阿拉伯语和西班牙语)多标签情感分类实验中,该模型在测试集上的micro_F1、macro_F1、jaccard这3个指标均得到提升,其中macro_F1分别提升了约0.82、1.45和1.83个百分点。
|
关 键 词: | 多标签分类 情感分类 不完全数据 BERT 栈式降噪自编码器 |
|
|