首页 | 本学科首页   官方微博 | 高级检索  
     

基于多粒度图与注意力机制的半监督短文本分类
引用本文:游奔,李晓红,姚锦,冯绍杰.基于多粒度图与注意力机制的半监督短文本分类[J].计算机工程,2024(5):83-90.
作者姓名:游奔  李晓红  姚锦  冯绍杰
作者单位:西北师范大学计算机科学与工程学院
基金项目:国家自然科学基金(61862058,61967013);;甘肃省自然科学基金(20JR10RA076);
摘    要:短文本语义稀疏模糊、蕴含信息不足、表达不规则等缺陷给短文本分类任务带来了极大的挑战,且现有短文本分类方法通常忽略词项间的交互信息,不能充分挖掘隐含的语义信息,导致分类效率低下。针对上述问题,提出一种基于多粒度图与注意力机制的半监督短文本分类模型MgGAt。该模型在词粒度和文本粒度基础上构建2种类型的图,通过充分挖掘语义信息完成分类任务。首先构建词级图,捕获词嵌入,进而学习得到文本特征表示。在词级图上引入跳内注意力和跳间注意力,从多种语义角度有效提取词项间隐含的高阶信息,捕获语义丰富的词嵌入。同时依据词级子图的特点设计池化策略,聚合词嵌入,学习文本表征。其次构建文本级图,借助部分已知的标签信息,利用图神经网络的优势,在图上执行标签传播和推理,完成半监督短文本分类任务。在4个公开数据集上的实验结果表明,与基线模型相比,MgGAt模型的短文本分类精确率平均提升了1.18个百分点,F1值平均提升了1.37个百分点,具有更好的分类性能。

关 键 词:短文本分类  半监督分类  图神经网络  注意力机制  多粒度图
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号