首页 | 本学科首页   官方微博 | 高级检索  
     

融合语义增强的中文短文本分类方法研究
引用本文:潘袁湘,黄林,牛新征.融合语义增强的中文短文本分类方法研究[J].计算机与数字工程,2022,50(3):586-590.
作者姓名:潘袁湘  黄林  牛新征
作者单位:电子科技大学信息与软件工程学院 成都 610000,国网四川省电力公司信息通信公司 成都 610015,电子科技大学计算机科学与工程学院 成都 610000
基金项目:国网四川省电力公司信息通信公司项目
摘    要:中文短文本具有长度短以及上下文依赖强的特点。目前主流的基于词向量的双向循环神经网络分类方法依赖于词向量语义表达以及上下文特征提取能力,其分类准确率有待进一步改善。针对此问题,论文提出融合语义增强的中文短文本分类方法,该方法提出融合语义增强的思想,在词向量表示阶段,引入Bert生成融合字、文本以及位置的向量作为训练文本的词表征进行文本语义增强,接着输送到Bi-GRU网络中提取上下文关系特征,并通过多头注意力机制调整权值强化重要特征表达,最后使用softmax分类器进行文本分类。通过与其他主流方法进行对比论证,实验表明,论文提出的方法在短文本分类效果上有显著提升。

关 键 词:短文本分类  Bert  语义增强  Bi-GRU网络  多头注意力机制

Research on Chinese Short Text Classification Method Based on Semantic Enhancement
PAN Yuanxiang,HUANG Lin,NIU Xinzheng.Research on Chinese Short Text Classification Method Based on Semantic Enhancement[J].Computer and Digital Engineering,2022,50(3):586-590.
Authors:PAN Yuanxiang  HUANG Lin  NIU Xinzheng
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号