融合注意力和裁剪机制的通用文本分类模型期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

融合注意力和裁剪机制的通用文本分类模型

作者姓名：	崔雨萌王靖亚刘晓文闫尚义陶知众

作者单位：	中国人民公安大学信息网络安全学院

基金项目：	国家社会科学基金资助项目（20AZD114）~~;

摘要：	针对当前分类模型通常仅对一种长度文本有效,而在实际场景中长短文本大量混合存在的问题,提出了一种基于混合神经网络的通用型长短文本分类模型（GLSTCM-HNN）。首先,利用BERT(Bidirectional Encoder Representations from Transformers)对文本进行动态编码;然后,使用卷积操作提取局部语义信息,并构建双通道注意力机制（DCATT）对关键文本区域增强;同时,使用循环神经网络（RNN）捕获全局语义信息,并建立长文本裁剪机制（LTCM）来筛选重要文本;最后,将提取到的局部和全局特征进行融合降维,并输入到Softmax函数里以得到类别输出。在4个公开数据集上的对比实验中,与基线模型（BERT-TextCNN）和性能最优的对比模型（BERT）相比,GLSTCMHNN的F1分数至多分别提升了3.87和5.86个百分点;在混合文本上的两组通用性实验中,GLSTCM-HNN的F1分数较已有研究提出的通用型模型——基于Attention的改进CNN-BiLSTM/BiGRU混联文本分类模型（CBLGA）分别提升了6.63和37.22个百分点。实验结果表...
关键词：	深度学习文本分类注意力机制裁剪机制通用型模型