首页 | 本学科首页   官方微博 | 高级检索  
     

面向文本结构的混合分层注意力网络的话题归类
引用本文:车蕾,杨小平,王良,梁天新,韩镇远. 面向文本结构的混合分层注意力网络的话题归类[J]. 中文信息学报, 2019, 33(5): 93-102,112
作者姓名:车蕾  杨小平  王良  梁天新  韩镇远
作者单位:1.中国人民大学 信息学院,北京 100872;
2.北京科技大学 信息管理学院,北京 100192
基金项目:北京市教委社科计划(SM201911232003);国家自然科学基金(61572079);北京市教委科技计划(KM201711417004)
摘    要:针对目前话题归类模型中文本逻辑结构特征与文本组织结构特征利用不充分的问题,该文提出一种面向文本结构的混合分层注意力网络的话题归类模型(TSOHHAN)。文本结构包括逻辑结构和组织结构,文本的逻辑结构包括标题和正文等信息;文本的组织结构包括字—词语—句层次。TSOHHAN模型采用竞争机制融合标题和正文以增强文本逻辑结构特征在话题归类中的作用;同时该模型采用字-词语-句层次的注意力机制增强文本组织结构特征在话题归类中的作用。在4个标准数据集上的实验结果表明,TSOHHAN模型能够提高话题归类任务的准确率。

关 键 词:深度学习  注意力机制  混合分层注意力网络  话题归类

Text Structure Oriented Hybrid Hierarchical Attention Networks for Topic Classification
CHE Lei,YANG Xiaoping,WANG Liang,LIANG Tianxin,HAN Zhenyuan. Text Structure Oriented Hybrid Hierarchical Attention Networks for Topic Classification[J]. Journal of Chinese Information Processing, 2019, 33(5): 93-102,112
Authors:CHE Lei  YANG Xiaoping  WANG Liang  LIANG Tianxin  HAN Zhenyuan
Affiliation:1.School of Information, Renmin University of China, Beijing 100872, China;
2.School of Information Management, Beijing Information Science & Technology University, Beijing 100192, China
Abstract:To better utilize text logical structure features and text organizational structure features in topic classification, this paper proposes a text structure oriented hybrid hierarchical attention network for this task. The logical structure usually includes information such as title and text, and the organizational structure includes character-word-sentence layer. The model integrates text headings and text bodies to improve the role of logical structure features in topic classification, and improves the role of text organizational structure features in topic classification based on the attention mechanism of char-sentence and word-sentence levels. Experimental results on 4 datasets show that the proposed model can improve the accuracy of topic classification tasks.
Keywords:deep learning    attention mechanism    hybrid hierarchical attention networks    topic classification  
本文献已被 维普 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号