面向文本结构的混合分层注意力网络的话题归类 |
| |
作者姓名: | 车蕾 杨小平 王良 梁天新 韩镇远 |
| |
作者单位: | 1.中国人民大学 信息学院,北京 100872; 2.北京科技大学 信息管理学院,北京 100192 |
| |
基金项目: | 北京市教委社科计划(SM201911232003);国家自然科学基金(61572079);北京市教委科技计划(KM201711417004) |
| |
摘 要: | 针对目前话题归类模型中文本逻辑结构特征与文本组织结构特征利用不充分的问题,该文提出一种面向文本结构的混合分层注意力网络的话题归类模型(TSOHHAN)。文本结构包括逻辑结构和组织结构,文本的逻辑结构包括标题和正文等信息;文本的组织结构包括字—词语—句层次。TSOHHAN模型采用竞争机制融合标题和正文以增强文本逻辑结构特征在话题归类中的作用;同时该模型采用字-词语-句层次的注意力机制增强文本组织结构特征在话题归类中的作用。在4个标准数据集上的实验结果表明,TSOHHAN模型能够提高话题归类任务的准确率。
|
关 键 词: | 深度学习 注意力机制 混合分层注意力网络 话题归类 |
本文献已被 维普 等数据库收录! |
| 点击此处可从《中文信息学报》浏览原始摘要信息 |
|
点击此处可从《中文信息学报》下载全文 |
|