首页 | 本学科首页   官方微博 | 高级检索  
     

融合多层注意力表示的中文新闻文本摘要生成
作者姓名:王骞  雷景生  唐小岚
作者单位:上海电力大学
基金项目:国家自然科学基金项目(61672337);
摘    要:针对现有的文本摘要模型词向量表意不全面,且难以对远距离词句进行表征,提出一种融合多层注意力表示的中长文本摘要方法。通过抽取式技术将新闻文本进行分割,得到主体文本和辅助文本;将主体文本进行图卷积神经网络的学习和依存句法分析,得到词向量的图卷积表示和依存词对信息,同时对辅助文本进行高频主题词的挖掘;将这三种信息融合送入Transformer序列模型中,并对编码器和解码器的局部注意力稍作修改,使其能够更多地关注主题相关的部分和依存句法结构;生成文本摘要。在公共文本摘要数据集NLPCC 2017上的实验表明,该方法能够得到较高的ROUGE分数,生成质量更好的文本摘要。

关 键 词:文本摘要生成  TextRank  图卷积神经网络  依存句法分析  Transformer序列模型
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号