基于分类的中文文本摘要方法 |
| |
作者姓名: | 庞超 尹传环 |
| |
作者单位: | 北京交通大学计算机与信息技术学院 北京100044,北京交通大学计算机与信息技术学院 北京100044 |
| |
摘 要: | 自动文本摘要是自然语言处理领域中一项重要的研究内容,根据实现方式的不同其分为摘录式和理解式,其中理解式文摘是基于不同的形式对原始文档的中心内容和概念的重新表示,生成的文摘中的词语无需与原始文档相同。提出了一种基于分类的理解式文摘模型。该模型将基于递归神经网络的编码-解码结构与分类结构相结合,并充分利用监督信息,从而获得更多的摘要特性;通过在编码-解码结构中使用注意力机制,模型能更精确地获取原文的中心内容。模型的两部分可以同时在大数据集下进行训练优化,训练过程简单且有效。所提模型表现出了优异的自动摘要性能。
|
关 键 词: | 递归神经网络 注意力机制 文本摘要 文本分类 |
收稿时间: | 2017-05-08 |
修稿时间: | 2017-09-28 |
|
|