融合流注意力机制的中文摘要生成方法 |
| |
作者姓名: | 崔少国 王奥迪 杜兴 |
| |
作者单位: | 重庆师范大学计算机与信息科学学院 |
| |
基金项目: | 国家自然科学基金项目(62003065)资助;;重庆市科技局自然基金面上项目(CSTB2022NSCQ-MSX1206)资助;;教育部人文社科规划基金项目(22YJA870005)资助;;重庆市教委人文社科项目(23SKGH072)资助;;重庆市研究生科研创新项目(CYS22558,CYS22555)资助; |
| |
摘 要: | 针对现有文本摘要生成方法对源文全局语义信息提取不充分问题,提出了一种融合流注意力机制的并行编码器摘要生成算法模型.首先使用单颗粒的分词方法对源文进行分词;然后在编码阶段引入多头流注意力机制,从而更全面地提取源文的全局语义信息;其次运用并行编码器训练模型,使得输入序列中语义信息获得更大权重;最后将编码得到的全局语义信息送入到融合指针的解码器中,通过指针复制源文词汇,减少生成摘要中未登录词的出现,从而使得解码过程中生成的摘要更加全面准确地匹配源文语义.模型在CLTS和NLPCC两个数据集上进行实验,使用ROUGE-1、ROUGE-2和ROUGE-L作为评价指标.实验结果显示,与基准模型相比在CLTS数据集上分别有2.62%、1.44%和0.87%的提升,在NLPCC数据集上分别有2.82%、1.84%和1.64%的提升,表明所提算法模型在中文摘要生成任务上更加有效.
|
关 键 词: | 中文文本 摘要生成 流注意力机制 并行编码器 指针网络 |
|
|