首页 | 本学科首页   官方微博 | 高级检索  
     

基于语句融合和自监督训练的文本摘要生成模型
作者姓名:邹傲  郝文宁  靳大尉  陈刚
作者单位:陆军工程大学指挥控制工程学院
基金项目:国家自然科学基金项目(No.61806221)资助~~;
摘    要:为了提高深度神经网络文本生成技术的语句融合能力,文中提出基于语句融合和自监督训练的文本摘要生成模型.在模型训练前,首先根据语句融合理论中的信息联系点概念对训练数据进行预处理,使其满足之后模型训练的需要.文中模型可分为两个阶段的训练.在第一阶段,根据语句融合现象在数据集上的分布情况,设计以信息联系点为最小语义单元的排列语言模型训练任务,增强模型对融合语句上下文的信息捕捉能力.在第二阶段,采用基于语句融合信息的注意力掩码策略控制模型在生成文本过程中的信息摄入程度,加强文本生成阶段的语句融合能力.在公开数据集上的实验表明,文中模型在基于统计、深层语义和语句融合比例等多个评测指标上都较优.

关 键 词:自动文本摘要  语句融合  预训练语言模型  深度神经网络  自监督训练
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号