首页 | 本学科首页   官方微博 | 高级检索  
     

层次化结构全局上下文增强的篇章级神经机器翻译
引用本文:陈林卿,李军辉,贡正仙. 层次化结构全局上下文增强的篇章级神经机器翻译[J]. 中文信息学报, 2022, 36(9): 67-75
作者姓名:陈林卿  李军辉  贡正仙
作者单位:苏州大学 自然语言处理实验室,江苏 苏州 215006
基金项目:国家自然科学基金(61876120,61976148)
摘    要:如何有效利用篇章上下文信息一直是篇章级神经机器翻译研究领域的一大挑战。该文提出利用来源于整个篇章的层次化全局上下文来提高篇章级神经机器翻译性能。为了实现该目标,该文提出的模型分别获取当前句内单词与篇章内所有句子及单词之间的依赖关系,结合不同层次的依赖关系以获取含有层次化篇章信息的全局上下文表示。最终源语言当前句子中的每个单词都能获取其独有的综合词和句级别依赖关系的上下文。为了充分利用平行句对语料在训练中的优势,该文使用两步训练法,在句子级语料训练模型的基础上使用含有篇章信息的语料进行二次训练以获得捕获全局上下文的能力。在若干基准语料数据集上的实验表明,该文提出的模型与若干强基准模型相比取得了有意义的翻译质量提升。实验进一步表明,结合层次化篇章信息的上下文比仅使用词级别上下文更具优势。除此之外,该文还尝试通过不同方式将全局上下文与翻译模型结合并观察其对模型性能的影响,并初步探究篇章翻译中全局上下文在篇章中的分布情况。

关 键 词:神经机器翻译  篇章翻译  篇章上下文  
收稿时间:2021-02-21

Hierarchical Global Context Augmented Document-level Neural Machine Translation
CHEN Linqing,LI Junhui,GONG Zhengxian. Hierarchical Global Context Augmented Document-level Neural Machine Translation[J]. Journal of Chinese Information Processing, 2022, 36(9): 67-75
Authors:CHEN Linqing  LI Junhui  GONG Zhengxian
Affiliation:Natural Language Processing Lab, Soochow University, Suzhou, Jiangsu 215006, China
Abstract:How to effectively use textual context information is a challenge in the field of document-level neural machine translation (NMT). This paper proposes to use a hierarchical global context derived from the entire document to improve the document-level NMT models. The proposed model obtains the dependencies between the words in current sentence and all other sentences, as well as those between all words. Then the dependencies of different levels are combined as the global context containing the hierarchical contextual information. In order to take advantage of the parallel sentence in training, this paper employs a two-step training strategy: a sentence level model is first trained by the Transformer, and then fine-tuned on a document-level corpus. Experiments on several benchmark corpus data sets show that the proposed model significantly improves translation quality compared with other strong baseline models.
Keywords:neural machine translation    document-level translation    document-level context  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号