首页 | 本学科首页   官方微博 | 高级检索  
     

跨语言多任务学习深层神经网络在蒙汉机器翻译的应用
引用本文:张振,苏依拉,仁庆道尔吉,高芬,王宇飞.跨语言多任务学习深层神经网络在蒙汉机器翻译的应用[J].计算机应用与软件,2021,38(1):157-160,178.
作者姓名:张振  苏依拉  仁庆道尔吉  高芬  王宇飞
作者单位:内蒙古工业大学信息工程学院 内蒙古 呼和浩特 010080;内蒙古工业大学信息工程学院 内蒙古 呼和浩特 010080;内蒙古工业大学信息工程学院 内蒙古 呼和浩特 010080;内蒙古工业大学信息工程学院 内蒙古 呼和浩特 010080;内蒙古工业大学信息工程学院 内蒙古 呼和浩特 010080
基金项目:内蒙古自治区自然科学基金项目;国家自然科学基金项目;内蒙古自治区民族事务委员会基金项目
摘    要:针对蒙汉平行语料资源比较稀缺和现有平行语料数据覆盖面少等导致的蒙汉翻译质量不佳的问题,采用跨语言多任务学习的方式对机器翻译建模。在数据预处理阶段,引入两种新的无监督预训练和一种监督预训练的方法,用于跨语言建模来学习跨语言表示,并研究三种语言预训练方法在蒙汉翻译中的效果。实验结果表明,三种跨语言预训练的模型可以显著降低低资源语言的困惑度,提高蒙汉翻译质量。

关 键 词:蒙汉机器翻译  无监督预训练  监督预训练  跨语言建模  多任务学习

APPLICATION OF CROSS-LANGUAGE MULTI-TASK LEARNING DEEP NEURAL NETWORK IN MONGOLIAN-CHINESE MACHINE TRANSLATION
Zhang Zhen,Su Yila,Ren Qingdaoerji,Gao Fen,Wang Yufei.APPLICATION OF CROSS-LANGUAGE MULTI-TASK LEARNING DEEP NEURAL NETWORK IN MONGOLIAN-CHINESE MACHINE TRANSLATION[J].Computer Applications and Software,2021,38(1):157-160,178.
Authors:Zhang Zhen  Su Yila  Ren Qingdaoerji  Gao Fen  Wang Yufei
Affiliation:(School of Information Engineering,Inner Mongolia University of Technology,Hohhot 010080,Inner Mongolia,China)
Abstract:To solve the problem of poor quality of Mongolian and Chinese translations caused by the difficulty of Mongolian-Chinese parallel corpus resources and the lack of coverage of existing parallel corpus data,this paper models machine translation by means of cross-language multi-task learning.In the data preprocessing stage,two new unsupervised pre-training and one supervised pre-training method were introduced for cross-language modeling to learn cross-language representation,and the effect of three language pre-training methods were studied in Mongolian-Chinese translation.The experimental results show that the above three cross-language pre-training models can significantly reduce the confusion of low-resource language,improve the quality of Mongolian-Chinese translation.
Keywords:Mongolian-Chinese machine translation  Unsupervised pre-training  Supervised pre-training  Cross-language modeling  Multi-task learning
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号