首页 | 本学科首页   官方微博 | 高级检索  
     

融合单语语言模型的藏汉机器翻译方法研究
引用本文:慈祯嘉措,桑杰端珠,孙茂松,色差甲,周毛先.融合单语语言模型的藏汉机器翻译方法研究[J].中文信息学报,2019,33(12):61-66.
作者姓名:慈祯嘉措  桑杰端珠  孙茂松  色差甲  周毛先
作者单位:1.青海师范大学 藏文信息处理教育部重点实验室,青海 西宁 810008;
2.青海省藏文信息处理与机器翻译重点实验室,青海 西宁 810008;
3.清华大学 计算机系,北京 100084
基金项目:国家自然科学基金(61063033,61662061);国家重点研发计划(2017YFB1402200)
摘    要:由于藏汉平行语料匮乏,导致藏汉神经网络机器翻译效果欠佳,该文提出了一种将藏语单语语言模型融合到藏汉神经网络机器翻译的方法,首先利用神经网络实现藏语单语语言模型,然后使用Transformer实现藏汉神经网络机器翻译模型,最后将藏语单语语言模型融合到藏汉神经网络机器翻译中。实验表明,该方法能显著提升藏汉神经网络机器翻译质量。基线系统藏语到汉语的BLEU值为21.1,汉语到藏语的BLEU值为18.6,融合藏语单语语言模型后,藏语到汉语的BLEU值为24.5,汉语到藏语的BLEU值为23.3,比原有基线系统的BLEU值分别提高了3.4和4.7。

关 键 词:藏语  语言模型  机器翻译  融合  神经网络  

Tibetan-Chinese Machine Translation Based on Tibetan Language Model Enhanced Transformer
CIZHEN Jiacuo,SANGJIE Duanzhu,SUN Maosong,SE Chajia,ZHOU Maoxian.Tibetan-Chinese Machine Translation Based on Tibetan Language Model Enhanced Transformer[J].Journal of Chinese Information Processing,2019,33(12):61-66.
Authors:CIZHEN Jiacuo  SANGJIE Duanzhu  SUN Maosong  SE Chajia  ZHOU Maoxian
Affiliation:1.MOE Key Laboratory of Tibetan Information Processing, Qinghai Normal University, Xining, Qinghai 810008, China;
2.Provincial Key Laboratory of Tibetan Intelligent Information Processing and Machine Translation, Xining, Qinghai 810008, China;
3.Department of Computer Science, Tsinghua University, Beijing 100084, China
Abstract:To better utilize the monolingual Tibetan texts in Tibetan-Chinese neural machine translation(NMT), we propose to pre-train a Tibetan neural language model and then integrate it into a Transformer-based Tibetan-Chinese NMT model. Experiments indicate our approach can boost the Tibetan-Chinese results from 21.1 to 24.5, and the Chinese-Tibetan form 18.6 to 23.3 in terms of BLEU score.
Keywords:Tibetan  language model  machine translation  fusion  neural net  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号