融合单语语言模型的藏汉机器翻译方法研究 |
| |
作者姓名: | 慈祯嘉措 桑杰端珠 孙茂松 色差甲 周毛先 |
| |
作者单位: | 1.青海师范大学 藏文信息处理教育部重点实验室,青海 西宁 810008; 2.青海省藏文信息处理与机器翻译重点实验室,青海 西宁 810008; 3.清华大学 计算机系,北京 100084 |
| |
基金项目: | 国家自然科学基金(61063033,61662061);国家重点研发计划(2017YFB1402200) |
| |
摘 要: | 由于藏汉平行语料匮乏,导致藏汉神经网络机器翻译效果欠佳,该文提出了一种将藏语单语语言模型融合到藏汉神经网络机器翻译的方法,首先利用神经网络实现藏语单语语言模型,然后使用Transformer实现藏汉神经网络机器翻译模型,最后将藏语单语语言模型融合到藏汉神经网络机器翻译中。实验表明,该方法能显著提升藏汉神经网络机器翻译质量。基线系统藏语到汉语的BLEU值为21.1,汉语到藏语的BLEU值为18.6,融合藏语单语语言模型后,藏语到汉语的BLEU值为24.5,汉语到藏语的BLEU值为23.3,比原有基线系统的BLEU值分别提高了3.4和4.7。
|
关 键 词: | 藏语 语言模型 机器翻译 融合 神经网络 |
|
| 点击此处可从《中文信息学报》浏览原始摘要信息 |
|
点击此处可从《中文信息学报》下载全文 |
|