首页 | 本学科首页   官方微博 | 高级检索  
     

基于双向编解码器的乌英机器翻译
引用本文:高巍,李耀松,李大舟,陈子祥,孟智慧.基于双向编解码器的乌英机器翻译[J].计算机工程与设计,2021,42(5):1479-1484.
作者姓名:高巍  李耀松  李大舟  陈子祥  孟智慧
作者单位:沈阳化工大学 计算机科学与技术学院,辽宁 沈阳 110142;中国移动通信集团设计院有限公司 河北分公司,山西 太原 030000
基金项目:辽宁省博士启动基金项目;辽宁省教育厅科学研究基金项目;辽宁省教育厅科学技术研究基金项目
摘    要:对乌尔都语到英语的机器翻译进行研究,提出一种基于双向编解码器的乌英机器翻译模型.利用语言模型嵌入(embedding from language models,ELMo)方法进行语料的预训练,缓解双语平行语料稀缺以及词汇表受限所导致的翻译正确率不佳的问题;采用双向编解码机制,避免翻译过程中方向性倾斜的问题,提高翻译效果.实验在少量平行语料库的基础上,对所提模型与传统的乌英机器翻译模型进行对比,实验结果表明,该模型较传统模型在双语评估替补(bilingual evaluation understudy,BLEU)评分上提升了2.42,最终该模型的BLEU评分为9.27.

关 键 词:机器翻译  乌尔都语  双向编解码器  语言模型嵌入  双语评估替补

Urdu-English machine translation based on bidirectional encoder-decoder
GAO Wei,LI Yao-song,LI Da-zhou,CHEN Zi-xiang,MENG Zhi-hui.Urdu-English machine translation based on bidirectional encoder-decoder[J].Computer Engineering and Design,2021,42(5):1479-1484.
Authors:GAO Wei  LI Yao-song  LI Da-zhou  CHEN Zi-xiang  MENG Zhi-hui
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号