首页 | 本学科首页   官方微博 | 高级检索  
     

融合多特征的汉维神经网络机器翻译模型
引用本文:朱顺乐.融合多特征的汉维神经网络机器翻译模型[J].计算机工程与设计,2019,40(5):1484-1488,F0003.
作者姓名:朱顺乐
作者单位:浙江海洋大学东海科学技术学院,浙江舟山,316000
基金项目:浙江省自然科学基金;浙江省自然科学基金青年科学基金
摘    要:针对汉维神经网络机器翻译中出现的未登录词过多、维吾尔语端形态生成以及汉维词语表意不一致等问题,提出一种融合"编码器-解码器"特征、维吾尔语"词干-词缀"语言模型特征、汉维-维汉双向词对齐特征的汉维翻译策略。综合考虑汉维语言差异、汉维语言资源稀缺等问题,将统计机器翻译中的双语知识引入到神经网络机器翻译模型中,多个特征通过一个对数线性模型组合。实验结果表明,该方法能够有效提升汉维神经网络机器翻译性能,平均BLEU提升大于2.0。

关 键 词:汉维神经网络机器翻译  对数线性模型  特征  形态分析  语言模型

Optimized Chinese-Uyghur neural machine translation model based on multi-features
Affiliation:(Donghai Science and Technology College,Zhejiang Ocean University,Zhoushan 316000,China)
Abstract:To overcome OOVs,morphological generation and n-to-1 alignment exist in Chinese-Uyghur neural machine translation,a log-linear model based Chinese-Uyghur machine translation approach was proposed,which integrated features like encoder-decoder feature,Uyghur stem-affix language model feature and Chinese-Uyghur bidirectional word alignment feature.Knowledge of statistical machine translation was imported into neural machine translation,which alleviated data sparsity and morphological differences during model training.Experimental results show that the proposed model can achieve 2.0+ BLEU improvements compared with other methods.
Keywords:Chinese-Uyghur neural machine translation  log-linear model  feature  morphological analysis  language model
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号