首页 | 本学科首页   官方微博 | 高级检索  
     

基于翻译模型和语言模型相融合的双语句对选择方法
引用本文:姚 亮,洪 宇,刘 昊,刘 乐,姚建民.基于翻译模型和语言模型相融合的双语句对选择方法[J].中文信息学报,2016,30(5):145-152.
作者姓名:姚 亮  洪 宇  刘 昊  刘 乐  姚建民
作者单位:苏州大学 江苏省计算机信息处理重点实验室,江苏 苏州 215006
基金项目:国家自然科学基金(61373097, 61272259, 61272260)
摘    要:双语句对选择方法旨在从大规模通用领域双语语料库中,自动抽取与待翻译文本领域相关性较高的句对,以缓解特定领域翻译模型训练语料不足的问题。区别于原有基于语言模型的双语句对选择方法,该文从句对生成式建模的角度出发,提出一种基于翻译模型和语言模型相融合的双语句对选择方法。该方法能够有效评价双语句对的领域相关性及互译性。实验结果显示,利用该文所提方法选择双语句对训练所得翻译系统,相比于基准系统,在测试集上性能提升3.5个BLEU值;此外,针对不同句对质量评价特征之间的权重调节问题,该文提出一种基于句对重排序的特征权重自动优化方法。基于该方法的机器翻译系统性能继续提升0.68个BLEU值。


关 键 词:双语句对选择  生成式建模  翻译模型  语言模型  权重调节
  

Combining Translation and Language Models for Bilingual Data Selection
YAO Liang,HONG Yu,LIU Hao,LIU Le,YAO Jianmin.Combining Translation and Language Models for Bilingual Data Selection[J].Journal of Chinese Information Processing,2016,30(5):145-152.
Authors:YAO Liang  HONG Yu  LIU Hao  LIU Le  YAO Jianmin
Affiliation:Provincial Key Laboratory of Computer Information Processing Technology
Soochow University, Suzhou, Jiangsu 215006,China
Abstract:
Keywords:
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号