首页 | 本学科首页   官方微博 | 高级检索  
     

面向统计机器翻译的重对齐方法研究
引用本文:肖桐,李天宁,陈如山,朱靖波,王会珍.面向统计机器翻译的重对齐方法研究[J].中文信息学报,2010,24(1):110-117.
作者姓名:肖桐  李天宁  陈如山  朱靖波  王会珍
作者单位:东北大学 自然语言处理实验室,辽宁 沈阳 110004
基金项目:国家自然科学基金资助项目(60873091);;辽宁省自然科学基金资助项目(20072032);;沈阳市科学技术计划资助项目(1081235-1-00)
摘    要:词对齐是统计机器翻译中的重要技术之一。该文提出了一种重对齐方法,它在IBM models获得的正反双向词对齐的基础上,确定出正反双向对齐不一致的部分。之后,对双向词对齐不一致的部分进行重新对齐以得到更好的对称化的词对齐结果。此外,该文提出的方法还可以利用大规模单语语料来强化对齐结果。实验结果表明,相比在统计机器翻译中广泛使用的基于启发信息的词对齐对称化方法,该文提出的方法可以使统计机器翻译系统得到更高的翻译准确率。

关 键 词:人工智能  机器翻译  统计机器翻译  词对齐  重对齐  IBM  models  

Word Realignment for Statistical Machine Translation
XIAO Tong,LI Tianning,CHEN Rushan,ZHU Jingbo,WANG Huizhen.Word Realignment for Statistical Machine Translation[J].Journal of Chinese Information Processing,2010,24(1):110-117.
Authors:XIAO Tong  LI Tianning  CHEN Rushan  ZHU Jingbo  WANG Huizhen
Affiliation:Northeastern University NLP Lab. Shenyang, Liaoning 110004, China
Abstract:Word alignment is one of the key techniques in statistical machine translation(SMT).In this paper,we propose a word realignment method,which recognizes the inconsistent parts between the bidirectional alignments generated by IBM models at first,and refines then the word alignment by realigning the inconsistent parts.To reinforce our method,a monolingual feature is used to make benefits from large-scale monolingual corpus.The effectiveness of the method is demonstrated on a state-of-the-art phrase-based SMT ...
Keywords:artificial intelligence  machine translation  statistical machine translation  word alignment  word realignment  IBM models  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号