首页 | 本学科首页   官方微博 | 高级检索  
     

面向层次短语翻译的词汇化调序方法研究
引用本文:肖欣延,刘洋,刘群,林守勋.面向层次短语翻译的词汇化调序方法研究[J].中文信息学报,2012,26(1):37-42.
作者姓名:肖欣延  刘洋  刘群  林守勋
作者单位:1. 中国科学院 计算技术研究所 智能信息处理重点实验室,北京 100190;
2. 中国科学院 研究生院,北京 100190
基金项目:国家自然科学基金重点资助项目(60736014);国家自然基金资助项目(60873167)
摘    要:词汇化信息在短语调序中有重要的作用。然而层次短语翻译模型调序时并不考虑变量所泛化的短语的词汇化信息,因此该模型调序的歧义性较大。为此该文提出面向层次短语模型的词汇化调序方法。我们定义变量与邻接词语的调序关系,并使用变量所泛化短语片段的边界词信息来指导调序。在大规模语料的汉语到英语翻译评测任务中,我们的方法在NIST 2003-2005测试数据上获得了0.6~1.2 BLEU值的提高。

关 键 词:统计机器翻译  层次短语  词汇化调序  

Lexical Reordering for Hierarchical Phrase-based Translation
XIAO Xinyan , LIU Yang , LIU Qun , LIN Shouxun.Lexical Reordering for Hierarchical Phrase-based Translation[J].Journal of Chinese Information Processing,2012,26(1):37-42.
Authors:XIAO Xinyan  LIU Yang  LIU Qun  LIN Shouxun
Affiliation:1. Key Laboratory of Intelligent Information Processing, Institute of Computing Technology,
Chinese Academy of Sciences, Beijing 100190, China;
2. Graduate University of Chinese Academy of Sciences, Beijing 100190, China
Abstract:Lexical information plays an important role in the phrase reordering.However,the reordering in the hierarchical phrase-based(HPB) model does not consider the lexical information within the phrases,resulting in the reordering ambiguity.To alleviate this,we propose a lexicalized reordering method for the HPB translation.We distinguish two orientations of a variable comparing to its adjacent words,and use boundary words covered by the variable to guide reordering choices.In the large scale Chinese-English translation evaluation task,the proposed method improves the translation performance ranging from 0.6 to 1.2 BLEU on NIST 2003-2005 test-sets.
Keywords:statistical machine translation  hierarchical phrase-based  lexical reordering
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号