首页 | 本学科首页   官方微博 | 高级检索  
     

统计机器翻译中的非连续短语模板抽取及其应用
引用本文:孙越恒,段楠,侯越先. 统计机器翻译中的非连续短语模板抽取及其应用[J]. 计算机科学, 2009, 36(10): 192-196
作者姓名:孙越恒  段楠  侯越先
作者单位:天津大学计算机科学与技术学院,天津,300072
基金项目:国家自然科学基金项目(60603027);;微软亚洲研究院(MSRA)资助
摘    要:目前基于短语的统计机器翻译模型很少将非连续短语的情况考虑在内,由此造成翻译结果在目标语言中的意义变化或缺失。以非连续介词短语为例,提供了一种短语模板抽取算法。首先采用基于规则的方法,抽取出中文非连续介词短语模板,而后借助双语对齐语料和介词_方位词翻译表,获得模板对应的英文翻译。最终形成的双语模板被加入短语翻译表中。在标准测试语料上的对比实验表明,加入非连续短语模板后,译文更加符合语法规范,而翻译结果也取得了相对稳定的提高。

关 键 词:统计机器翻译  短语模板  非连续介词短语  模板抽取  
收稿时间:2008-11-11
修稿时间:2009-02-02

Extraction and Application of Discontinuous Phrase Templates in Statistical Machine Translation
SUN Yue heng,DUAN Nan HOU Yue-xian. Extraction and Application of Discontinuous Phrase Templates in Statistical Machine Translation[J]. Computer Science, 2009, 36(10): 192-196
Authors:SUN Yue heng  DUAN Nan HOU Yue-xian
Affiliation:School of Computer Science and Technology;Tianjin University;Tianjin 300072;China
Abstract:The discontinuous phrases are seldom taken into account in present phrase-based statistical machine translation models,which leads to the distortion or omission of translation results.This paper took discontinuous preposition phrases for example and proposed a phrase template extraction algorithm.It first extracted phrase templates from chinese corpus based on some specified rules,and then got their english translations with a bilingual alignment corpus and a preposition and location-word translation table....
Keywords:Statistical machine translation  Phrase template  Discontinuous preposition phrases  Template extraction  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号