首页 | 本学科首页   官方微博 | 高级检索  
     

基于“松弛尺度”的短语翻译对抽取方法
引用本文:何彦青,周玉,宗成庆,王霞.基于“松弛尺度”的短语翻译对抽取方法[J].中文信息学报,2007,21(5):91-95.
作者姓名:何彦青  周玉  宗成庆  王霞
作者单位:1. 中国科学院 自动化研究所 模式识别国家重点实验室,北京 100080; 2. 诺基亚中国研究中心,北京100013
基金项目:国家自然科学基金;国家高技术研究发展计划(863计划);诺基亚(中国)研究中心合作项目
摘    要:短语对抽取是基于短语统计机器翻译方法的关键技术。当前广泛使用的Och提出的短语对抽取方法,过于依赖词对齐结果,因而只能抽取与词对齐完全相容的短语对。本文给出一种基于“松弛尺度”的短语抽取方法,对不能完全相容的短语对,结合词性标注信息和词典信息来判断是否进行抽取,放松“完全相容”的限制,可以保证为更多的源短语找到目标短语。实验表明,该抽取方法的性能比Och的方法有明显的改善和提高。

关 键 词:人工智能  机器翻译  短语对抽取  统计机器翻译  松弛尺度  
文章编号:1003-0077(2007)05-0091-05
收稿时间:2007-04-12
修稿时间:2007-04-122007-06-25

A Flexible-Scale-Based Method for Phrase Translation Extraction
HE Yan-qing,ZHOU Yu,ZONG Cheng-qing,WANG Xia.A Flexible-Scale-Based Method for Phrase Translation Extraction[J].Journal of Chinese Information Processing,2007,21(5):91-95.
Authors:HE Yan-qing  ZHOU Yu  ZONG Cheng-qing  WANG Xia
Affiliation:1. National Laboratory of Pattern Recognition, Institute of Automation, Chinese Academy of Sciences,
Beijing 100080, China; 2. Nokia Research Center, Beijing 100013, China
Abstract:The phrase translation pair extractions is one of the key techniques in the Phrase-based Statistical Machine Translation.Och's phrase extraction method heavily depends on word alignments,so only the phrase pairs which are fully consistent with the word alignments are extracted.This paper proposes a method of phrase pair extraction with a flexible scale.This method can extract those phrase alignments which Och's method can not obtained.The flexible scale is based on the two features: POS and dictionary information.Our experiments have shown that our method outperforms Och's method significantly.
Keywords:artificial intelligence  machine translation  phrase pair extraction  statistical machine translation  flexible scale
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号