首页 | 本学科首页   官方微博 | 高级检索  
     

基于短语相似度的统计机器翻译模型
引用本文:何中军,刘群,林守勋. 基于短语相似度的统计机器翻译模型[J]. 高技术通讯, 2009, 19(4). DOI: 10.3772/j.issn.1002-0470.2009.04.002
作者姓名:何中军  刘群  林守勋
作者单位:中国科学院研究生院,北京,100049;中国科学院计算技术研究所中国科学院智能信息处理重点实验室,北京,100190
基金项目:国家高技术研究发展计划(863计划),国家自然科学基金 
摘    要:针对基于短语的统计机器翻译(SMT)模型中由于采用精确匹配策略导致的短语稀疏问题,提出了一种基于短语相似度的统计机器翻译模型.该模型将基于实例的翻译方法引入到统计机器翻译中.翻译时,对于训练语料库中未出现过的短语,通过计算源语言短语之间的相似度,采用模糊匹配策略从短语表中查找相似的实例短语,并根据实例短语为其构造翻译.与精确匹配策略相比,利用相似度进行模糊匹配增加了对短语表的利用程度,缓解了短语稀疏问题.实验表明,该模型能够明显地提高统计机器翻译的质量,效果超过了当前最好的短语系统"摩西(Moses)".

关 键 词:相似度  基于短语的统计机器翻译  基于实例的机器翻译

A phrase similarity-based model for statistical machine translation
He Zhongjun,Liu Qun,Lin Shouxun. A phrase similarity-based model for statistical machine translation[J]. High Technology Letters, 2009, 19(4). DOI: 10.3772/j.issn.1002-0470.2009.04.002
Authors:He Zhongjun  Liu Qun  Lin Shouxun
Affiliation:He Zhongjun~(* **) Liu Qun~* Lin Shouxun~*(* Key Laboratory of Intelligent Information Processing,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190)(** Graduate University of Chinese Academy of Sciences,Beijing 100049)
Abstract:In consideration of the phrase sparseness problem caused by the exact matching strategy in phrase-based statistical machine translation(SMT)models,the paper presents a phrase similarity-based SMT model .The model introduces the example-based method into SMT.During decoding,when facing source phrases which do not appear in the training cor- pus,the model firstly computes the similarity between source phrases and finds similar examples from the phrase table by fuzzy matching.Then the model produces translatio...
Keywords:similarity  phrase-based statistical machine translation  example-based machine translation  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号