首页 | 本学科首页   官方微博 | 高级检索  
     

基于分层语块分析的统计翻译研究
引用本文:魏玮,杜金华,徐波.基于分层语块分析的统计翻译研究[J].中文信息学报,2007,21(5):87-90.
作者姓名:魏玮  杜金华  徐波
作者单位:1. 中国科学院自动化研究所 数字内容技术研究中心,北京 100080;
2. 中国科学院自动化研究所 模式识别国家重点实验室,北京 100080
基金项目:国家高技术研究发展计划(863计划);富士通合作项目
摘    要:本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识,因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统的解码算法改进了线图分析的CKY算法,融入了线性的N-gram语言模型。目前,本文主要针对中文-英文的口语翻译进行了一系列实验,并以国际口语评测IWSLT(International Workshop on Spoken Language Translation)为标准,在2005年的评测测试集上,BLEU和NIST得分均比统计短语翻译系统有所提高。

关 键 词:人工智能  机器翻译  基于分层语块分析的统计翻译模型  条件随机场  CKY算法  
文章编号:1003-0077(2007)05-0087-04
收稿时间:2007-04-30
修稿时间:2007-04-302007-06-27

Statistical Machine Translation Model Based on Hierarchical Chunking Phrase
WEI Wei,DU Jin-hua,XU Bo.Statistical Machine Translation Model Based on Hierarchical Chunking Phrase[J].Journal of Chinese Information Processing,2007,21(5):87-90.
Authors:WEI Wei  DU Jin-hua  XU Bo
Affiliation:1. Digital Media Content Technology Research Center, Institute of Automation, Chinese Academic
of Sciences, Beijing 100080, China; 2. National Laboratory of Pattern Recognition,
Institute of Automation, Chinese Academic of Sciences, Beijing 100080, China
Abstract:This paper describes a Hierarchical chunking-phrase based(HCPB) statistical translation model.The model not only comply with formal synchronous context-free grammar but also learned partial parsing knowledge using CRF(Conditional Random Fields).Therefore it can be taken as combination of fundamental ideas from both syntax-based translation and phrase-based translation.The decoder for HCPB MT system is based on Chart-CKY algorithm,and integrates N-gram language model effectively.In our benchmark evaluation focusing on Chinese-English spoken language translation.The method achieves higher accuracy in measure of Bleu and NIST score in IWSLT2005.
Keywords:artificial intelligence  machine translation  hierarchical chunking-phrase based SMT  conditional random fields  chart-based CKY algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号