首页 | 本学科首页   官方微博 | 高级检索  
     

一种面向汉英口语翻译的双语语块处理方法
引用本文:程葳,赵军,徐波,刘非凡.一种面向汉英口语翻译的双语语块处理方法[J].中文信息学报,2003,17(2):22-28.
作者姓名:程葳  赵军  徐波  刘非凡
作者单位:中国科学院自动化研究所模式识别国家重点实验室
基金项目:国家“973”项目 (G19980 30 5 0 1A - 0 6 ),国家自然科学基金重点资助项目 (6 9835 0 0 3),国家自然科学基金资助项目 (6 0 2 72 0 4 1)
摘    要:基于语块的处理方法是近年来自然语言处理领域兴起的一条新思路。但是,要将其应用于口语翻译当中,还需按照口语特点对涉及双语的语块概念做出合理界定。本文在已有单语语块定义的基础上,根据中、英文差异和口语翻译特性,从句法和语义两个层次提出了一种汉英双语语块概念,并对其特点进行了分析。同时,针对中、英文并行语料库,建立了一套计算机自动划分与人工校对相结合的双语语块加工方法。应用该方法,对汉英句子级对齐的口语语料进行双语语块划分和对整,并以此为基础进行了基于双语语块的口语统计机器翻译实验。结果表明,本文提出的双语语块定义符合口语翻译的实际需要,使用基于双语语块的语料处理方法,能有效地提高口语系统的翻译性能。

关 键 词:人工智能  机器翻译  统计机器翻译  口语翻译  语料库  语块  
文章编号:1003-0077(2003)02-0021-07
修稿时间:2002年8月16日

Bilingual Chunking for Chinese - English Spoken - language Translation
CHENG Wei,ZHAO Jun,XU Bo,LIU Fei-fan.Bilingual Chunking for Chinese - English Spoken - language Translation[J].Journal of Chinese Information Processing,2003,17(2):22-28.
Authors:CHENG Wei  ZHAO Jun  XU Bo  LIU Fei-fan
Affiliation:National Laboratory of Pattern Recognition, Institute of Automation, Chinese Academy of Sciences
Abstract:Chunking is a useful step for natural language processing.The paper puts forward a definition of bilingual chunks for Chinese-English spoken-language translation,based on both the characteristics of spoken-language and the differences between Chinese and English.Some special features of these chunks are also analyzed.Based on the definition and analysis,a method is proposed to segment the chunks in bilingual corpora.This method includes two steps of the automatic chunking and the manually modification.Using this method we got a chunk-aligned Chinese-English bilingual corpus.A series of chunk-based statistical machine translation experiments are then conducted which shows that the proposed definition and the bi-chunking method can lead to great improvement to the quality of the Chinese-English spoken-language translation.
Keywords:artificial intelligence  machine translation  statistical machine translation  spoken-language translation  corpora  chunk
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号