期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也是基于实例机器翻译的难点之一,在这方面也采取了相应的解决方法。没有对翻译句子的连接装配进行更深入的研究,这是因为该翻译策略是用于多翻译引擎系统的,它要与其它翻译策略配合使用,以提高翻译结果的正确率。基于实例的机器翻译需要大量的双语语料库作为翻译时的依据,而人工建设大型语料库费时费力,所以尝试采用计算机进行汉英双语语料库的自动建立,包括篇章对齐和单词级的对齐。相似文献

6.

基于句法的统计机器翻译综述 总被引：1，自引：0，他引：1

熊德意刘群林守勋《中文信息学报》2008,22(2):28-39

本文对基于句法的统计机器翻译进行了综述。按照模型所基于的语法不同,将基于句法的统计机器翻译分为两大类基于形式化语法和基于语言学语法。对这两个不同类别,我们分别介绍它们代表性的工作,包括模型的构建、训练和解码器的设计等,并对比了各个模型的优点和缺点。最后我们对基于句法的统计机器翻译进行了总结,指出设计句法模型时要注意的问题,并对未来的发展趋势进行了预测。相似文献

7.

利用统计搭配模型改进基于实例的机器翻译

刘占一李生刘挺王海峰《软件学报》2012,23(6):1472-1485

基于实例的机器翻译(example-based machine translation,简称EBMT)使用预处理过的双语例句作为主要翻译资源,通过编辑与待翻译句子匹配的翻译实例来生成译文.在EBMT系统中,翻译实例选择及译文选择对系统性能影响较大.提出利用统计搭配模型来增强EBMT系统中翻译实例选择及译文选择的能力,提高译文质量.首先,使用单语统计词对齐从单语语料中训练统计搭配模型.然后,利用该模型从3个方面提高EBMT的性能:(1)利用统计搭配模型估计待翻译句子与翻译实例之间的匹配度,从而增强系统的翻译实例选择能力;(2)通过引入候选译文与上下文之间搭配强度的估计来提高译文选择能力;(3)使用统计搭配模型检测翻译实例中被替换词的搭配词,同时根据新的替换词及上下文对搭配词进行矫正,进一步提高EBMT系统的译文质量.为了验证所提出的方法,在基于词的EBMT系统上评价了英汉翻译的译文质量.与基线系统相比,所提出的方法使译文的BLEU得分提高了4.73～6.48个百分点.在半结构化的EBMT系统上进一步检验了基于统计搭配模型的译文选择方法,从实验结果来看,该方法使译文的BLEU得分提高了1.82个百分点.同时,人工评价结果显示,改进后的半结构化EBMT系统的译文能够表达原文的大部分信息,并且具有较高的流利度. 相似文献

8.

机器翻译与新的语法理论 总被引：3，自引：0，他引：3

黄昌宁《中国计算机用户》1989,(9):32-36

相似文献

9.

基于翻译规则的统计机器翻译

刘颖姜巍《计算机科学》2013,40(2):214-217

扩展HMM模型可以解决词语对齐结果与句法约束冲突,从而更好地进行词语对齐。在短语对齐基础上利用目标语言的短语结构树抽取翻译规则。采用扩展CYK算法CYKA+作为系统的解码器,该算法可以处理非乔姆斯基范式的翻译规则;采用两轮解码算法在解码过程中整合语言模型。实验表明,与传统词语对齐模型相比,改进的 HMM词语对齐模型具有更高的对齐准确率,并且翻译结果的BLEU评测得分更高。采用翻译规则的系统在不同数据集上具有更稳定的翻译结果。两轮解码算法与立方剪枝算法具有相近的解码质量,但前者解码速度更快。相似文献

10.

一种基于规则转换的机器翻译方法初探

王荣波周昌乐池哲儒《计算机工程与应用》2004,40(30):97-101,135

机器翻译(MachineTranslation,简称MT)是21世纪科技领域的一个难题之一,而要实现机器翻译,对自然语言进行形式化是核心。机器翻译的突破依赖于语言学研究的突破。该文介绍一种汉语句子形式化的方法。涉及的内容包括Montague语法,范畴语法,内涵逻辑,汉语语法等。该文主要在理论上进行了探讨,并用例子进行详细说明该汉语句子形式化方法在英汉机器翻译中的应用。结果表明,该方法具有一定的有效性。相似文献

11.

依存句法语言模型对短语统计机器翻译性能的影响

董人菘王华张晓钟余正涛张涛《计算机科学》2014,41(2):99-101

为提高汉-英统计机器翻译的翻译效果,提出一个基于依存句法关系的语言模型,在较成熟的基于短语翻译的统计特征下,对解码产生的NBEST候选翻译结果进行进一步约束,重新计算得分,调整NBEST候选翻译序列,以得到最佳翻译。实验以"Pharaoh"为比较基准,以500句汉英句对为测试集,最终的实验结果表明,提出的基于依存句法关系的语言模型可以在一定程度上提高汉-英统计机器翻译最佳翻译的正确率。相似文献

12.

规则与实例相结合的公文标题汉英机器翻译系统

邵建国《办公自动化》2010,(2):36-38

随着我国对外开放的不断深入,越来越多的外国朋友希望了解中国的方针政策,而公文是贯彻执行我国方针政策的有力工具,标题作为公文的一大要素,起着点明主题的作用。因此,在信息公开化不断发展的今天,政府网站或公报不仅需要刊载中文版的信息,而且有必要刊载英文版的。鉴于行政机关法定公文标题格式固定、要素稳定的特点,本文基于自建小型公文标题语料库,经分析得出公文标题的表达式和10个词表,然后结合实例,设计一公文标题翻译系统。这只是行政机关公文翻译系统的初步探索,希望能为减轻文秘人员的工作负担、最终实现公文的语言自由转换提供一点帮助。相似文献

13.

一个基于范例推理的机器翻译系统 总被引：4，自引：0，他引：4

屈刚孔骏陆汝占《计算机工程》2000,26(10)

介绍了一个基于范例推理的机器翻译系统。对其核心部分范例搜索作了深入的分析。提出的新的相似度量准则使系统在保证翻译覆盖率的前提下提高了翻译的准确度,而含有抽象范例的范例库和递归抽象搜索算法提高了系统的时间效率。相似文献

14.

面向对象技术的机器翻译系统的设计与实现 总被引：1，自引：0，他引：1

朱跃龙王勇濮淼清濮伯泉《计算机工程》2001,27(11):47-49

在分析以往机器翻译系统的基础上,针对以信息提取为目的的机器翻译系统在行业内的应用提出了一个基于面向对象技术（OOT）的机器翻译系统的模型,并在文中给出了该模型的面向对象描述,利用该模型可以快速建立灵活的机器翻译系统。相似文献

15.

班智达汉藏公文翻译系统中基于二分法的句法分析方法研究 总被引：3，自引：0，他引：3

才藏太华关加《中文信息学报》2005,19(6):9-14

机器翻译系统是一种典型的自然语言处理系统,语言技术是机器翻译系统中居于核心地位的技术。本文结合863 项目《班智达汉藏公文机器翻译系统》的研制实践,论述了词项信息同语法规则相结合的原则,提出了以动词为中心的句法分析二分法,从而在受限语言的范围内,为建立有较大适应性的机器翻译规则系统,有效地提高机器翻译语法分析的效率提供了有益的方法。相似文献

16.

基于实例的汉蒙机器翻译

侯宏旭刘群那顺乌日图《中文信息学报》2007,21(4):65-72

本文通过对汉蒙机器翻译方法的研究,给出了一种基于实例的汉蒙机器翻译方法,并加以了实现。本文给出了用于汉蒙EBMT机器翻译的实例搜索以及短语片段划分、匹配、组合的方法。本文给出的方法是基于词语对齐的,利用词语对齐进行词语的匹配,并根据匹配词数和长度计算相似度,选取最好的实例。通过对齐信息,确定片段组合的策略,生成翻译结果。通过对方法的实现和实验,完成了一个基于实例的汉蒙机器翻译系统。相似文献

17.

基于句法调序的汉维统计机器翻译

下载免费PDF全文

陈丽娟张恒董兴华吐尔洪·吾司曼周俊林《计算机工程》2012,38(3):169-171,175

在汉语到维语的统计机器翻译中,2种语言在形态学及语序上差异较大,导致未知词较多,且产生的维语译文语序混乱。针对上述问题,在对汉语和维语的语序进行研究的基础上,提出一种汉语句法调序方法,进而对维语进行形态学分析,采用基于因素的统计机器翻译系统进行验证。实验结果证明,该方法在性能上较基线系统有显著改进,BLEU评分由15.72提高到19.17。相似文献

18.

一种人机互动的多策略机器翻译系统IHSMTS的设计与实现原理 总被引：5，自引：3，他引：5

黄河燕陈肇雄宋继平《中文信息学报》1999,13(5):44-51

现有单一策略的机器翻译系统很难有效地解决机器翻译所面临的所有问题。本文,提出一种基于人机交互互动的多策略机器翻译系统设计方法,该方法把基于多知识一体化描述的规则推理、基于经验记忆的类比启发式搜索推理和基于统计知识的概率方法及适当程度的人机交互有机地结合起来,利用现有基于规则的智能机器翻译系统自动产生具有各种特征知识的特征事例模式库,从而既可以通过与以往翻译实例的类比启发式搜索有效地利用以往系统成功的句子分析经验解决相似句子的分析,同时对特征事例模式库中没有相似实例的句子,又可以利用原有基于规则的方法和统计概率方法进行翻译转换处理,并在系统本身的知识不足以解决所遇到的多义区分问题时适时由人介入,从而可以大提高系统的翻译速度和翻译准确率,增强系统的实用性。相似文献

19.

Generate and Repair Machine Translation

Kanlaya Naruedomkul & Nick Cercone 《Computational Intelligence》2002,18(3):254-269

We propose Generate and Repair Machine Translation (GRMT), a constraint–based approach to machine translation that focuses on accurate translation output. GRMT performs the translation by generating a Translation Candidate (TC), verifying the syntax and semantics of the TC and repairing the TC when required. GRMT comprises three modules: Analysis Lite Machine Translation (ALMT), Translation Candidate Evaluation (TCE) and Repair and Iterate (RI). The key features of GRMT are simplicity, modularity, extendibility, and multilinguality.
An English–Thai translation system has been implemented to illustrate the performance of GRMT. The system has been developed and run under SWI–Prolog 3.2.8. The English and Thai grammars have been developed based on Head–Driven Phrase Structure Grammar (HPSG) and implemented on the Attribute Logic Engine (ALE). GRMT was tested to generate the translations for a number of sentences/phrases. Examples are provided throughout the article to illustrate how GRMT performs the translation process. 相似文献