首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基于实例的机器翻译处理方法   总被引:11,自引:0,他引:11  
杨宪泽 《计算机工程》2003,29(21):51-52,135
在机器翻译的研究中,基于实例是一种很好的方法。文章讨论了完全实例的机器翻译、实例句型转换的机器翻译以及实例近似机器翻译。  相似文献   

2.
英汉机器翻译技术能够完成英文与汉文的实时翻译,国内外对英汉机器翻译技术做了大量研究和实验。首先简要介绍了英汉机器翻译的研究状况,对已存在的2种英汉机器翻译技术进行研究分析,为英汉机器翻译技术的进一步发展提供了一定的理论依据。  相似文献   

3.
机器翻译研究现状与展望   总被引:5,自引:0,他引:5  
本文回顾机器翻译研究的历史,介绍典型的机器翻译方法,包括:基于规划、基于统计以及基于实例的机器翻译方法;针对机器翻译的研究现状,详细介绍和分析了基于混合策略的机器翻译方法,对统计以及机器学习方法在机器翻译中的应用进行了描述;论文还介绍了当前机器翻译评测技术;最后对机器翻译进行总结和展望。  相似文献   

4.
机器翻译是应用计算机实现从一种自然语言文本到另一种自然语言文本的翻译,是自然语言处理研究领域的一个分支。本文就现行机器翻译面临的问题,讨论基于实例的机器翻译方法及其优化策略。  相似文献   

5.
一种基于实例的汉英机器翻译策略   总被引:3,自引:0,他引:3  
介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也是基于实例机器翻译的难点之一,在这方面也采取了相应的解决方法。没有对翻译句子的连接装配进行更深入的研究,这是因为该翻译策略是用于多翻译引擎系统的,它要与其它翻译策略配合使用,以提高翻译结果的正确率。基于实例的机器翻译需要大量的双语语料库作为翻译时的依据,而人工建设大型语料库费时费力,所以尝试采用计算机进行汉英双语语料库的自动建立,包括篇章对齐和单词级的对齐。  相似文献   

6.
基于句法的统计机器翻译综述   总被引:1,自引:0,他引:1  
本文对基于句法的统计机器翻译进行了综述。按照模型所基于的语法不同,将基于句法的统计机器翻译分为两大类 基于形式化语法和基于语言学语法。对这两个不同类别,我们分别介绍它们代表性的工作,包括模型的构建、训练和解码器的设计等,并对比了各个模型的优点和缺点。最后我们对基于句法的统计机器翻译进行了总结,指出设计句法模型时要注意的问题,并对未来的发展趋势进行了预测。  相似文献   

7.
刘占一  李生  刘挺  王海峰 《软件学报》2012,23(6):1472-1485
基于实例的机器翻译(example-based machine translation,简称EBMT)使用预处理过的双语例句作为主要翻译资源,通过编辑与待翻译句子匹配的翻译实例来生成译文.在EBMT系统中,翻译实例选择及译文选择对系统性能影响较大.提出利用统计搭配模型来增强EBMT系统中翻译实例选择及译文选择的能力,提高译文质量.首先,使用单语统计词对齐从单语语料中训练统计搭配模型.然后,利用该模型从3个方面提高EBMT的性能:(1)利用统计搭配模型估计待翻译句子与翻译实例之间的匹配度,从而增强系统的翻译实例选择能力;(2)通过引入候选译文与上下文之间搭配强度的估计来提高译文选择能力;(3)使用统计搭配模型检测翻译实例中被替换词的搭配词,同时根据新的替换词及上下文对搭配词进行矫正,进一步提高EBMT系统的译文质量.为了验证所提出的方法,在基于词的EBMT系统上评价了英汉翻译的译文质量.与基线系统相比,所提出的方法使译文的BLEU得分提高了4.73~6.48个百分点.在半结构化的EBMT系统上进一步检验了基于统计搭配模型的译文选择方法,从实验结果来看,该方法使译文的BLEU得分提高了1.82个百分点.同时,人工评价结果显示,改进后的半结构化EBMT系统的译文能够表达原文的大部分信息,并且具有较高的流利度.  相似文献   

8.
机器翻译与新的语法理论   总被引:3,自引:0,他引:3  
  相似文献   

9.
刘颖  姜巍 《计算机科学》2013,40(2):214-217
扩展HMM模型可以解决词语对齐结果与句法约束冲突,从而更好地进行词语对齐。在短语对齐基础上利 用目标语言的短语结构树抽取翻译规则。采用扩展CYK算法CYKA+作为系统的解码器,该算法可以处理非乔姆 斯基范式的翻译规则;采用两轮解码算法在解码过程中整合语言模型。实验表明,与传统词语对齐模型相比,改进的 HMM词语对齐模型具有更高的对齐准确率,并且翻译结果的BLEU评测得分更高。采用翻译规则的系统在不同数 据集上具有更稳定的翻译结果。两轮解码算法与立方剪枝算法具有相近的解码质量,但前者解码速度更快。  相似文献   

10.
机器翻译(MachineTranslation,简称MT)是21世纪科技领域的一个难题之一,而要实现机器翻译,对自然语言进行形式化是核心。机器翻译的突破依赖于语言学研究的突破。该文介绍一种汉语句子形式化的方法。涉及的内容包括Montague语法,范畴语法,内涵逻辑,汉语语法等。该文主要在理论上进行了探讨,并用例子进行详细说明该汉语句子形式化方法在英汉机器翻译中的应用。结果表明,该方法具有一定的有效性。  相似文献   

11.
为提高汉-英统计机器翻译的翻译效果,提出一个基于依存句法关系的语言模型,在较成熟的基于短语翻译的统计特征下,对解码产生的NBEST候选翻译结果进行进一步约束,重新计算得分,调整NBEST候选翻译序列,以得到最佳翻译。实验以"Pharaoh"为比较基准,以500句汉英句对为测试集,最终的实验结果表明,提出的基于依存句法关系的语言模型可以在一定程度上提高汉-英统计机器翻译最佳翻译的正确率。  相似文献   

12.
随着我国对外开放的不断深入,越来越多的外国朋友希望了解中国的方针政策,而公文是贯彻执行我国方针政策的有力工具,标题作为公文的一大要素,起着点明主题的作用。因此,在信息公开化不断发展的今天,政府网站或公报不仅需要刊载中文版的信息,而且有必要刊载英文版的。鉴于行政机关法定公文标题格式固定、要素稳定的特点,本文基于自建小型公文标题语料库,经分析得出公文标题的表达式和10个词表,然后结合实例,设计一公文标题翻译系统。这只是行政机关公文翻译系统的初步探索,希望能为减轻文秘人员的工作负担、最终实现公文的语言自由转换提供一点帮助。  相似文献   

13.
一个基于范例推理的机器翻译系统   总被引:4,自引:0,他引:4  
介绍了一个基于范例推理的机器翻译系统。对其核心部分范例搜索作了深入的分析。提出的新的相似度量准则使系统在保证翻译覆盖率的前提下提高了翻译的准确度,而含有抽象范例的范例库和递归抽象搜索算法提高了系统的时间效率。  相似文献   

14.
面向对象技术的机器翻译系统的设计与实现   总被引:1,自引:0,他引:1  
在分析以往机器翻译系统的基础上,针对以信息提取为目的的机器翻译系统在行业内的应用提出了一个基于面向对象技术(OOT)的机器翻译系统的模型,并在文中给出了该模型的面向对象描述,利用该模型可以快速建立灵活的机器翻译系统。  相似文献   

15.
机器翻译系统是一种典型的自然语言处理系统,语言技术是机器翻译系统中居于核心地位的技术。本文结合863 项目《班智达汉藏公文机器翻译系统》的研制实践,论述了词项信息同语法规则相结合的原则,提出了以动词为中心的句法分析二分法,从而在受限语言的范围内,为建立有较大适应性的机器翻译规则系统,有效地提高机器翻译语法分析的效率提供了有益的方法。  相似文献   

16.
本文通过对汉蒙机器翻译方法的研究,给出了一种基于实例的汉蒙机器翻译方法,并加以了实现。本文给出了用于汉蒙EBMT机器翻译的实例搜索以及短语片段划分、匹配、组合的方法。本文给出的方法是基于词语对齐的,利用词语对齐进行词语的匹配,并根据匹配词数和长度计算相似度,选取最好的实例。通过对齐信息,确定片段组合的策略,生成翻译结果。通过对方法的实现和实验,完成了一个基于实例的汉蒙机器翻译系统。  相似文献   

17.
在汉语到维语的统计机器翻译中,2种语言在形态学及语序上差异较大,导致未知词较多,且产生的维语译文语序混乱。针对上述问题,在对汉语和维语的语序进行研究的基础上,提出一种汉语句法调序方法,进而对维语进行形态学分析,采用基于因素的统计机器翻译系统进行验证。实验结果证明,该方法在性能上较基线系统有显著改进,BLEU评分由15.72提高到19.17。  相似文献   

18.
现有单一策略的机器翻译系统很难有效地解决机器翻译所面临的所有问题。本文,提出一种基于人机交互互动的多策略机器翻译系统设计方法,该方法把基于多知识一体化描述的规则推理、基于经验记忆的类比启发式搜索推理和基于统计知识的概率方法及适当程度的人机交互有机地结合起来,利用现有基于规则的智能机器翻译系统自动产生具有各种特征知识的特征事例模式库,从而既可以通过与以往翻译实例的类比启发式搜索有效地利用以往系统成功的句子分析经验解决相似句子的分析,同时对特征事例模式库中没有相似实例的句子,又可以利用原有基于规则的方法和统计概率方法进行翻译转换处理,并在系统本身的知识不足以解决所遇到的多义区分问题时适时由人介入,从而可以大提高系统的翻译速度和翻译准确率,增强系统的实用性。  相似文献   

19.
We propose Generate and Repair Machine Translation (GRMT), a constraint–based approach to machine translation that focuses on accurate translation output. GRMT performs the translation by generating a Translation Candidate (TC), verifying the syntax and semantics of the TC and repairing the TC when required. GRMT comprises three modules: Analysis Lite Machine Translation (ALMT), Translation Candidate Evaluation (TCE) and Repair and Iterate (RI). The key features of GRMT are simplicity, modularity, extendibility, and multilinguality.
An English–Thai translation system has been implemented to illustrate the performance of GRMT. The system has been developed and run under SWI–Prolog 3.2.8. The English and Thai grammars have been developed based on Head–Driven Phrase Structure Grammar (HPSG) and implemented on the Attribute Logic Engine (ALE). GRMT was tested to generate the translations for a number of sentences/phrases. Examples are provided throughout the article to illustrate how GRMT performs the translation process.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号