首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 734 毫秒
1.
上一讲谈了词、语的翻译,接下来自然应该谈句子的翻译。把一个英语句子翻译成汉语,往往要变更原文的结构。我们在第五讲就提到过,这种变更结构的技巧,俗称"拆句"。关于拆句问题,我们打算分两次讲。为什么搞翻译要"拆句"?因为英语和汉语在句法结构上差异很大。这种差异,主要表现在英语重形合(hypotaxis),汉语重意合(parataxis)。英语句子内部的各个意群、各种成分往往是用适当的连词和介词来沟通或者结合的;此外,英语有所谓动词的非限定形式,如不定式、分词、动名词等等,它们组合在一起,形成各种修饰关系和饱孕关系。因此,英语句子结构严密,缺乏弹性,可以添枝加叶,安排得很长。汉语句子就不同,它内部的各个意群、各种成分往往是通过某种  相似文献   

2.
在前几讲中,我们指出,翻译有三种基本技巧:转化、增添和删减。在这三种基本技巧中,最重要的是转化。关于"转化",我们说过,归纳起来大致有五个方面:诃性的替换,语、句结构的变更,标点符号的改动,意义的归并与分解,风格情调(包括语体)的转易。这些基本技巧的运用,我们已经通过实例作了概括性的说明。一位很细心的读者对我们说:在前几讲所举的实例中,你们仅仅谈了"转化"的前四个方面,却没有解释什么叫做"风格情调的转易"。这位读者的话可以说又  相似文献   

3.
一种基于实例的汉英机器翻译策略   总被引:3,自引:0,他引:3  
介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也是基于实例机器翻译的难点之一,在这方面也采取了相应的解决方法。没有对翻译句子的连接装配进行更深入的研究,这是因为该翻译策略是用于多翻译引擎系统的,它要与其它翻译策略配合使用,以提高翻译结果的正确率。基于实例的机器翻译需要大量的双语语料库作为翻译时的依据,而人工建设大型语料库费时费力,所以尝试采用计算机进行汉英双语语料库的自动建立,包括篇章对齐和单词级的对齐。  相似文献   

4.
基于自动句对齐的相似古文句子检索   总被引:3,自引:0,他引:3  
郭锐  宋继华  廖敏 《中文信息学报》2008,22(2):87-91,105
随着语料库语言学的兴起,基于实例的机器翻译(EBMT)得到越来越多的研究。如何快速准确地构建大规模古今汉语平行语料库,以及从大量的对齐实例(句子级)中检索和输入句子最相似的源句子是基于实例的古今汉语机器翻译必须解决的问题。本文综合考虑句子长度、汉字字形、标点符号三个因素提出了古今汉语句子互译模型,基于遗传算法、动态规划算法实现了古今汉语的自动句对齐。接着为古文句子建立全文索引,基于汉字的信息熵,本文设计与实现一种高效的最相似古文句子检索算法。最后给出了自动句对齐和最相似古文句子检索的实验结果。  相似文献   

5.
我们已经花了十讲的篇幅讨论翻译的标准和技巧问题。我们举办这个讲座,当然不是为了单纯地研究翻译理论,我们的目的是要帮助经验缺乏的同志解决他们在翻译实践中碰到的一些问题。但是,没有理论的指导,没有理论的归纳,实践就难免带有盲目性。因此,花十讲的篇幅,针对自动化仪表专业的实际提纲挈领地谈一点理论,还是很有必要的。  相似文献   

6.
自动翻译     
当前计算机已经有许多文句翻译系统超越了词对词的简单翻译阶段。但是,其中还没有一个系统能完全摆脱人的干预。实际上要正确地翻译一个句子,需要分析它的结构,识别句中各词的词义,甚至还需要了解该句的使用语境。只有具备一定推理能力的系统,才能成功地执行这些任务。从现在起语言工作者和计算机工作者应该努力使计算机具有这种能力。语言中的各种各样现象成了当今进行的人工智能研究的最好试验场地之一。  相似文献   

7.
基于词类串的汉语句子结构相似度计算方法   总被引:9,自引:1,他引:9  
句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的汉英机器翻译研究,汉语句子相似度衡量的准确性,直接影响到最后翻译结果的输出。本文提出了一种汉语句子结构相似性的计算方法。该方法比较两个句子的词类信息串,进行最优匹配,得到一个结构相似性的值。在小句子集上的初步实验结果表明,该方法可行,有效,符合人的直观判断。  相似文献   

8.
在基于实例的机器翻译(Example—Based Machine Translation,简称EBMT)中,实例的相似性判断是关键,它直接关系到EBMT本身的翻译质量。本文根据汉英EBMT的具体要求,基于模式方法进行汉语句子相似性判断。  相似文献   

9.
多策略汉日机器翻译系统中的核心技术研究   总被引:1,自引:0,他引:1  
多策略的机器翻译是当今机器翻译系统的一个发展方向。该文论述了一个多策略的汉日机器翻译系统中各翻译核心子系统所使用的核心技术和算法,其中包含了使用词法分析、句法分析和语义角色标注的汉语分析子系统、利用双重索引技术的基于翻译记忆技术的机器翻译子系统、以句法树片段为模板的基于实例模式的机器翻译子系统以及综合了配价模式和断段分析的机器翻译子系统。翻译记忆子系统的测试结果表明其具有高效的特性;实例模式子系统在1 559个句子的封闭测试中达到99%的准确率,在1 500个句子的开放测试中达到85%的准确率;配价模式子系统在3 059个句子的测试中达到了89%的准确率。  相似文献   

10.
我们在上一讲里,通过一段文字的翻译,说明词、语意义的正确理解是翻译的必要条件。我们着重指出:应该站在整体的高度来理解一词一语的意义。然而,这只是问题的一方面。在正确理解词、语意义的同时,还必须搞清楚句子的干和枝的关系。举一个不算十分贴切的比喻:词、语好比血肉,句子结构好比骨骼。没有骨骼支撑的血肉,不过是毫无意义的模糊一团;搭接错误的骨骼,则破坏或歪曲了完美的有机整体。总之,没有搞清楚原文的词语意义和句子结构,就谈不上正确理解,而正确理解是翻译的基础,这一点务必切记。但是,正确理解之后,还要充分表达。在"充  相似文献   

11.
这个讲座从开始到现在,已经刊登了十七讲.在这十七讲中,我们比较详细地讲述了翻译的基本理论和基本技巧,还讲述了一些应该注意的问题以及不同文体的处理方法.可以说,有关科技翻译(具体地说就是自动化仪表文献资料的翻译)的关键问题都谈过了.这一讲是最后一讲.在这一讲里,我们要探讨这样的问题:一个翻译者应该  相似文献   

12.
伪平行句对抽取是缓解汉-越低资源机器翻译中数据稀缺问题的关键任务,同时也是提升机器翻译性能的重要手段。传统的伪平行句对抽取方法都是基于语义相似性度量,但是传统基于深度学习框架的语义表征方法没有考虑不同词语语义表征的难易程度,因此导致句子语义信息不充分,提取到的句子质量不高,噪声比较大。针对此问题,该文提出了一个双向长短期记忆网络加语义自适应编码的语义表征网络框架,根据句子中单词表征难易的不确定性,引导模型使用更深层次的计算。具体思路为: 首先,对汉语和越南语句子进行编码,基于句子中单词语义表征的难易程度,自适应地进行表征,深度挖掘句子中不同单词的语义信息,实现对汉语和越南语句子的深度表征;然后,在解码端将深度表征的向量映射到统一的公共语义空间中,最大化表示句子之间的语义相似度,从而提取更高质量的汉-越伪平行句子。实验结果表明,相比于基线模型,该文提出的方法在F1得分上提升5.09%,同时将提取到的句子对用于训练机器翻译模型,实验结果表明翻译性能的显著提升。  相似文献   

13.
上一讲里,我们介绍了从控制图求逻辑式的原则和几个实例。那末,求逻辑式这个过程是不是必不可少的呢?我们已经讲过,在大多数情况下,必须先求出逻辑式,进而实现控制,但是如果我们用某些设备和元件实现控制,也可以越过求逻辑式这个阶段。这就是这一讲里所要介绍的用控制图直接实现控制的几种方法。  相似文献   

14.
多策略机器翻译系统IHSMTS中实例模式泛化匹配算法   总被引:1,自引:1,他引:1  
基于精确匹配的EBMT,由于翻译覆盖率过低,导致其难以大规模实际应用。本文提出一种实例模式泛化匹配算法,试图改善EBMT的翻译覆盖率:以输入的待翻译句子为目标导向,对候选翻译实例有针对性地进行实时泛化,使得算法既能满足实时文档翻译对速度的要求,又能充分利用系统使用过程中用户新添加和修改的翻译知识,从而总体上提高了系统的翻译覆盖率和翻译质量。实验结果表明,在语料规模为16 万句对的情况下,系统翻译覆盖率达到了75 %左右,充分说明了本文算法的有效性。  相似文献   

15.
篇章机器翻译的首要问题是确定翻译单位。基于汉语和英语的语言知识和英汉翻译的实践,该文提出面向篇章机器翻译的基本单位和复合单位的双层单位体系,讨论了这两种单位支持篇章翻译应满足的性质,并据此勾画了篇章机器翻译的拆分、翻译、装配三步模型(PTA模型)。该文提出,汉语篇章机器翻译的复合单位为广义话题结构对应的文本块,基本单位则是根据广义话题结构流水模型得到的话题自足句;英语篇章机器翻译的复合单位为句号句,基本单位为naming-telling小句(NT小句),即指称性成分加上对它的陈述或后修饰成分所构成的小句。该文展示了在这样的翻译单位体系下采用PTA模型的英汉翻译过程实例,规划了面向篇章翻译的英汉小句对齐语料库的建设任务,讨论了PTA模型的可行性。
  相似文献   

16.
句子相似度的动态规划求解及改进   总被引:2,自引:1,他引:2  
基于例子的机器翻译,其很关键的步骤之一就是如何从语料库中找到待译句子的最佳相似句。论文针对这个问题提出了利用动态规划方法基于句子相似矩阵进行求解的方法。根据这个方法就可以从语料库中为待译句子找到最佳相似句,同时在求解过程中还做了一些改进:利用矩阵分块求解的方法保留了句子的连续相似块,保证了结果的质量,对提高EBMT系统的翻译质量起到了一定的促进作用。  相似文献   

17.
实例匹配是基于实例的机器翻译(Exanlple_Based Machine Translation,简称EBMT)系统实现的关键,它直接关系到EBMT系统本身的翻译质量。在基于模式的实例匹配方法中,模式的构造是基础。依据“谓词(或特殊词) 常见搭配成分”的形式构造汉语中常见的句子模式,并应用于汉英EBMT中的相似实例匹配。该模式构造方法可以有效地提高当前汉英EBMT系统的实现效率与准确率。  相似文献   

18.
基于译文的英汉双语句子自动对齐   总被引:5,自引:0,他引:5  
双语语料库的自动对齐已成为机器翻译研究中的一个重要研究课题。目前的句子对齐方法有基于长度的方法和基于词汇的方法,该文先分析了基于长度的方法,然后提出了基于译文的方法:通过使用一部翻译较完整的词典作为桥梁,把英汉句子之间的对应关系连接起来。根据英语文本中的单词,在词典中找到其对应的译文,并以译文到汉语句子中去匹配,根据评价函数和动态规则算法找到对齐句对,实验结果证明这种对齐方法消除了基于长度做法中错  相似文献   

19.
基于译文的英汉双语句子自动对齐   总被引:1,自引:0,他引:1  
本文利用英汉互译译文间的内在联系,提出了基于译文的方法,通过使用一部翻译较完整的词典作为桥梁,将英汉句子间的对应关系连结起来,根据英语文本中的单词,在词典中找其对应的译文,并以译文到汉语句子中去匹配,根据评价函数和动态规划算法找到对齐句对,实验结果证明这种对齐方法消除了基于长度做法中错误蔓延的情况。并且普遍适用于任何文本,它大大地提高了对齐的精度,其效果是令人满意的。  相似文献   

20.
统计机器翻译中短语切分的新方法   总被引:1,自引:0,他引:1  
基于短语的统计机器翻译是目前主流的一种统计机器翻译方法,但是目前基于短语的翻译系统都没有对短语切分作专门处理,认为一个句子的所有短语切分都是等概率的。本文提出了一种短语切分方法,将句子的短语切分概率化: 首先,识别出汉语语料库中所有出现次数大于2次的词语串,将其作为汉语短语; 其次,用最短路径方法进行短语切分,并利用Viterbi算法迭代统计短语的出现频率。在2005年863汉英机器翻译评测测试集上的实验结果(BLEU4)是: 0.1764(篇章),0.2231(对话)。实验表明,对于长句子(如篇章),短语切分模型的加入有助于提高翻译质量,比原来约提高了0.5个百分点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号