首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
近几年来,基于短语的统计翻译模型在机器翻译研究中受到普遍关注,并取得了较好的翻译性能。但是,由于目前基于短语的翻译系统在解码时采用精确匹配的策略,常常导致数据稀疏,一方面,有些短语在训练获得的短语表中找不到精确的匹配,使其成为未知短语;另一方面,短语表中大量的短语无法得到充分的利用。为此,我们提出了基于短语模糊匹配和句子扩展的翻译方法。对于不存在于短语表中的短语,通过模糊匹配的办法,寻找与其相似的短语,然后将所有相似短语用于替换原短语,从而生成扩展句子,在此基础上对所有扩展的句子进行翻译。由于并不是所有扩展后的句子都能提高原始句子的翻译效果,因此,我们在句子翻译完成后设置了组合分类器用于选择最优翻译结果。实验证明,这种方法可以有效地提高翻译系统的译文质量。  相似文献   

2.
机器翻译是对人工翻译的模拟.但是由于不同语言之间历史文化、风俗习惯等因素存在固有差异,所以相同的文字时常在不同环境下表达的意义不同,这使得机器翻译实现十分困难.独词句是语言学上的一种特殊的句型.独词句需要根据上下文环境来判断它的"句义",而不仅仅是它的"词义".然而目前大多数的计算机翻译软件,对独词句的处理都存在缺陷.本文希望能从语言学的角度,对翻译系统处理独词句提出更为合理的解决方法.  相似文献   

3.
机器翻译是对人工翻译的模拟。但是由于不同语言之间历史文化、风俗习惯等因素存在固有差异,所以相同的文字时常在不同环境下表达的意义不同,这使得机器翻译实现十分困难。独词句是语言学上的一种特殊的句型。独词句需要根据上下文环境来判断它的“句义”,而不仅仅是它的“词义”。然而目前大多数的计算机翻译软件,对独词句的处理都存在缺陷。本文希望能从语言学的角度,对翻译系统处理独词句提出更为合理的解决方法。  相似文献   

4.
近年来,神经机器翻译(neural machine translation, NMT)表现出极大的优越性,然而如何在翻译一个文档时考虑篇章上下文信息仍然是一个值得探讨的问题。传统的注意力机制对源端的所有词语进行计算,而在翻译当前句子时篇章中大量的信息中只有小部分是与之相关的。在篇章级机器翻译中,采用传统的注意力机制建模篇章信息存在着信息冗余的问题。该文提出了一种联合注意力机制,结合“硬关注”和“软关注”的机制对篇章上下文的信息进行建模。关键思想是通过“硬关注”筛选出与翻译当前句子相关的源端历史词语,然后采用“软关注”的方法进一步抽取翻译中所需的上下文信息。实验表明,相比于基线系统,该方法能使翻译性能获得明显提升。  相似文献   

5.
针对传统机器翻译系统准确性差、人工翻译成本高等缺陷,提出了一种基于Hadoop云计算框架与XMPP协议的云翻译系统解决方案,结合传统翻译技术和Hadoop云计算框架,利用XMPP在异构系统之间的互通,建立用户、译员和对象的三方互助云平台.该系统可挖掘互助沟通过程中的庞杂的语料资源,具有语料库数据量大,翻译准确、翻译效率高、智能性强等特点,解决了人工翻译成本高、机器翻译歧义性大等问题,实现了不同语种人群通过互联网进行文字即时通信时的多语无障碍沟通.  相似文献   

6.
英汉机器翻译技术能够完成英文与汉文的实时翻译,国内外对英汉机器翻译技术做了大量研究和实验。首先简要介绍了英汉机器翻译的研究状况,对已存在的2种英汉机器翻译技术进行研究分析,为英汉机器翻译技术的进一步发展提供了一定的理论依据。  相似文献   

7.
随着深度学习的发展和成熟,神经机器翻译的质量也越来越高,然而仍不完美,为了达到可接受的翻译效果,需要人工进行后期编辑。交互式机器翻译(IMT)是这种串行工作的一个替代,即在翻译过程中进行人工互动,由用户对翻译系统产生的候选翻译进行验证,并且,如有必要,由用户提供新的输入,系统根据用户当前的反馈生成新的候选译文,如此往复,直到产生一个使用户满意的输出。首先,介绍了IMT的基本概念以及当前的研究进展;然后,分类对一些常用方法和前沿工作加以介绍,并简述每个工作的背景和创新之处;最后,探讨了IMT的发展趋势和研究难点。  相似文献   

8.
赵礼海 《电脑》1998,(4):14-16
随着计算机界在Internet等国际交往的增多,翻译软件慢慢成为业界的热点,由于本刊采编人员对翻译软件的研制都不甚了解,所以这次专门请了北京雅信工作室的主创人、“雅信译霸97”软件的作者——李晓明先生作为本次专访活动的特邀佳宾,来向各位读者介绍一下他自己和他所认识的翻译软件。 这次的采访依然是采用E-Mail形式进行的,一开始见面,大家先天南海北地广泛地聊了一下,没有马上转入翻译软件的话题,在寒喧过程中我们了解到,李晓明先生是陕西大荔人。他84年考入长沙国防科技大学学习,88年攻读硕士学位。91年3月毕业后分配到北京总参某部工作。目前正在负责雅信软件工作室的工作,全力开发“雅信译霸”专业版。  相似文献   

9.
基于短语的统计翻译模型是目前机器翻译领域广泛使用的模型之一。但是,由于在解码时采用短语精确匹配的策略,造成了严重的数据稀疏问题,短语表中的大量短语无法得到充分利用。为此,该文提出了人机互助的交互式翻译方法。对于翻译短语表中找不到的短语,首先通过模糊匹配的方法,在短语表中寻找与其相似的短语。然后利用组合分类器,判断哪些相似短语可能提高句子的翻译质量。最后,通过人机交互的方法,选择可能提高翻译质量且保持原句语义的短语。在口语语料上的实验结果证明,这种方法可以有效地提高翻译系统的译文质量。  相似文献   

10.
张广才  张菊维 《计算机工程》2005,31(Z1):117-119
介绍了一个机器翻译辅助开发平台MTDevStudio中的部分关键技术,包括模型定义、句法树操作的实现、语料库规则提取与统计分析、翻译引擎的评测等,重点对基于规则的机器翻译的辅助开发实现进行了介绍。该平台有利于减少机器翻译过程中的大量重复性工作,使研究者致力于自然语言理解的核心理论研究。与其它辅助工具相比,该平台致力于集成机器翻译涉及到的全面工作,用户可以自定义机器翻译模型,可扩展性好,并由机器翻译专家实际参与使用、评价,取得了不错的效果。  相似文献   

11.
介绍一种基于开源计算机视觉库(OpenCV)、训练模型(Seq2Seq)及Python语言实现的实时图像文字翻译技术。先使用OpenCV对摄像头画面进行捕获,再进行预处理、腐蚀、降噪、文字处理识别,代入Seq2Seq模型中,实现中英文字的翻译。  相似文献   

12.
一种基于实例的汉英机器翻译策略   总被引:3,自引:0,他引:3  
介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也是基于实例机器翻译的难点之一,在这方面也采取了相应的解决方法。没有对翻译句子的连接装配进行更深入的研究,这是因为该翻译策略是用于多翻译引擎系统的,它要与其它翻译策略配合使用,以提高翻译结果的正确率。基于实例的机器翻译需要大量的双语语料库作为翻译时的依据,而人工建设大型语料库费时费力,所以尝试采用计算机进行汉英双语语料库的自动建立,包括篇章对齐和单词级的对齐。  相似文献   

13.
神经机器翻译由于无法完全学习源端单词语义信息,往往造成翻译结果中存在着大量的单词翻译错误。该文提出了一种融入单词翻译用以增强源端信息的神经机器翻译方法。首先使用字典方法找到每个源端单词对应的目标端翻译,然后提出并比较两种不同的方式,用以融合源端单词及其翻译信息: ①Factored 编码器: 单词及其翻译信息直接相加; ②Gated 编码器: 通过门机制控制单词翻译信息的输入。基于目前性能最优的基于自注意力机制的神经机器翻译框架Transformer,在中英翻译任务的实验结果表明,与基准系统相比,该文提出的两种融合源端单词译文的方式均能显著提高翻译性能,BLEU值获得了0.81个点的提升。  相似文献   

14.
汉蒙机器翻译系统中量词翻译研究   总被引:1,自引:0,他引:1  
在基于短语的汉蒙统计机器翻译系统的研究中,我们发现存在着大量的汉蒙量词翻译错误。该文对汉语和蒙古语中的量词翻译进行研究的基础上,提出了使用量词表进行翻译,总结出了一对一、多对一、一对零和一对多等汉语量词到蒙语量词翻译的对应关系,给出了各种对应中的翻译方法,通过实验证明这种方法明显提高了现有汉蒙机器翻译系统的性能。  相似文献   

15.
目前汉藏机器翻译的研究主要集中在基于规则的方法上,主要原因在于汉藏的平行语料等基础资源相对匮乏,不方便做大规模的基于统计的汉藏机器翻译实验。该文依据汉藏辅助翻译项目的实际需求,在平行语料资源较少的情况下,提出了一种基于短语串实例的机器翻译方法,为辅助翻译提供候选译文。该方法主要利用词语对齐信息来充分挖掘现有平行语料资源信息。实验结果表明,该文提出的基于短语串实例方法优于传统基于句子实例的翻译,能够检索出任意长度的短语串翻译实例。在实验测试集上,该方法与默认参数下的Moses相比,翻译的BULE值接近Moses,短语翻译实例串的召回率提高了约9.71%。在平均句长为20个词的测试语料上,翻译速度达到平均每句0.175s,满足辅助翻译实时性的要求。  相似文献   

16.
国内外机器翻译进展状况   总被引:1,自引:0,他引:1  
人类在漫长的发展过程中创造了数以千计的形态各异的语言,随之而来的各民族间的言语不通给人类交往带来诸多不便,为进行沟通,翻译行业在远古时代即已为社会所需。 进入二十世纪以后,科学技术蓬勃发展,科研成果的相互交流日益频繁,各个国家对翻译工作投入极大力量,翻译人员日见增多。但本世纪科技发展迅猛异常,科技文献数量急剧增加,用手工翻译处理浩如烟海的科技资料令人日感力不从心,寻找高效快速翻译工具已成当务之急。 1946年,世界第一台电子计算机问世,标志着  相似文献   

17.
中等词汇的汉英语音翻译系统   总被引:1,自引:0,他引:1  
本文给出汉英语音翻译系统的组成,介绍了系统中连续汉语语音识别和汉英机器翻译的工作;我们已经在限定主题、中等词汇量的条件下实现了非特定人的连续语音识别,实现了汉英语音翻译实验演示系统。  相似文献   

18.
基于语义相似度并运用语言学知识进行双语语句词对齐   总被引:1,自引:0,他引:1  
一、引言自八十年代以来,基于统计(Statistics-Based)和基于实例(Example-Based)方法的出现及其广泛应用给机器翻译的研究工作注入了新的活力,标志着机器翻译进入了一个新时期。这两种方法共同的特点是:都需要一个双语语料库(Bilin-gual Corpora)直接或间接地作为翻译的知识库。这种双语语料库中包含了原文和译文相互对应的语言信息,是支持机器翻译的最为宝贵的资源。双语语料比单语种提供了更多的信息。在近些年里,在对篇章、段落、句子对齐进行了大量的研究之后,许多工作已经  相似文献   

19.
神经机器翻译是目前机器翻译领域的主流方法,而翻译记忆是一种帮助专业翻译人员避免重复翻译的工具,其保留之前完成的翻译句对并存储在翻译记忆库中,进而在之后的翻译过程中通过检索去重用这些翻译。该文基于数据扩充提出两种将翻译记忆与神经机器翻译相结合的方法:(1)直接拼接翻译记忆在源语句后面;(2)通过标签向量拼接翻译记忆。该文在中英与英德数据集上进行了实验,实验表明,该方法可以使翻译性能获得显著提升。  相似文献   

20.
XMMT英汉机器翻译系统   总被引:1,自引:0,他引:1  
本文通过英汉机器翻译系统的设计思想和结构, 阐述如何综合应用人工智能技术, 研制翻译质量高, 通用性好, 能扩展成多种语言翻译系统的一种方法。系统设计的侧重点在于如何提高系统的翻译质量。文中给出了主要模块的算法原理, 在附录部分还给出了这个系统的一些翻译例子。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号