共查询到20条相似文献,搜索用时 52 毫秒
1.
机器翻译在中国 纵观当前国内翻译软件市场,今天译“星”,明日译“霸”,群雄并起,竞争激烈。仔细分析这些产品之后,我们可以将其分为两大类:电子辞典和机器翻译。 电子辞典的优点自不待言,对词的翻译准确而且快速,但在专业翻译领域,电子辞典所能做的毕竟十分有限。 机器翻译又称自动化翻译,其宗旨是在一定范围或一定领域内取代翻译人员的劳动。但语言是一套非常复杂的系 相似文献
2.
神经机器翻译是目前机器翻译领域的主流方法,而翻译记忆是一种帮助专业翻译人员避免重复翻译的工具,其保留之前完成的翻译句对并存储在翻译记忆库中,进而在之后的翻译过程中通过检索去重用这些翻译。该文基于数据扩充提出两种将翻译记忆与神经机器翻译相结合的方法:(1)直接拼接翻译记忆在源语句后面;(2)通过标签向量拼接翻译记忆。该文在中英与英德数据集上进行了实验,实验表明,该方法可以使翻译性能获得显著提升。 相似文献
3.
4.
在市场准备充分的情况下,机器翻译软件能否迎来又一个春天,将取决于其技术创新是否具有足够的征服力。在2000年前后,机器翻译软件的市场曾一度红红火火,随后却很快地销声匿迹了。就在人们几乎要忘记它的时候,机器翻译发展到今天又有了复兴的迹象,看上去,机器翻译似乎将迎来又一个春天。只是希望这次,我们能吸取以前的教训,使春天更长一些。 相似文献
5.
为解决基于短语统计机器翻译存在的调序能力不足的问题,尝试利用句法分析器对基于短语统计机器翻译的输入汉语句子进行句法分析,然后利用转换器进行调序操作,并对部分类型短语进行预先翻译,然后再利用基于短语统计机器翻译的解码器进行翻译。重点测试了汉语中“的”字引导的复杂定语调序、介词短语、特定搭配短语、方位词短语的调序及预翻译产生的效果。实验结果表明,这些调序及预翻译操作可以显著地提高基于短语的统计机器翻译的英文译文结果的BLEU值。 相似文献
6.
7.
8.
随着中国加入WTO,以及2008年奥运会的临近,我们要加紧跨越语言障碍的藩篱,以便更好地对外沟通和交流。于是,全民兴起学英语的热朝,这种热潮也会给国内的翻译软件市场带来了更大的挑战和机遇。目前,面向个人用户的翻译软件比较受大家欢迎,这些翻译软件的价格比较适中,功能强大,虽然机器翻译的水平还无法与手工翻译相提并论,但翻译质量基本能满足大家的需求。 相似文献
9.
标题反映文章的灵魂,精确把握标题能迅速领悟文章的中心内容。本文利用统计机器翻译方法搭建了一个机器翻译平台,使用兹平台对航空领域标题进行翻译,井采用国际评测NIST工具对该平台进行了开放测试和对闭测试,测试结果表明该统计方法对领域标题翻译具有有效性。 相似文献
10.
赵崇俊 《自动化与仪器仪表》2022,(3):73-77
为提高大规模机器翻译准确率和翻译效率,基于EM分布式训练方法,提出基于Spark的大规模机器翻译方法。首先,在机器翻译模型的基础上对并行化训练方法和机器翻译系统框架进行分析,然后提出EM分布式并行算法和框架,针对短语翻译模型和层次翻译模型训练的特点,利用单机多线程工具MGIZA++构建完整的词对齐训练方法对短语翻译模型进行训练;最后通过实验验证提出算法对翻译模型的应用效果。实验结果表明,采用Align_on_MGIZA模型后,短语翻译速度比Chaski模型快了2倍,翻译速度显著提升,训练时间更短,仅用了该算法可以适用于短语翻译模型的高效准确翻译,说明系统性能优越,更具有效性。 相似文献
11.
利用平行网页建立中英文统计翻译模型 总被引:7,自引:1,他引:6
建立翻译模型的目的是试图从平行文本(或翻译例句)中自动抽取翻译关系。本文将描述我们在建立中英文统计翻译模型上的尝试。我们所用的平行文本是从万维网上自动获得的半结构性平行文本。在训练过程中,我们尽量利用文本中的HTML结构信息。实验表明,所训练的翻译模型能达到80%的准确率。对于象跨语言信息检索这样的应用,这样的准确率已经能大致满足需要。这一工作表明,对于检索引擎上的问句的翻译可以使用比机器翻译成本更低的工具。 相似文献
12.
统计机器翻译对时间、数字、量词的泛化能力较弱,为了提高汉维机器翻译系统对时间、数字和量词短语的翻译性能,该文利用双语语料库挖掘并提取汉语时间、数字、量词表达与翻译模式,实现了基于模板的时间、数字、无歧义量词翻译方法及基于上下文的有歧义量词翻译方法。时间、数字、无歧义量词、有歧义量词的翻译F值达到了93.23%、90.15%、96.55%、87.58%,实验证明,该方法具有简单高效的优点。 相似文献
13.
多模态神经机器翻译是指直接采用神经网络,以端到端方式融合图像和文本两种模态信息,以此进行翻译建模的机器学习方法。传统多模态机器翻译,是在将源语言翻译成目标语言时,借助图像中的重要特征信息优化翻译过程。但是观察发现,图像里的信息不一定出现在文本中,对翻译也会带来干扰;与参考译文对比,翻译结果中出现了过翻译和欠翻译的情况。针对以上问题,该文提出一种融合覆盖机制双注意力解码方法,用于优化现有多模态神经机器翻译模型。该模型借助覆盖机制分别作用于源语言和源图像,在注意力计算过程中,可以减少对过去重复信息的关注。在WMT16、WMT17测试集上进行实验,验证了上述方法的有效性,在WMT16英德和英法以及WMT17英德和英法测试集上,对比基准系统BLEU值分别提升了1.2,0.8,0.7和0.6个百分点。 相似文献
14.
15.
16.
在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展,具有重要的理论意义和应用价值。提出了三种由简到繁的把双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-III采用“分而治之”的策略,以“硬约束”的方式在统计机器翻译中融入最大名词短语,并在双语最大名词短语层面上,融合了短语翻译模型和层次短语模型,对翻译系统的改善最显著。所述策略显著提高了短语翻译模型的质量,在复杂长句翻译中,Method-III的BLEU值比基于短语的基线翻译模型提高了3.03%。 相似文献
17.
神经机器翻译由于无法完全学习源端单词语义信息,往往造成翻译结果中存在着大量的单词翻译错误。该文提出了一种融入单词翻译用以增强源端信息的神经机器翻译方法。首先使用字典方法找到每个源端单词对应的目标端翻译,然后提出并比较两种不同的方式,用以融合源端单词及其翻译信息: ①Factored 编码器: 单词及其翻译信息直接相加; ②Gated 编码器: 通过门机制控制单词翻译信息的输入。基于目前性能最优的基于自注意力机制的神经机器翻译框架Transformer,在中英翻译任务的实验结果表明,与基准系统相比,该文提出的两种融合源端单词译文的方式均能显著提高翻译性能,BLEU值获得了0.81个点的提升。 相似文献
18.
《电脑编程技巧与维护》2012,(23):4-4
据外媒体报道,研究人员开发了一款新软件,可以将英语口语翻译成中文口语,同时也会保留说话人语调和节奏,因此即便是通过机器翻译的语音听起来依然像是出自说话人之口。微软该项目的负责人表示该研究实现了重大突破,使得瞬时翻译系统出错的次数大大降低,系统研制的技术蓝本借鉴了大脑的工作方式,以提高翻译的准确性。 相似文献
19.
神经机器翻译前沿综述 总被引:3,自引:0,他引:3
机器翻译是指通过计算机将源语言句子翻译到与之语义等价的目标语言句子的过程,是自然语言处理领域的一个重要研究方向。神经机器翻译仅需使用神经网络就能实现从源语言到目标语言的端到端翻译,目前已成为机器翻译研究的主流方向。该文选取了近期神经机器翻译的几个主要研究领域,包括同声传译、多模态机器翻译、非自回归模型、篇章翻译、领域自适应、多语言翻译和模型训练,并对这些领域的前沿研究进展做简要介绍。 相似文献
20.
翻译软件到底为我们带来了什么?它们的优劣何在?本文试图从多个方面来说明我们是否需要翻译软件,以及需要什么样的翻译软件。就市场上常见的翻译软件来看,其功能大致可以分为3类:一是对应用软件或是对屏幕汉化的软件,二是全文翻译类的软件,三是词典类的翻译软件。在第一类翻译软件中比较有代表性的是北京铭泰科技发展有 相似文献