共查询到20条相似文献,搜索用时 15 毫秒
1.
自然语言的歧义与机器翻译的对策 总被引:2,自引:0,他引:2
歧义是自然语言的特征之一。开发机器翻译系统, 不仅要研究一种语言内部的歧义, 而且还要研究两种不同语言间的歧义。本文从不同的角度考察了这些歧义现象及其对机器翻译的影响, 总结了在机器翻译系统中为了得到恰当的译文所采用的几种办法, 并且提出了一种观点或者说方法, 它允许译文的歧义同原文的歧义相对应。 相似文献
2.
3.
机器翻译错误分析旨在找出机器译文中存在的错误,包括错误类型、错误分布等,它在机器翻译研究和应用中发挥着重要作用。该文将人工译后编辑与错误分析结合起来,对译后编辑操作进行错误标注,采用自动标注和人工标注相结合的方法,构建了一个细粒度英汉机器翻译错误分析语料库,其中每一个标注样本包括源语言句子、机器译文、人工参考译文、译后编辑译文、词错误率和错误类型标注;标注的错误类型包括增词、漏词、错词、词序错误、未译和命名实体翻译错误等。标注的一致性检验表明了标注的有效性;对标注语料的统计分析结果能有效地指导机器翻译系统的开发和人工译员的后编辑。 相似文献
4.
基于目标语词汇组合合理性评价的译文选择模型 总被引:1,自引:0,他引:1
机器翻译使用计算机实现自然语言的翻译功能,是计算机技术在语言学领域的新兴应用和研究,其中,源语言词汇的译文选择直接决定机器翻译的质量,是人们关注的难题,基于目标语词汇组合合理性评价的模糊分类模型试图以语言学和模糊数学为理论基础,尝试解决歧义词的译文选择问题,将该模型用于英汉机器翻译系统的译文选择实验,具有良好的译文选择性能,它的优势还在于可以同时为全句范围内的所有歧义词选择译文,因此适用于机器翻译的大规模开发任务。 相似文献
5.
6.
神经网络机器翻译是最近几年提出的机器翻译方法,在多数语言对上逐渐超过了统计机器翻译方法,成为当前机器翻译研究前沿热点。该文在藏汉语对上进行了基于注意力的神经网络机器翻译的实验,并采用迁移学习方法缓解藏汉平行语料数量不足问题。实验结果显示,该文提出的迁移学习方法简单有效,相比短语统计机器翻译方法,提高了三个BLEU值。从译文分析中可以看出藏汉神经网络机器翻译的译文比较流畅,远距离调序能力较强,同时也存在过度翻译、翻译不充分、翻译忠实度较低等神经网络机器翻译的共同不足之处。 相似文献
7.
基于Transformer的序列转换模型是当前性能最优的机器翻译模型之一.该模型在生成机器译文时,通常从左到右逐个生成目标词,这使得当前位置词的生成不能利用译文中该词之后未生成词的信息,导致机器译文解码不充分从而降低译文质量.为了缓解上述问题,该文提出了基于重解码的神经机器翻译模型,该模型将已生成的机器译文作为目标语言... 相似文献
8.
针对蒙汉神经机器翻译过程中出现严重未登录词的问题,利用字节编码技术对蒙汉平行语料进行预处理,实验结果表明字节对编码技术有效缓解了未登录词现象。同时,为缓解蒙汉平行语料不足问题,将迁移学习策略应用到在蒙汉神经机器翻译中,实验结果表明最终的翻译译文提高了1.6个BLEU值。另外,考虑到在神经机器翻译模型中的双语词向量的质量对最终的翻译译文质量有较大影响,将基于Word2vec预训练得到的词向量嵌入到蒙汉神经机器翻译模型中,实验结果表明译文提升了0.6个BLEU值。 相似文献
9.
译后编辑是近年来随机器翻译发展新兴的计算机应用研究领域。综述了译后编辑所涉及的三方面的技术问题:自动译后编辑,自动机器翻译质量评估以及译后编辑工作量测量。自动译后编辑与自动机器翻译质量评估均应用自然语言处理领域相关技术,通过自动完成部分编辑工作、筛选机器翻译译文来降低译员工作量,从而提高效率。对译后编辑工作量的研究侧重于分析机器翻译译文的错误对译员工作量的影响,为译后编辑系统环境的设计提供理论依据。总体而言,译后编辑技术研究的主要目的是提高译员的工作效率。 相似文献
10.
英汉TBMT中模板抽取的改进算法及应用 总被引:1,自引:0,他引:1
基于模板的机器翻译(简称TBMT)是为了提高当前机器翻译系统译文生成质量而采用的一种新的翻译方法,该技术的关键是模板的抽取。文章针对英汉机器翻译中的现存问题,在“动词+虚词”形式的模板抽取算法的基础上提出一种改进算法,应用该算法可较好地解决英汉机器翻译中的一些歧义问题。 相似文献
11.
基于语义相似度并运用语言学知识进行双语语句词对齐 总被引:1,自引:0,他引:1
一、引言自八十年代以来,基于统计(Statistics-Based)和基于实例(Example-Based)方法的出现及其广泛应用给机器翻译的研究工作注入了新的活力,标志着机器翻译进入了一个新时期。这两种方法共同的特点是:都需要一个双语语料库(Bilin-gual Corpora)直接或间接地作为翻译的知识库。这种双语语料库中包含了原文和译文相互对应的语言信息,是支持机器翻译的最为宝贵的资源。双语语料比单语种提供了更多的信息。在近些年里,在对篇章、段落、句子对齐进行了大量的研究之后,许多工作已经 相似文献
12.
机器翻译译文质量估计(Quality Estimation, QE)是指在不需要人工参考译文的条件下,估计机器翻译系统产生的译文的质量,对机器翻译研究和应用具有很重要的价值。机器翻译译文质量估计经过最近几年的发展,取得了丰富的研究成果。该文首先介绍了机器翻译译文质量估计的背景与意义;然后详细介绍了句子级QE、单词级QE、文档级QE的具体任务目标、评价指标等内容,进一步概括了QE方法发展的三个阶段:基于特征工程和机器学习的QE方法阶段,基于深度学习的QE方法阶段,融入预训练模型的QE方法阶段,并介绍了每一阶段中的代表性研究工作;最后分析了目前的研究现状及不足,并对未来QE方法的研究及发展方向进行了展望。 相似文献
13.
机器翻译是一个古老而年轻的课题,它一直是人们梦寐以求的理想,本文实现一个英汉机器翻译系统主要和于翻译联机得到的内容,也可翻译实时输入的内容。本文设计了三部电子词典的数据结构,实现了词典数据库的管理软件,用户通过友好的人机交互界面,可以方便地生成自己的专用词典,本系统基于规则,实现了分析翻译综合模块,采用英汉对照方式输出原文及译文。本系统用C语言实现。 相似文献
14.
译文质量估计是机器翻译领域中一个重要的子任务,该任务旨在不依靠参考译文的情况下对机器译文进行质量分析.当前,译文质量估计任务在汉英、英德机器翻译上有较好的表现,技术相对成熟.但是将模型应用到汉-越神经机器翻译中面临较多问题.尤其是译文质量估计模型在汉越平行数据中提取到的语言特征不能够充分地体现汉语与越南语之间的语言特点,加之汉语与越南语之间语序与句法结构也存在明显的差异.针对上述问题,本文采用统计对齐的方法对汉越之间结构差异进行建模,提取汉语与越南语之间的语言差异化特征,以提升汉越译文质量估计的效果.实验结果表明,融入语言差异化特征在汉-越和越-汉两个方向上较基线模型分别提升了0.52个百分点和0.35个百分点. 相似文献
15.
句型转换的消歧和译文生成处理是混合式汉英机器翻译的两个重要阶段。本文主要工作有:第一,针对自然语言在各个层次上普遍存在的歧义性,对语言歧义的问题进行分析,论述了一些具体消歧方法;第二,建立了汉英机器翻译的时态转换及相关匹配规则,探讨了译文生成的处理。 相似文献
16.
17.
日汉机器翻译系统中的词典讨论 总被引:3,自引:0,他引:3
本文讨论了日汉机器翻译系统中有关词典的同音词、同型词、兼类词、挑选汉译词以及惯用型处理等几个问题,这些问题的解决将直接影响日汉机器翻译系统的译文质量。 相似文献
18.
魏惠强 《自动化与仪器仪表》2024,(2):77-81
为改善机器翻译质量,促进国际交流沟通。研究基于数据挖掘(Data mining, DM)与语言特征,构建了智慧机器翻译纠错系统。研究对多个置信度特征进行组合,利用最大熵分类器对译文错误进行类别分类。然后基于复述抽取方法对译文进行校正,改善机器翻译质量。实验得到,纠错系统干预后,机器翻译的平均ELEU值为96.83%,较改进前提高了14.47%。数据表明,纠错系统能够有效识别机器翻译中的错误并进行校正,从而改善译文质量,作为国际沟通的强有力支持。 相似文献
19.