共查询到20条相似文献,搜索用时 93 毫秒
1.
随着机器翻译的发展,对其质量进行评测的自动评价方法也越来越受重视。发展至今,各种评价方法与技术层出不穷,采用何种分类标准来组织和描述它们也是一个很大的挑战。根据核心技术的不同,该文重点介绍了三类主流的自动评价方法,包括: 基于语言学检测点的方法、字符串匹配的方法和基于机器学习的方法。论文分别阐述了这些类别中颇具代表性的方法的工作原理并分析了各自的优缺点。此外,受限参考译文下的评价技术虽然不是主流的方法,但是其对提高自动化程度和评价性能的作用不能忽视,所以该文将其作为特殊的类别做了阐述。然后,汇报了近年来衡量自动评价方法的国际评测结果。最后,总结了自动评价的发展趋势和有待进一步解决的相关问题。 相似文献
2.
机器译文自动评价对推动机器翻译发展和应用有着重要作用。最新的神经机器译文自动评价方法使用预训练语境词向量提取深层语义特征,并将它们直接拼接输入多层神经网络预测译文质量,其中直接拼接操作容易导致特征间缺乏深入融合,而逐层抽象进行预测时容易丢失细粒度准确匹配信息。针对以上问题,该文提出将中期信息融合方法和后期信息融合方法引入译文自动评价,使用拥抱融合对不同特征进行交互中期融合,基于细粒度准确匹配的句移距离和句级余弦相似度进行后期融合。在WMT’21 Metrics Task基准数据集上的实验结果表明,提出的方法能有效提高其与人工评价的相关性,达到与参加评测最优系统的可比性能。 相似文献
3.
4.
5.
译文质量的自动评价对机器翻译研究具有十分重要的意义。但现有方法主要是针对书面语翻译,没有考虑到口语翻译的特征。因此,本文提出了一种面向口语的新型的自动评价方法,通过定义信息段、标注权重和设计多种匹配策略等方法,使自动评价结果与人工打分更为接近,同时也提高了评价过程对不同输出译文的适应能力。各项实验表明,该算法对译文质量变化具有较高的敏感度,而且可以对输出译文质量作出与手工评判较为接近的评价结果。 相似文献
6.
针对目前机器翻译模型存在的曝光偏差和译文多样性差的问题,提出一种基于强化学习和机器翻译质量评估的中朝神经机器翻译模型QR-Transformer.首先,在句子级别引入评价机制来指导模型预测不完全收敛于参考译文;其次,采用强化学习方法作为指导策略,实现模型在句子级别优化目标序列;最后,在训练过程中融入单语语料并进行多粒度数据预处理以缓解数据稀疏问题.实验表明,QR-Transformer有效提升了中朝神经机器翻译性能,与Transformer相比,中—朝语向BLEU值提升了5.39,QE分数降低了5.16,朝—中语向BLEU值提升了2.73,QE分数下降了2.82. 相似文献
7.
机器译文自动评价对机器翻译的发展和应用起着重要的促进作用,其一般通过计算机器译文和人工参考译文的相似度来度量机器译文的质量。该文通过跨语种预训练语言模型XLM将源语言句子、机器译文和人工参考译文映射到相同的语义空间,结合分层注意力和内部注意力提取源语言句子与机器译文、机器译文与人工参考译文以及源语言句子与人工参考译文之间的差异特征,并将其融入基于Bi-LSTM神经译文自动评价方法中。在WMT’19译文自动评价数据集上的实验结果表明,融合XLM词语表示的神经机器译文自动评价方法显著提高了其与人工评价的相关性。 相似文献
8.
由于藏汉平行语料匮乏,导致藏汉神经网络机器翻译效果欠佳,该文提出了一种将藏语单语语言模型融合到藏汉神经网络机器翻译的方法,首先利用神经网络实现藏语单语语言模型,然后使用Transformer实现藏汉神经网络机器翻译模型,最后将藏语单语语言模型融合到藏汉神经网络机器翻译中。实验表明,该方法能显著提升藏汉神经网络机器翻译质量。基线系统藏语到汉语的BLEU值为21.1,汉语到藏语的BLEU值为18.6,融合藏语单语语言模型后,藏语到汉语的BLEU值为24.5,汉语到藏语的BLEU值为23.3,比原有基线系统的BLEU值分别提高了3.4和4.7。 相似文献
9.
基于句子相似度的机器翻译评价方法及其有效性分析 总被引:5,自引:0,他引:5
为了帮助开发面向本地化的基于实例的机器翻译(EBMT)系统,提出利用句子相似度评价译文质量的方法.该方法能够较有效地区分不同翻译质量的译文,从而帮助开发者发现EBMT系统存在的问题.为了证明该评价方法的有效性,对比了6个机器翻译系统人工评价和自动评价的结果.通过相关分析和显著性检验,表明了此方法和人工方法存在高度的一致性.最后提出在自动评价结果的基础上利用线性回归预测人工评分方法. 相似文献
10.
机器翻译是应用计算机实现从一种自然语言文本到另一种自然语言文本的翻译,是自然语言处理研究领域的一个分支。本文就现行机器翻译面临的问题,讨论基于实例的机器翻译方法及其优化策略。 相似文献
11.
基于多策略的交互式智能辅助翻译平台总体设计 总被引:4,自引:0,他引:4
为了改善实用机器翻译系统的翻译处理效果,提出一种基于多策略的交互式智能辅助翻译平台的总体设计方案.该系统基于多知识一体化表示、多种翻译处理策略、多种翻译知识获取方式、多策略译文选优等,并采用面向对象的多类型知识数据库管理,有效实现了多策略、多知识的交互式智能处理.平台实现基于规则分析、基于类比推理和统计知识的多翻译模式集成处理,提供人机交互接口,实现人工对翻译结果的干预,以及面向对象的工程、任务管理和用户管理. 相似文献
12.
基于混合距离学习的双指数模糊C均值算法 总被引:2,自引:0,他引:2
提出了一种基于DI-FCM(double indices fuzzy C-means)算法框架的无监督距离学习算法——基于混合距离学习的双指数模糊C均值算法HDDI-FCM(double indices fuzzy C-means with hybrid distance).数据集未知距离度量被表示为若干已有距离的线性组合,然后执行HDDI-FCM,在对数据集进行有效聚类的同时进行距离学习.为了保证迭代算法收敛,引入了Steffensen迭代法来改进计算簇中心点的迭代公式.讨论了算法中参数的选择.基于UCI(University of California,Irvine)数据集的实验结果表明该算法是有效的. 相似文献
13.
机器翻译系统跨领域移植方法的研究 总被引:1,自引:0,他引:1
机器翻译系统跨领域移植是降低系统开发代价的关键性因素。论文以翻译模板对训练语料库机器译文评测分数的贡献为依据,对其进行评价。从模板库中过滤出适应目标领域的翻译知识,以实现系统向新领域的快速移植。利用论文所提出的方法将一个通用领域的机器翻译系统向旅游领域进行移植,并使用来自旅游领域的2469句汉语句子作为测试语料进行开放测试。实验结果表明在开放测试中,机器译文的5元Nist评分提高了2.2807,上升了71.1%。 相似文献
14.
在当前的计算机网络管理中,网管中心站利用传统延迟测试方法只能得到它与网络中其它主机的延迟,而无法得到网络中任意两主机之间的延迟情况。本文提出了一种利用移动代理进行延迟测试的方法,采用Aglets移动代理开发平台和Java语言做出了一个实例,实现了网管中心站对网络中任意两主机进行单向和双向延迟测试。本文给出了具体的
的实现方案,并将此方法与传统测试方法进行了对比分析。 相似文献
的实现方案,并将此方法与传统测试方法进行了对比分析。 相似文献
15.
16.
该文介绍了第七届全国机器翻译研讨会(CWMT2011)机器翻译评测的具体情况。本次评测重点关注各种语言到汉语的翻译,除了汉英、英汉、日汉三个语言对以外,评测还新增了五种民族语言(藏语、蒙古语、维吾尔语、哈萨克语、柯尔克孜语)到汉语的翻译评测。共有19家国内外单位的165个系统参加此次评测。除了介绍评测项目的设置、评测数据的准备、评测流程、参评单位等,本文还重点介绍了CWMT2011的评测结果,并对评测结果进行了分析,用实例说明了与评测结果相关的几个因素 源语言与目标语言是否相似、评测领域是否集中、测试集与训练及开发集语料是否相似、训练语料的规模、参评系统的技术和成熟度等。 相似文献
17.
18.
19.
20.
该文对基于传统统计模型的蒙汉机器翻译模型和基于神经网络机器翻译模型进行了研究。其中,神经网络翻译模型分别为基于CNN、RNN的翻译模型,并通过将所有翻译模型结果进行句子级融合得到一个融合模型。面对蒙汉翻译面临资源稀少、蒙古文形态复杂等困难,该文提出多种翻译技术,对各个模型进行改进,并对蒙古文进行形态分析与处理。在翻译效果最好的CNN模型上,采用字和短语融合训练方法;基于RNN的翻译模型除用上述方法外,还采用Giza++指导对齐技术调整RNN注意力机制;针对SMT采用了实验室提出的重对齐技术。该文对实验结果进行了对比和分析,这三种技术方法对相应系统翻译效果有显著提升。此外,蒙古文形态分析与处理对缓解数据稀疏、提升译文质量也有重要作用。 相似文献