排序方式: 共有29条查询结果,搜索用时 15 毫秒
1.
2.
目前,基于端到端的神经机器翻译(NMT)在大语种上取得了显著的效果,已经成为学术界非常流行的方法,然而该模型的训练严重依赖平行语料库的大小,通常需要上百万句,而西里尔蒙古语和汉语之间的平行语料库严重匮乏,并且人工构建代价昂贵。因此,提出基于对偶学习的西里尔蒙汉互译方法。为了缓解因未登录词导致的译文质量不高的问题,采用BPE(Byte Pair Encoding)技术对语料进行预处理。将通过单语数据预训练的语言模型和20%的平行双语数据预训练的翻译模型作为该模型训练的初始状态。以NMT为基线系统,实验结果表明,该方法达到了与NMT使用西里尔蒙汉全部双语数据相当的效果,有效缓解了因未登录词较多和平行语料库匮乏导致的译文质量不高的问题。 相似文献
3.
在蒙汉神经机器翻译中,输入序列的基本粒度对翻译效果有一定的影响。为了选择合适的翻译粒度,分别对蒙古语和汉语进行词-词、词-子词、子词-词、子词-子词粒度的切分,并对比不同粒度在长短时记忆网络和Transformer翻译模型中的翻译表现。实验结果表明,在两种翻译模型中,对两种语料同时进行子词粒度切分效果最好。 相似文献
4.
近年来,端到端的神经机器翻译方法由于翻译准确率高,模型结构简单等优点已经成为机器翻译研究的重点,但其依然存在一个主要的缺点,该模型倾向于反复翻译某些源词,而错误地忽略掉部分词。针对这种情况,采用在端到端模型的基础上添加重构器的方法。首先利用Word2vec技术对蒙汉双语数据集进行向量化表示,然后预训练端到端的蒙汉神经机器翻译模型,最后对基于编码器-解码器重构框架的蒙汉神经机器翻译模型进行训练。将基于注意力机制的蒙汉神经机器翻译模型作为基线系统。实验结果表明,该框架显著提高了蒙汉机器翻译的充分性,比传统的基于注意力机制的蒙汉机器翻译模型具有更好的翻译效果。 相似文献
5.
介绍了循环水动态模拟装置分布式计算机测控系统的设计方案.该方案满足动态模拟装置试验全过程自动控制,包括设定试验条件、标定检测精度、试验参数自动检测记录、试验状态自动控制、试验数据分析处理等.介绍了计算机系统的结构、主要功能及技术指标,下位控制站的硬件组成、工作原理及软件流程,上位操作站应用界面功能.多家石油、化工、电力企事业单位应用实践证明.系统结构合理、测控精度高.完全满足利用动态模拟装置评价水质、筛选配方的工艺需要. 相似文献
6.
以宰后未经速冷处理的绵羊左后大腿为对照组,以宰后经过6h速冷处理的绵羊左后大腿为处理组,在-1~1℃贮存,并对其3~216h内肌肉中糖原、巯基、pH、失水率、游离钙离子浓度、游离氨基酸、游离羟脯氨酸的变化进行了研究。结果表明,在宰后3~216h内处理组的糖原含量、pH、失水率始终显著(P<0.05)高于对照组;处理组巯基含量始终稍低于对照组,游离羟脯氨酸含量处理组稍低于对照组,但差异不显著;游离钙离子浓度、游离氨基酸含量宰后3~48h先下降随后逐渐升高到最大值后转为下降的(p<0.05)变化规律基本一致。并且得出了部分相应的相关方程。利用主成分分析及METLAB软件对肉样的七项指标进行分析可知,在3~216h内糖原含量、pH、失水率、巯基含量、游离氨基酸含量等对肌肉僵直化进程起着重要的作用。所测定的肉样在宰后9h就进入了僵直起始阶段,在宰后48h僵直结束。 相似文献
7.
基本遗传算法的核心理论是模式定理和收敛性理论.传统的模式定理使用了二进制编码方法并给予了证明,然而现实中用遗传算法求解很多问题时需要使用有限字符集的编码方法.首先给出了一些具有代表性的遗传算子,在此基础上证明了有限字符集编码下的模式定理.结果表明,基于有限字符集编码的遗传算法中阶次低、定义长度短且适应度值超过平均适应度值的模式的数目将以指数级增长. 相似文献
8.
针对沙尘暴预测多依赖于地面气象资料,且与深度学习算法结合较少的问题,提出一种基于卫星云图和改进AlexNet的沙尘暴预测算法。首先,参照国标为地面气象资料构造沙尘暴等级标签;然后,对卫星云图进行透视变换、气象站云图数量再平衡等处理,并将卫星云图与沙尘暴等级标签相互标定;其次,改变AlexNet的卷积核尺寸,去掉局部响应归一化(LRN)层,并在所有卷积层和激活层之间增加批归一化(BN)层;最后,使用改进后的AlexNet模型进行训练、测试。实验结果表明,改进后的AlexNet模型在精确率、召回率、F1值和准确率上均优于VGGNet16、VGGNet19及AlexNet。结果表明所提方法是有效的,能为地面气象资料、卫星云图与深度学习相结合来预测沙尘暴提供参考。 相似文献
9.
针对蒙汉平行语料资源比较稀缺和现有平行语料数据覆盖面少等导致的蒙汉翻译质量不佳的问题,采用跨语言多任务学习的方式对机器翻译建模。在数据预处理阶段,引入两种新的无监督预训练和一种监督预训练的方法,用于跨语言建模来学习跨语言表示,并研究三种语言预训练方法在蒙汉翻译中的效果。实验结果表明,三种跨语言预训练的模型可以显著降低低资源语言的困惑度,提高蒙汉翻译质量。 相似文献
10.
在机器翻译模型的构建和训练阶段,为了缓解因端到端机器翻译框架在训练时采用最大似然估计原理导致的翻译模型的质量不高的问题,本文使用对抗学习策略训练生成对抗网络,通过鉴别器协助生成器的方式来提高生成器的翻译质量,通过实验选择出了更适合生成器的机器翻译框架Transformer,更适合鉴别器的卷积神经网络,并且验证了对抗式训练对提高译文的自然度、流利度以及准确性都具有一定的作用.在模型的优化阶段,为了缓解因蒙汉平行数据集匮乏导致的蒙汉机器翻译质量仍然不理想的问题,本文将Dual-GAN (dual-generative adversarial networks,对偶生成对抗网络)算法引入了蒙汉机器翻译中,通过有效的利用大量蒙汉单语数据使用对偶学习策略的方式来进一步提高基于对抗学习的蒙汉机器翻译模型的质量. 相似文献