排序方式: 共有46条查询结果,搜索用时 15 毫秒
1.
2.
隐马尔科夫模型(HMM)对序列数据有很强的建模能力,在语音和手写识别中都得到了广泛的应用。利用HMM研究蒙古文手写识别,首先需要解决的问题是手写文字的序列化。从蒙古文的构词和书写特点看,蒙古文由多个字素从上到下串联构成。选择字素集合和词的字素分割是手写识别的基础,也是影响识别效果的关键因素。该文根据蒙古文音节和编码知识确定了蒙古文字母集合,共包括1 171个字母。通过相关性处理、HMM排序筛选等手段得到长字素集合,共包括378个字素。对长字素经过人工分解,获得了50个短字素。最后利用两层映射给出了词转字素序列的算法。为了验证长短字素在手写识别中的效果,我们在HTK(hidden Markov model toolkit)环境下利用小规模字库实现了手写识别系统,实验结果表明短字素比长字素有更好的性能。文中给出的字素集合和词转字素序列的算法为后续基于HMM的蒙古文手写识别研究奠定了基础。 相似文献
3.
以宰后未经速冷处理的绵羊左后大腿为对照组,以宰后经过6h速冷处理的绵羊左后大腿为处理组,在-1~1℃贮存,并对其3~216h内肌肉中糖原、巯基、pH、失水率、游离钙离子浓度、游离氨基酸、游离羟脯氨酸的变化进行了研究。结果表明,在宰后3~216h内处理组的糖原含量、pH、失水率始终显著(P<0.05)高于对照组;处理组巯基含量始终稍低于对照组,游离羟脯氨酸含量处理组稍低于对照组,但差异不显著;游离钙离子浓度、游离氨基酸含量宰后3~48h先下降随后逐渐升高到最大值后转为下降的(p<0.05)变化规律基本一致。并且得出了部分相应的相关方程。利用主成分分析及METLAB软件对肉样的七项指标进行分析可知,在3~216h内糖原含量、pH、失水率、巯基含量、游离氨基酸含量等对肌肉僵直化进程起着重要的作用。所测定的肉样在宰后9h就进入了僵直起始阶段,在宰后48h僵直结束。 相似文献
4.
介绍了对新疆石河子市大田膜下滴灌技术应用情况的考察和心得体会,提出了在锡盟进行推广的意见和建议。 相似文献
5.
介绍了循环水动态模拟装置分布式计算机测控系统的设计方案.该方案满足动态模拟装置试验全过程自动控制,包括设定试验条件、标定检测精度、试验参数自动检测记录、试验状态自动控制、试验数据分析处理等.介绍了计算机系统的结构、主要功能及技术指标,下位控制站的硬件组成、工作原理及软件流程,上位操作站应用界面功能.多家石油、化工、电力企事业单位应用实践证明.系统结构合理、测控精度高.完全满足利用动态模拟装置评价水质、筛选配方的工艺需要. 相似文献
6.
目前,基于端到端的神经机器翻译(NMT)在大语种上取得了显著的效果,已经成为学术界非常流行的方法,然而该模型的训练严重依赖平行语料库的大小,通常需要上百万句,而西里尔蒙古语和汉语之间的平行语料库严重匮乏,并且人工构建代价昂贵。因此,提出基于对偶学习的西里尔蒙汉互译方法。为了缓解因未登录词导致的译文质量不高的问题,采用BPE(Byte Pair Encoding)技术对语料进行预处理。将通过单语数据预训练的语言模型和20%的平行双语数据预训练的翻译模型作为该模型训练的初始状态。以NMT为基线系统,实验结果表明,该方法达到了与NMT使用西里尔蒙汉全部双语数据相当的效果,有效缓解了因未登录词较多和平行语料库匮乏导致的译文质量不高的问题。 相似文献
7.
在蒙汉神经机器翻译中,输入序列的基本粒度对翻译效果有一定的影响。为了选择合适的翻译粒度,分别对蒙古语和汉语进行词-词、词-子词、子词-词、子词-子词粒度的切分,并对比不同粒度在长短时记忆网络和Transformer翻译模型中的翻译表现。实验结果表明,在两种翻译模型中,对两种语料同时进行子词粒度切分效果最好。 相似文献
8.
近年来,端到端的神经机器翻译方法由于翻译准确率高,模型结构简单等优点已经成为机器翻译研究的重点,但其依然存在一个主要的缺点,该模型倾向于反复翻译某些源词,而错误地忽略掉部分词。针对这种情况,采用在端到端模型的基础上添加重构器的方法。首先利用Word2vec技术对蒙汉双语数据集进行向量化表示,然后预训练端到端的蒙汉神经机器翻译模型,最后对基于编码器-解码器重构框架的蒙汉神经机器翻译模型进行训练。将基于注意力机制的蒙汉神经机器翻译模型作为基线系统。实验结果表明,该框架显著提高了蒙汉机器翻译的充分性,比传统的基于注意力机制的蒙汉机器翻译模型具有更好的翻译效果。 相似文献
9.
针对蒙汉平行语料资源比较稀缺和现有平行语料数据覆盖面少等导致的蒙汉翻译质量不佳的问题,采用跨语言多任务学习的方式对机器翻译建模。在数据预处理阶段,引入两种新的无监督预训练和一种监督预训练的方法,用于跨语言建模来学习跨语言表示,并研究三种语言预训练方法在蒙汉翻译中的效果。实验结果表明,三种跨语言预训练的模型可以显著降低低资源语言的困惑度,提高蒙汉翻译质量。 相似文献
10.
建立公开、权威的蒙古文手写数据库是研究和开发蒙古文手写识别系统的基础。该文在蒙古文编码、构词和语法的研究基础上,公开了一个蒙古文大词汇量脱机手写数据库MHW,其中训练集由5 000个单词构成,每个词采集了20个样本,共包含10万样本,测试集Ⅰ包含5 000样本,测试集Ⅱ包含14 085样本。该文利用蒙古文文字长度可变特征研究了自动错误检测算法,提高了字库的可靠性。在三种常用手写识别模型上评估了字库的性能,其中基于循环神经网络的模型表现出最佳性能,在字典受限条件下测试集Ⅰ的词错误率达到2.20%,测试集Ⅱ达到了5.55%。 相似文献