共查询到19条相似文献,搜索用时 78 毫秒
1.
神经机器翻译是目前机器翻译领域的主流方法,而翻译记忆是一种帮助专业翻译人员避免重复翻译的工具,其保留之前完成的翻译句对并存储在翻译记忆库中,进而在之后的翻译过程中通过检索去重用这些翻译。该文基于数据扩充提出两种将翻译记忆与神经机器翻译相结合的方法:(1)直接拼接翻译记忆在源语句后面;(2)通过标签向量拼接翻译记忆。该文在中英与英德数据集上进行了实验,实验表明,该方法可以使翻译性能获得显著提升。 相似文献
2.
为了提高英汉翻译系统译文精准性和作业效率,选取翻译记忆技术作为开发工具,提出一种基于句法和语义的英汉翻译记忆系统设计研究。该系统将句子拆分为多个短句,提取语义和句法,将其与记忆库中的翻译资源进行比较,计算相似度,判断译文句子是否达到直接使用标准。如果未能达到标准,采取人工修正的方式调整译文,并存储至记忆库中。系统测试结果显示,本系统译文的相似度在[0.95,1]之间句子更多。随着句子数量的增加,作业效率明显提升,且重复句子较多的情况下优势更为显著。 相似文献
3.
机器翻译在中国 纵观当前国内翻译软件市场,今天译“星”,明日译“霸”,群雄并起,竞争激烈。仔细分析这些产品之后,我们可以将其分为两大类:电子辞典和机器翻译。 电子辞典的优点自不待言,对词的翻译准确而且快速,但在专业翻译领域,电子辞典所能做的毕竟十分有限。 机器翻译又称自动化翻译,其宗旨是在一定范围或一定领域内取代翻译人员的劳动。但语言是一套非常复杂的系 相似文献
4.
翻译记忆中语句相似度计算方法的研究 总被引:1,自引:0,他引:1
对翻译记忆的关键技术——语句相似度的几种常用计算方法进行了分析,针对英汉翻译记忆系统的要求,提出了基于块的方法计算英语句子相似度,通过将英语句子按照句型分类存储,组合句子各个组成块的语义相似度与权重来得到整个句子的相似度。结果证明,它能很好的反映句子在语义和结构上的相似程度。 相似文献
5.
计算机辅助翻译软件能够对翻译的效率和质量有着明显提高的作用,但是在当下各种计算机辅助翻译软件层出不穷的情况下,使用者想要选择到一个与自身翻译需求相符合的计算机辅助翻译软件是比较困难的。本文就对国内外常见的四种计算机辅助翻译软件进行了比较,以期提供参考。 相似文献
6.
8.
为了能更为准确地计算两个语句之间的语义相似度;提出了一种基于分段语义比较的语句相似度计算方法.将语句分成主干部分和修饰部分,并根据设定的语法规则,对修饰部分进行更为细致的划分;计算语义相似度时,将计算过程分为两部分:主干部分计算、修饰部分计算,并赋以不同权值;能够按照语法和语义结构,更为合理、细致地计算出两个语句之间的语义相似程度.实验结果表明了该方法的能够取得较好的计算结果. 相似文献
9.
政府采购平台上的电商大数据,由于商品种类繁多且书写格式无统一规范,采用传统模型在大数据中标定出同一种商品时准确率低、速度慢、样本利用率低、泛化能力不足.提出一种基于长短时记忆网络(LSTM)的同一性标定模型,该模型由分词、重要性排序和相似度计算3个子模型串联组成.分词子模型对电商大数据进行预处理,获得有区分度的关键词序列;LSTM重要性排序子模型筛选最能表征商品信息的重要关键词序列;LS T M相似度计算子模型在给定大数据中准确标定出同一种商品.另外还引入二分查找、GloVe词向量化和词序列语义校验技术,分别用于提高标定速度、训练样本利用率与标定泛化能力.实验结果表明,在处理不同品类的电商大数据时,所提模型对易混淆样本的同一性标定准确率高. 相似文献
10.
11.
12.
胡勇 《数字社区&智能家居》2009,(25)
存储系是计算机系统的关键,它的性能的好坏、怎样组织直接影响着计算机的性能,本文重点在深入分析存储系统的性能的基础上来探讨存储体系的构建,构建良好的存储系统是计算机控制系统,单片机控制系统的关键,存储系统构建的好坏,直接影响着前端的数据采集和系统控制。 相似文献
13.
胡勇 《数字社区&智能家居》2009,5(9):7303-7304,7307
存储系是计算机系统的关键,它的性能的好坏、怎样组织直接影响着计算机的性能,本文重点在深入分析存储系统的性能的基础上来探讨存储体系的构建,构建良好的存储系统是计算机控制系统,单片机控制系统的关键,存储系统构建的好坏,直接影响着前端的数据采集和系统控制。 相似文献
14.
戈录永 《单片机与嵌入式系统应用》2010,(11):76-77
引言
在综合验光仪的验光过程中,用户会根据不同的测试需求和习惯设置一些系统配置参数,这些参数需要保存起来;更为重要的是,患者测得的双眼屈光数据也需要长时间地保存起来,以备下次更换眼镜时作为配镜参考和数据比较。这样,就面临一个系统掉电后数据保存的问题。 相似文献
15.
该文对神经机器翻译中的数据泛化方法和短语生成方法进行研究。在使用基于子词的方法来缓解未登录词和稀疏词汇问题的基础上,提出使用数据泛化的方法来进一步优化未登录词和稀疏词汇的翻译,缓解了子词方法中出现的错译问题。文中对基于子词的方法和基于数据泛化的方法进行了详细的实验对比,对两种方法的优缺点进行了讨论和说明。针对数据泛化的处理方法,提出了一致性检测方法和解码优化方法。由于标准的神经机器翻译模型以词汇为基础进行翻译建模,因此该文提出了一种规模可控的短语生成方法,通过使用该文方法生成的源语言短语,神经机器翻译的翻译性能进一步提高。最终,在汉英和英汉翻译任务上,翻译性能与基线翻译系统相比分别提高了1.3和1.2个BLEU值。 相似文献
16.
近年来随着高速网络技术的发展与高频交易需求的增加,提升交易速度成为电子商务交易提供者的重要关
切。当前交易系统通常采用基于共享存储的主备机复制方法来保证高可用性与数据持久性,但因其存在持久化的性
能瓶颈而无法进一步降低延迟。为此,提出一种基于Paxos算法的内存数据复制方法,即通过消息传递完成主备机复
制,以保证结点间数据的一致性,容忍可能发生的良性故障;并以证券交易系统场景为例对其进行分析。实验结果表
明,相比基于共享存储的主备机复制,该方法在万兆以太网环境下可将交易系统订单处理延迟由毫秒级降至百微秒
级,并在主机故障时正确地完成热备切换。 相似文献
17.
18.
瓦斯报警的正确性和准确性是煤矿安全生产的重大问题。煤矿安全监控系统实时对井下环境进行检测,每天产生大量数据,用传统方法不能准确快速地甄别出瓦斯突出、异常数据或者传感器正常标校的情况。为此,利用基于时间序列的大数据挖掘技术,研究了煤矿安全生产中瓦斯报警问题,解决了传统人工识别方法不能快速甄别瓦斯报警类型等难题。详细论述了时间序列的大数据挖掘技术,针对煤矿的具体情况建立了相关的数学模型,并将系统用于平煤神马集团。实用表明,对瓦斯报警的甄别达到了比较高的准确率,较好地解决了瓦斯报警数据的甄别问题。 相似文献
19.
一般单片机外扩展数据存储器容量不超过 64KB。文章介绍一种外扩展数据存储器容量为 1 6MB的单片机系统的设计方案。 相似文献