期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

曹骞熊德意《中文信息学报》2020,34(5):36-43

神经机器翻译是目前机器翻译领域的主流方法,而翻译记忆是一种帮助专业翻译人员避免重复翻译的工具,其保留之前完成的翻译句对并存储在翻译记忆库中,进而在之后的翻译过程中通过检索去重用这些翻译。该文基于数据扩充提出两种将翻译记忆与神经机器翻译相结合的方法:(1)直接拼接翻译记忆在源语句后面;(2)通过标签向量拼接翻译记忆。该文在中英与英德数据集上进行了实验,实验表明,该方法可以使翻译性能获得显著提升。相似文献

2.

基于句法和语义的英汉翻译记忆系统设计研究

董菊霞《广东电脑与电讯》2022,(8):84-89

为了提高英汉翻译系统译文精准性和作业效率,选取翻译记忆技术作为开发工具,提出一种基于句法和语义的英汉翻译记忆系统设计研究。该系统将句子拆分为多个短句,提取语义和句法,将其与记忆库中的翻译资源进行比较,计算相似度,判断译文句子是否达到直接使用标准。如果未能达到标准,采取人工修正的方式调整译文,并存储至记忆库中。系统测试结果显示,本系统译文的相似度在[0.95,1]之间句子更多。随着句子数量的增加,作业效率明显提升,且重复句子较多的情况下优势更为显著。相似文献

3.

专业翻译领域的首选技术——翻译记忆

弈风《微电脑世界》2000,(28):11-12

机器翻译在中国纵观当前国内翻译软件市场,今天译“星”,明日译“霸”,群雄并起,竞争激烈。仔细分析这些产品之后,我们可以将其分为两大类:电子辞典和机器翻译。电子辞典的优点自不待言,对词的翻译准确而且快速,但在专业翻译领域,电子辞典所能做的毕竟十分有限。机器翻译又称自动化翻译,其宗旨是在一定范围或一定领域内取代翻译人员的劳动。但语言是一套非常复杂的系相似文献

4.

翻译记忆中语句相似度计算方法的研究 总被引：1，自引：0，他引：1

周文徐国梁《计算机应用》2007,27(5):1210-1213

对翻译记忆的关键技术——语句相似度的几种常用计算方法进行了分析,针对英汉翻译记忆系统的要求,提出了基于块的方法计算英语句子相似度,通过将英语句子按照句型分类存储,组合句子各个组成块的语义相似度与权重来得到整个句子的相似度。结果证明,它能很好的反映句子在语义和结构上的相似程度。相似文献

5.

国内外四种常见计算机辅助翻译软件比较研究

葛惠文《网友世界》2014,(23):7-8

计算机辅助翻译软件能够对翻译的效率和质量有着明显提高的作用,但是在当下各种计算机辅助翻译软件层出不穷的情况下,使用者想要选择到一个与自身翻译需求相符合的计算机辅助翻译软件是比较困难的。本文就对国内外常见的四种计算机辅助翻译软件进行了比较,以期提供参考。相似文献

6.

统计机器翻译和翻译记忆的动态融合方法研究

汪昆宗成庆苏克毅《中文信息学报》2015,29(2):87-94

在融合翻译记忆和统计机器翻译的整合式模型的基础上,该文提出在解码过程中进一步地动态加入翻译记忆中新发现的短语对。它在机器翻译解码过程中,动态地加入翻译记忆片段作为候选,并利用翻译记忆的相关信息,指导基于短语的翻译模型进行解码。实验结果表明该方法显著提高了翻译质量: 与翻译记忆系统相比,该方法提高了21.15个BLEU值,降低了21.47个TER值;与基于短语的翻译系统相比,该方法提高了5.16个BLEU值,降低了4.05个TER值。相似文献

7.

数据的筛选

姜家轩刘鲜京《新浪潮．学网络》1992,(2):6-7

相似文献

8.

基于分段语义比较的语句相似度计算方法

刘运通梁燕军《计算机工程与设计》2013,34(7)

为了能更为准确地计算两个语句之间的语义相似度;提出了一种基于分段语义比较的语句相似度计算方法.将语句分成主干部分和修饰部分,并根据设定的语法规则,对修饰部分进行更为细致的划分;计算语义相似度时,将计算过程分为两部分:主干部分计算、修饰部分计算,并赋以不同权值;能够按照语法和语义结构,更为合理、细致地计算出两个语句之间的语义相似程度.实验结果表明了该方法的能够取得较好的计算结果. 相似文献

9.

基于长短时记忆网络的电商大数据同一性标定

刘亚波吴秋轩《计算机工程与科学》2021,43(3):407-415

政府采购平台上的电商大数据,由于商品种类繁多且书写格式无统一规范,采用传统模型在大数据中标定出同一种商品时准确率低、速度慢、样本利用率低、泛化能力不足.提出一种基于长短时记忆网络(LSTM)的同一性标定模型,该模型由分词、重要性排序和相似度计算3个子模型串联组成.分词子模型对电商大数据进行预处理,获得有区分度的关键词序列;LSTM重要性排序子模型筛选最能表征商品信息的重要关键词序列;LS T M相似度计算子模型在给定大数据中准确标定出同一种商品.另外还引入二分查找、GloVe词向量化和词序列语义校验技术,分别用于提高标定速度、训练样本利用率与标定泛化能力.实验结果表明,在处理不同品类的电商大数据时,所提模型对易混淆样本的同一性标定准确率高. 相似文献

10.

基于EDA的中文语义相似度数据集增强方法

《软件》2021,42(5)

相似文献

11.

基于共享内存的实时数据保存系统研究

蒲源李建军李钊崔洪亮吴琳《计算机与网络》2010,(21):55-58

详细介绍了基于共享内存的半实物实时仿真平台中数据保存系统的设计思路、工作原理和关键技术。通过对WindowsNT操作系统线程调度和中断响应的实时性改造和”中断驱动读取数据一数据缓冲暂存数据一多线程保存数据”软件架构的优化设计,改善了WindowsNT下中断响应和线程调度的实时性和确定性性能,实现了多节点、任意数据量的同时保存,为半实物实时仿真系统有效工作打下了基础。相似文献

12.

存储体系构建和存储系统性能研究

胡勇《数字社区&智能家居》2009,(25)

存储系是计算机系统的关键,它的性能的好坏、怎样组织直接影响着计算机的性能,本文重点在深入分析存储系统的性能的基础上来探讨存储体系的构建,构建良好的存储系统是计算机控制系统,单片机控制系统的关键,存储系统构建的好坏,直接影响着前端的数据采集和系统控制。相似文献

13.

存储体系构建和存储系统性能研究

胡勇《数字社区&智能家居》2009,5(9):7303-7304,7307

存储系是计算机系统的关键,它的性能的好坏、怎样组织直接影响着计算机的性能,本文重点在深入分析存储系统的性能的基础上来探讨存储体系的构建,构建良好的存储系统是计算机控制系统,单片机控制系统的关键,存储系统构建的好坏,直接影响着前端的数据采集和系统控制。相似文献

14.

铁电存储器在验光仪数据存储系统中的应用

戈录永《单片机与嵌入式系统应用》2010,(11):76-77

引言在综合验光仪的验光过程中,用户会根据不同的测试需求和习惯设置一些系统配置参数,这些参数需要保存起来;更为重要的是,患者测得的双眼屈光数据也需要长时间地保存起来,以备下次更换眼镜时作为配镜参考和数据比较。这样,就面临一个系统掉电后数据保存的问题。相似文献

15.

神经机器翻译中数据泛化与短语生成方法研究

李强韩雅倩肖桐朱靖波《中文信息学报》2018,32(8):42-52

该文对神经机器翻译中的数据泛化方法和短语生成方法进行研究。在使用基于子词的方法来缓解未登录词和稀疏词汇问题的基础上,提出使用数据泛化的方法来进一步优化未登录词和稀疏词汇的翻译,缓解了子词方法中出现的错译问题。文中对基于子词的方法和基于数据泛化的方法进行了详细的实验对比,对两种方法的优缺点进行了讨论和说明。针对数据泛化的处理方法,提出了一致性检测方法和解码优化方法。由于标准的神经机器翻译模型以词汇为基础进行翻译建模,因此该文提出了一种规模可控的短语生成方法,通过使用该文方法生成的源语言短语,神经机器翻译的翻译性能进一步提高。最终,在汉英和英汉翻译任务上,翻译性能与基线翻译系统相比分别提高了1.3和1.2个BLEU值。相似文献

16.

一种基于Paxos算法的证券交易系统内存复制方法研究

黄晓东张勇邢春晓黄寅飞武剑锋白硕《计算机科学》2012,39(12):145-148

近年来随着高速网络技术的发展与高频交易需求的增加,提升交易速度成为电子商务交易提供者的重要关切。当前交易系统通常采用基于共享存储的主备机复制方法来保证高可用性与数据持久性,但因其存在持久化的性能瓶颈而无法进一步降低延迟。为此,提出一种基于Paxos算法的内存数据复制方法,即通过消息传递完成主备机复制,以保证结点间数据的一致性,容忍可能发生的良性故障;并以证券交易系统场景为例对其进行分析。实验结果表明,相比基于共享存储的主备机复制,该方法在万兆以太网环境下可将交易系统订单处理延迟由毫秒级降至百微秒级,并在主机故障时正确地完成热备切换。相似文献

17.

分布式系统中数据分解的研究

沈亚楠姚远张平赵荣彩罗向阳《计算机工程》2006,32(11):114-115,132

数据分解对消息传递并行机下的并行编译器取得高性能至关重要。根据编译器自动得出的数据分解（映射数据到处理机）信息,C语言版本的发送／接收消息循环嵌套可产生出来,从而在处理机之间实现分布数据。不仅一个已被证明且功能强大的数学模型用于产生数据分解代码,而且一个形式化的算法及其实现也已给出。初步实验结果显示该算法能显著提高性能。相似文献

18.

基于大数据的瓦斯报警甄别研究

杨建全李筱李雅斌《测控技术》2019,38(6):82-85

瓦斯报警的正确性和准确性是煤矿安全生产的重大问题。煤矿安全监控系统实时对井下环境进行检测,每天产生大量数据,用传统方法不能准确快速地甄别出瓦斯突出、异常数据或者传感器正常标校的情况。为此,利用基于时间序列的大数据挖掘技术,研究了煤矿安全生产中瓦斯报警问题,解决了传统人工识别方法不能快速甄别瓦斯报警类型等难题。详细论述了时间序列的大数据挖掘技术,针对煤矿的具体情况建立了相关的数学模型,并将系统用于平煤神马集团。实用表明,对瓦斯报警的甄别达到了比较高的准确率,较好地解决了瓦斯报警数据的甄别问题。相似文献

19.

单片机16MB数据存储器组织

吴永祥吴涛《工矿自动化》2000,(4)

一般单片机外扩展数据存储器容量不超过 64KB。文章介绍一种外扩展数据存储器容量为 1 6MB的单片机系统的设计方案。相似文献