共查询到19条相似文献,搜索用时 109 毫秒
2.
对齐短语是决定统计机器翻译系统质量的核心模块。提出基于短语结构树的层次短语模型,这是利用串-树模型的思想对层次短语模型的扩展。基于短语结构树的层次短语模型是在双语对齐短语的基础之上结合英语短语结构树抽取翻译规则,并利用启发式策略获得翻译规则的扩展句法标记。采用翻译规则的统计机器翻译系统在不同数据集上具有稳定的翻译结果,在训练集和测试集的平均BlEU评分高于短语模型和层次短语模型的BLEU评分。 相似文献
3.
张延花 《计算机光盘软件与应用》2014,(12):139-140
本文提出一种,针对专利文献的机器翻译系统中,通过人工撰写模板,提高翻译准确率的同时节省时间和人力的方法。此方法不仅仅限于韩汉翻译系统,也可广泛应用于其他语言之间的翻译系统。 相似文献
4.
基于规则的维吾尔人名汉文机器翻译算法研究 总被引:1,自引:0,他引:1
人名机器翻译传统的方法是依赖于预先建立的对照词库.这种方法的缺点是,因为不断出现新的人名而建立丰富、全面的对照词库是不可能的. 研究了维吾尔人名汉文音译规则:读音规则,并在此基础上提出了一种新的基于规则的维吾尔人名汉文机器翻译方法.实验结果表明,该方法不需要建立两种语言的对照词库,完全不用考虑会出现的新的人名,算法实现简单,准确度高,完全克服了传统方法的缺点. 相似文献
5.
扩展HMM模型可以解决词语对齐结果与句法约束冲突,从而更好地进行词语对齐。在短语对齐基础上利
用目标语言的短语结构树抽取翻译规则。采用扩展CYK算法CYKA+作为系统的解码器,该算法可以处理非乔姆
斯基范式的翻译规则;采用两轮解码算法在解码过程中整合语言模型。实验表明,与传统词语对齐模型相比,改进的
HMM词语对齐模型具有更高的对齐准确率,并且翻译结果的BLEU评测得分更高。采用翻译规则的系统在不同数
据集上具有更稳定的翻译结果。两轮解码算法与立方剪枝算法具有相近的解码质量,但前者解码速度更快。 相似文献
6.
7.
8.
基于模板的机器翻译系统中模板库的自动构建技术 总被引:3,自引:0,他引:3
基于模板的机器翻译(Template Based Machine Translation,TBMT)系统需要一个具有较大规模、句型覆盖面广泛的模板库,而这样的模板库单凭手工无法构建,需要利用计算机自动构建,提出了一种利用基于动态规划的相似模型与基于系统聚类法的分类模型,从句子对齐的双语语料库中抽取模板库的方法。该方法是在句子对齐的语料库中,首先运用系统聚类法对其进行聚类,使得包含相同模板的句子对被聚成一类,然后根据句子的相似度模型计算句子之间的相似度,进而从各个子类中将模板抽取出来,构建出整个模板库。 相似文献
9.
10.
11.
12.
索引模板匹配替换通用算法能够自动快速地从模板对应规则库找到与英语句子中相匹配的英语模板,并将其替换成相对应的汉语模板。以该算法为基础的英汉翻译系统能够合理地综合基于规则和基于例子的翻译系统的优点,同时能够在一定程度上克服它们的缺点。速度测试表明,该该英汉翻译系统在P—IV1.7G的计算机上的翻译速度每秒可以达到1300个单词左右;质量测试表明,该系统具有较好的发展潜力。 相似文献
13.
基于通用模板匹配替换方法的英汉翻译系统 总被引:4,自引:1,他引:4
在常项、变项、模板和实例等概念的基础上,提出了一种用模板匹配替换策略实现机器翻译系统的新方法,并通过若干翻译实例说明了该方法在用于实现英汉翻译系统的工作过程和潜在优势。引入适当的启发式索引机制后,以该方法为基础实现的英汉翻译系统翻译速度每秒可以达到500-600个单词。通过对470个有代表性的英语句子进行翻译测试表明,该系统的翻译正确率达到了93.6%,超过了目前市场上流行的英汉翻译系统。 相似文献
14.
用CORBA技术构建TMN中的被管对象的接口,可以加快实现异构环境下电信网的分布式管理。通过研究TMN中的GDMO模板和CORBA中的IDL接口,可以建立二者之间的映射规则。这种映射关系可以通过两层转换来实现。第一层转换是ASN.1到IDL语言之间的转换;第二层转换则是GDMO模板到IDL接口的转换。 相似文献
15.
机器翻译(MachineTranslation,简称MT)是21世纪科技领域的一个难题之一,而要实现机器翻译,对自然语言进行形式化是核心。机器翻译的突破依赖于语言学研究的突破。该文介绍一种汉语句子形式化的方法。涉及的内容包括Montague语法,范畴语法,内涵逻辑,汉语语法等。该文主要在理论上进行了探讨,并用例子进行详细说明该汉语句子形式化方法在英汉机器翻译中的应用。结果表明,该方法具有一定的有效性。 相似文献
16.
17.
该文对神经机器翻译中的数据泛化方法和短语生成方法进行研究。在使用基于子词的方法来缓解未登录词和稀疏词汇问题的基础上,提出使用数据泛化的方法来进一步优化未登录词和稀疏词汇的翻译,缓解了子词方法中出现的错译问题。文中对基于子词的方法和基于数据泛化的方法进行了详细的实验对比,对两种方法的优缺点进行了讨论和说明。针对数据泛化的处理方法,提出了一致性检测方法和解码优化方法。由于标准的神经机器翻译模型以词汇为基础进行翻译建模,因此该文提出了一种规模可控的短语生成方法,通过使用该文方法生成的源语言短语,神经机器翻译的翻译性能进一步提高。最终,在汉英和英汉翻译任务上,翻译性能与基线翻译系统相比分别提高了1.3和1.2个BLEU值。 相似文献
18.
Hung-Yu Su Chung-Hsien Wu 《IEEE transactions on audio, speech, and language processing》2009,17(7):1305-1315
This paper presents a structural statistical machine translation (SSMT) model to deal with the data sparseness problem that occurs as a result of the necessarily small corpus to translate Chinese into Taiwanese Sign Language (TSL). A parallel bilingual corpus was developed, and linguistic information from the Sinica Treebank is adopted for Chinese sentence analysis. The synchronous context free grammar (SCFG) was adopted to convert a Chinese structure to the corresponding TSL structure and then extract a translation memory which comprises the thematic relations between the grammar rules of both structures. In structural translation, the statistical MT (SMT) approach was used to align the thematic roles in the grammar rules and the translation memory provides the reference templates for TSL structure translation. Finally, the agreement information for TSL verbs was labeled for enriching the expressiveness of the translated TSL sequence. Several experiments were conducted to evaluate the translation performance and the communication effectiveness for the deaf. The evaluation results demonstrate that the proposed approach outperforms a baseline statistical MT system using the same small corpus, especially for the translation of long sentences. 相似文献
19.
一种混合式机器翻译方法的分析研究 总被引:1,自引:0,他引:1
在机器翻译的研究中,混合式方法是一种好方法。本文的工作有两部分:第一部分提出新的句型转换的机器翻译方法;第二部分讨论近似机器翻译方法的改进,并对对齐处理、相似度计算和检索方法做了详细说明。 相似文献