首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
2.
刘颖  姜巍 《计算机工程与应用》2012,48(32):98-101,146
对齐短语是决定统计机器翻译系统质量的核心模块。提出基于短语结构树的层次短语模型,这是利用串-树模型的思想对层次短语模型的扩展。基于短语结构树的层次短语模型是在双语对齐短语的基础之上结合英语短语结构树抽取翻译规则,并利用启发式策略获得翻译规则的扩展句法标记。采用翻译规则的统计机器翻译系统在不同数据集上具有稳定的翻译结果,在训练集和测试集的平均BlEU评分高于短语模型和层次短语模型的BLEU评分。  相似文献   

3.
本文提出一种,针对专利文献的机器翻译系统中,通过人工撰写模板,提高翻译准确率的同时节省时间和人力的方法。此方法不仅仅限于韩汉翻译系统,也可广泛应用于其他语言之间的翻译系统。  相似文献   

4.
基于规则的维吾尔人名汉文机器翻译算法研究   总被引:1,自引:0,他引:1  
人名机器翻译传统的方法是依赖于预先建立的对照词库.这种方法的缺点是,因为不断出现新的人名而建立丰富、全面的对照词库是不可能的. 研究了维吾尔人名汉文音译规则:读音规则,并在此基础上提出了一种新的基于规则的维吾尔人名汉文机器翻译方法.实验结果表明,该方法不需要建立两种语言的对照词库,完全不用考虑会出现的新的人名,算法实现简单,准确度高,完全克服了传统方法的缺点.  相似文献   

5.
刘颖  姜巍 《计算机科学》2013,40(2):214-217
扩展HMM模型可以解决词语对齐结果与句法约束冲突,从而更好地进行词语对齐。在短语对齐基础上利 用目标语言的短语结构树抽取翻译规则。采用扩展CYK算法CYKA+作为系统的解码器,该算法可以处理非乔姆 斯基范式的翻译规则;采用两轮解码算法在解码过程中整合语言模型。实验表明,与传统词语对齐模型相比,改进的 HMM词语对齐模型具有更高的对齐准确率,并且翻译结果的BLEU评测得分更高。采用翻译规则的系统在不同数 据集上具有更稳定的翻译结果。两轮解码算法与立方剪枝算法具有相近的解码质量,但前者解码速度更快。  相似文献   

6.
基于统计学习的机器翻译模板自动获取方法   总被引:3,自引:1,他引:3  
本文提出了一种从未经深层次处理的双语口语语料库中自动获取机器翻译模板的方法。这种算法是一种无监督的、基于统计的、数据驱动的方法。这种方法有两个基本的步骤。首先,通过语法归纳分别从源语言和目标语言中获取语义类和短语结构类。然后,利用双语划界文法将短语结构类进行对齐。对齐的结果经过后处理就可以得到翻译的模板。初步的试验结果表明,本方法是有效的和切实可行的。  相似文献   

7.
基于短语模板对齐的统计机器翻译系统   总被引:1,自引:0,他引:1  
论文提出了一种基于短语模板对齐的机器翻译系统.系统采用基于短语模板对齐的翻译模型替代原始基于词的模型,提出了计算短语模板翻译概率的方法,改进了先前单纯基于短语的搜索算法和回溯方法,解码时引入繁衍度为0且出现频率高的词,使翻译结果更合理.论文进行了一系列实验,介绍了05年863评测,证明本系统翻译结果的Bleu得分比原来的系统有了显著提高.  相似文献   

8.
基于模板的机器翻译系统中模板库的自动构建技术   总被引:3,自引:0,他引:3  
林贤明  李堂秋  史晓东 《计算机应用》2004,24(9):127-128,135
基于模板的机器翻译(Template Based Machine Translation,TBMT)系统需要一个具有较大规模、句型覆盖面广泛的模板库,而这样的模板库单凭手工无法构建,需要利用计算机自动构建,提出了一种利用基于动态规划的相似模型与基于系统聚类法的分类模型,从句子对齐的双语语料库中抽取模板库的方法。该方法是在句子对齐的语料库中,首先运用系统聚类法对其进行聚类,使得包含相同模板的句子对被聚成一类,然后根据句子的相似度模型计算句子之间的相似度,进而从各个子类中将模板抽取出来,构建出整个模板库。  相似文献   

9.
为了改善专利文献的机器翻译效果, 提出了一种基于模板的机器翻译方法。通过分析汉英双语对齐的专利文献语料, 人工书写了600余条模板, 模板的设计思想源于弱化的正则文法; 设计和实现了一个模板翻译模块, 并将其与已有的一个基于规则的机器翻译系统相融合。实验结果表明, 40%以上的测试文本的翻译质量得到了提高, 因此, 这种基于模板的方法对于改善专利文献的机器翻译效果是有效的。  相似文献   

10.
在机器翻译的方法中,基于规则的翻译方法和基于实例的翻译方法都有各自的优缺点。结合两者的优点,提出了一种基于弱化语法规则的机器翻译方法,该方法在大量分析句子语法特征的基础上以及利用语言专家的知识构建语法规则库,在利用语法识别出句子后,把句子的各个组成部分标记出来,然后利用语义块进行匹配推理翻译出句子的各个组成部分。最后根据句法把句子的各个译出的组成部分装配起来形成译文。实验表明,该方法达到了较好的翻译效果,并且具有较大的发展潜力。  相似文献   

11.
统计机器翻译中的非连续短语模板抽取及其应用   总被引:1,自引:0,他引:1  
孙越恒  段楠  侯越先 《计算机科学》2009,36(10):192-196
目前基于短语的统计机器翻译模型很少将非连续短语的情况考虑在内,由此造成翻译结果在目标语言中的意义变化或缺失。以非连续介词短语为例,提供了一种短语模板抽取算法。首先采用基于规则的方法,抽取出中文非连续介词短语模板,而后借助双语对齐语料和介词_方位词翻译表,获得模板对应的英文翻译。最终形成的双语模板被加入短语翻译表中。在标准测试语料上的对比实验表明,加入非连续短语模板后,译文更加符合语法规范,而翻译结果也取得了相对稳定的提高。  相似文献   

12.
索引模板匹配替换通用算法能够自动快速地从模板对应规则库找到与英语句子中相匹配的英语模板,并将其替换成相对应的汉语模板。以该算法为基础的英汉翻译系统能够合理地综合基于规则和基于例子的翻译系统的优点,同时能够在一定程度上克服它们的缺点。速度测试表明,该该英汉翻译系统在P—IV1.7G的计算机上的翻译速度每秒可以达到1300个单词左右;质量测试表明,该系统具有较好的发展潜力。  相似文献   

13.
基于通用模板匹配替换方法的英汉翻译系统   总被引:4,自引:1,他引:4  
在常项、变项、模板和实例等概念的基础上,提出了一种用模板匹配替换策略实现机器翻译系统的新方法,并通过若干翻译实例说明了该方法在用于实现英汉翻译系统的工作过程和潜在优势。引入适当的启发式索引机制后,以该方法为基础实现的英汉翻译系统翻译速度每秒可以达到500-600个单词。通过对470个有代表性的英语句子进行翻译测试表明,该系统的翻译正确率达到了93.6%,超过了目前市场上流行的英汉翻译系统。  相似文献   

14.
用CORBA技术构建TMN中的被管对象的接口,可以加快实现异构环境下电信网的分布式管理。通过研究TMN中的GDMO模板和CORBA中的IDL接口,可以建立二者之间的映射规则。这种映射关系可以通过两层转换来实现。第一层转换是ASN.1到IDL语言之间的转换;第二层转换则是GDMO模板到IDL接口的转换。  相似文献   

15.
机器翻译(MachineTranslation,简称MT)是21世纪科技领域的一个难题之一,而要实现机器翻译,对自然语言进行形式化是核心。机器翻译的突破依赖于语言学研究的突破。该文介绍一种汉语句子形式化的方法。涉及的内容包括Montague语法,范畴语法,内涵逻辑,汉语语法等。该文主要在理论上进行了探讨,并用例子进行详细说明该汉语句子形式化方法在英汉机器翻译中的应用。结果表明,该方法具有一定的有效性。  相似文献   

16.
基于实例的机器翻译处理方法   总被引:11,自引:0,他引:11  
杨宪泽 《计算机工程》2003,29(21):51-52,135
在机器翻译的研究中,基于实例是一种很好的方法。文章讨论了完全实例的机器翻译、实例句型转换的机器翻译以及实例近似机器翻译。  相似文献   

17.
该文对神经机器翻译中的数据泛化方法和短语生成方法进行研究。在使用基于子词的方法来缓解未登录词和稀疏词汇问题的基础上,提出使用数据泛化的方法来进一步优化未登录词和稀疏词汇的翻译,缓解了子词方法中出现的错译问题。文中对基于子词的方法和基于数据泛化的方法进行了详细的实验对比,对两种方法的优缺点进行了讨论和说明。针对数据泛化的处理方法,提出了一致性检测方法和解码优化方法。由于标准的神经机器翻译模型以词汇为基础进行翻译建模,因此该文提出了一种规模可控的短语生成方法,通过使用该文方法生成的源语言短语,神经机器翻译的翻译性能进一步提高。最终,在汉英和英汉翻译任务上,翻译性能与基线翻译系统相比分别提高了1.3和1.2个BLEU值。  相似文献   

18.
This paper presents a structural statistical machine translation (SSMT) model to deal with the data sparseness problem that occurs as a result of the necessarily small corpus to translate Chinese into Taiwanese Sign Language (TSL). A parallel bilingual corpus was developed, and linguistic information from the Sinica Treebank is adopted for Chinese sentence analysis. The synchronous context free grammar (SCFG) was adopted to convert a Chinese structure to the corresponding TSL structure and then extract a translation memory which comprises the thematic relations between the grammar rules of both structures. In structural translation, the statistical MT (SMT) approach was used to align the thematic roles in the grammar rules and the translation memory provides the reference templates for TSL structure translation. Finally, the agreement information for TSL verbs was labeled for enriching the expressiveness of the translated TSL sequence. Several experiments were conducted to evaluate the translation performance and the communication effectiveness for the deaf. The evaluation results demonstrate that the proposed approach outperforms a baseline statistical MT system using the same small corpus, especially for the translation of long sentences.  相似文献   

19.
一种混合式机器翻译方法的分析研究   总被引:1,自引:0,他引:1  
在机器翻译的研究中,混合式方法是一种好方法。本文的工作有两部分:第一部分提出新的句型转换的机器翻译方法;第二部分讨论近似机器翻译方法的改进,并对对齐处理、相似度计算和检索方法做了详细说明。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号