首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 104 毫秒
1.
本文介绍一种基于模式的机器翻译的译文生成方法,并提出一种句法结构与语义信息相结合的模板匹配算法。最后给出本算法对英语句子进行测试的实验结果。  相似文献   

2.
基于实例的机器翻译(Example-Based Machine Translation,简称EBMT)通过模仿实例的翻译实现源文的翻译.在EBMT中,实例的匹配是关键,它直接关系到EBMT本身的翻译质量.文章通过对现有几类实例匹配算法的比较和研究,提出一种基于模式的实例匹配算法.  相似文献   

3.
基于实例的机器翻译 (Example BasedMachineTranslation ,简称EBMT)通过模仿实例的翻译实现源文的翻译。在EBMT中 ,实例的匹配是关键 ,它直接关系到EBMT本身的翻译质量。文章通过对现有几类实例匹配算法的比较和研究 ,提出一种基于模式的实例匹配算法。  相似文献   

4.
基于Ontology的英汉机器翻译研究   总被引:7,自引:1,他引:7  
高质量的机器翻译(Machine Translation)系统必须充分结合语言学知识以及语言中性的世界知识。近年来,ontology被广泛用于在概念层对世界知识建模,本文介绍一个基于ontology的英汉机器翻译模型系统,在这个系统中,ontology作为世界知识的模型,它是通过把概念组织成一个层次结构并同时在概念间建立丰富的概念联系而构成的。通过把某种语言中的词汇映射到ontology中的概念,可以支持在源语言分析时进行歧义消解和目标语生成时的词汇选择,并可以作为源语言和目的语言之间的中介表示的概念来源。在系统中,中介表示是用概念图(Conceptual Graph)来表示的。  相似文献   

5.
XMMT英汉机器翻译系统   总被引:1,自引:0,他引:1  
本文通过英汉机器翻译系统的设计思想和结构, 阐述如何综合应用人工智能技术, 研制翻译质量高, 通用性好, 能扩展成多种语言翻译系统的一种方法。系统设计的侧重点在于如何提高系统的翻译质量。文中给出了主要模块的算法原理, 在附录部分还给出了这个系统的一些翻译例子。  相似文献   

6.
英汉机器翻译技术能够完成英文与汉文的实时翻译,国内外对英汉机器翻译技术做了大量研究和实验。首先简要介绍了英汉机器翻译的研究状况,对已存在的2种英汉机器翻译技术进行研究分析,为英汉机器翻译技术的进一步发展提供了一定的理论依据。  相似文献   

7.
英汉机器翻译中的语义分析   总被引:2,自引:0,他引:2  
  相似文献   

8.
戚世远 《计算机应用》1991,11(5):11-13,20
本文介绍了作者在 IBM—PC/XT 机上采用语义分析方法实现的英汉机器翻译系统。该系统是单向、全自动翻译系统,系统由总控,字典维护、字典查询、分析树生成、转换生成五个模块,全部程序用 Turbo—Prolog 逻辑程序设计语言编写。文章主要介绍了作者在介词短语语义分析方面的一些工作。  相似文献   

9.
蒙古文的形态变化非常丰富,在动词词类上该特点更为明显。我们对蒙古文的动词自动生成方法进行了系统的研究。该文利用生成的蒙古语动词库,给出了对基于层次短语的汉蒙统计机器翻译译文中句尾错误词形动词进行纠正处理的方法。实验表明,该方法可以提高汉蒙机器翻译的性能和流利度。  相似文献   

10.
机器翻译译文质量估计(Quality Estimation, QE)是指在不需要人工参考译文的条件下,估计机器翻译系统产生的译文的质量,对机器翻译研究和应用具有很重要的价值。机器翻译译文质量估计经过最近几年的发展,取得了丰富的研究成果。该文首先介绍了机器翻译译文质量估计的背景与意义;然后详细介绍了句子级QE、单词级QE、文档级QE的具体任务目标、评价指标等内容,进一步概括了QE方法发展的三个阶段:基于特征工程和机器学习的QE方法阶段,基于深度学习的QE方法阶段,融入预训练模型的QE方法阶段,并介绍了每一阶段中的代表性研究工作;最后分析了目前的研究现状及不足,并对未来QE方法的研究及发展方向进行了展望。  相似文献   

11.
英汉机器翻译系统ECT中的知识库   总被引:1,自引:0,他引:1  
提出 E- Chunk概念 ,它是一种新的知识表示方式 .E- Chunk是无歧义翻译单元 ,形式上是一个无翻译歧义的单词或单词串 .它是基于语义定义的 ,具有无歧义性、复现性、可嵌套性、内部结构句法自足性等特征 .本文详细介绍了英汉机器翻译系统 ECT中的三类知识库 :电子词典、E- Chunk库和规则库  相似文献   

12.
人称代词处于一切自然语言的词汇核心层,机器翻译对其处理是否得当影响极大。本文运用对比分析的方法,揭示英汉人称代词的异同,同时针对机器翻译对人称代词处理的不足,提出解决问题的途径。  相似文献   

13.
篇章机器翻译的首要问题是确定翻译单位。基于汉语和英语的语言知识和英汉翻译的实践,该文提出面向篇章机器翻译的基本单位和复合单位的双层单位体系,讨论了这两种单位支持篇章翻译应满足的性质,并据此勾画了篇章机器翻译的拆分、翻译、装配三步模型(PTA模型)。该文提出,汉语篇章机器翻译的复合单位为广义话题结构对应的文本块,基本单位则是根据广义话题结构流水模型得到的话题自足句;英语篇章机器翻译的复合单位为句号句,基本单位为naming-telling小句(NT小句),即指称性成分加上对它的陈述或后修饰成分所构成的小句。该文展示了在这样的翻译单位体系下采用PTA模型的英汉翻译过程实例,规划了面向篇章翻译的英汉小句对齐语料库的建设任务,讨论了PTA模型的可行性。
  相似文献   

14.
基于英汉机译实现跨语言信息检索   总被引:8,自引:0,他引:8  
随着日益增长的大量信息成为可利用的、用户面对查询一个多语种文本集合的情形,变得越来越普遍。这就产生一个非常重要的问题一以一种语言描述的用户查询与以不同语言书写的文本之间的匹配问题,也就是一种如何跨越语言界限的问题,即跨语言信息检索(Cross-Language Information Retrievat,CLIR)。针对该项任务建立了一个面向英汉的跨语言信息检索系统,并以此为基础提交了相关的几组运行结果。同时,结合所构建的汉语IR系统,实现完整的英一汉CLIR过程。  相似文献   

15.
一个基于GLR算法的英汉机器翻译浅层句法分析器   总被引:5,自引:0,他引:5  
浅层句法分析是指短语级的自然语言句法分析。在研制MatLink英汉机器翻译系统的过程中,提出了扩充的CFG文法用于描述英语短语句法,并改进了GLR算法,设计实现了用于英汉翻译的英语浅层句法分析器。该分析器采用多出口的分析表结构,引入符号映射函数实现短语边界的自动识别,用孩子兄弟树描述短语的句法结构,并通过短语转换模式实现源语言向目标语言的短语级转换。最后,通过对一个实例句子的分析阐述了该浅层句法分析器的设计思想和工作过程。  相似文献   

16.
The Toshiba Machine Translation System consists of a 32-bit minicomputer (UX-700). It translates texts of patents, scientific and technical documents. It is based on a semantic transfer schema. The newly developed grammar system for this schema is called “Lexical Transition Network Grammar” which is very poweful for semantic analysis. Semantic analysis is performed by lexical grammars attached to each item in the lexicon.The system has three kinds of dictionaries. To get an excellent man-machine interface, the system is equipped with a bi-lingual editor, an English/Japanese word processor for pre-/post-editing and various software utilities.  相似文献   

17.
This paper presents a novel online relevant set algorithm for a linearly scored block sequence translation model. The key component is a new procedure to directly optimize the global scoring function used by a statistical machine translation (SMT) decoder. This training procedure treats the decoder as a black-box, and thus can be used to optimize any decoding scheme. The novel algorithm is evaluated using different feature types: 1) commonly used probabilistic features, such as translation, language, or distortion model probabilities, and 2) binary features. In particular, encouraging results on a standard Arabic–English translation task are presented for a translation system that uses only binary feature functions. To further demonstrate the effectiveness of the novel training algorithm, a detailed comparison with the widely used minimum-error-rate (MER) training algorithm is presented using the same decoder and feature set. The online algorithm is simplified by introducing so-called “seed” block sequences which enable the training to be carried out without a gold standard block translation. While the online training algorithm is extremely fast, it also improves translation scores over the MER algorithm in some experiments.   相似文献   

18.
机器翻译错误分析旨在找出机器译文中存在的错误,包括错误类型、错误分布等,它在机器翻译研究和应用中发挥着重要作用。该文将人工译后编辑与错误分析结合起来,对译后编辑操作进行错误标注,采用自动标注和人工标注相结合的方法,构建了一个细粒度英汉机器翻译错误分析语料库,其中每一个标注样本包括源语言句子、机器译文、人工参考译文、译后编辑译文、词错误率和错误类型标注;标注的错误类型包括增词、漏词、错词、词序错误、未译和命名实体翻译错误等。标注的一致性检验表明了标注的有效性;对标注语料的统计分析结果能有效地指导机器翻译系统的开发和人工译员的后编辑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号