首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
汉英机器翻译中的趋向词处理研究   总被引:1,自引:0,他引:1  
趋向动词的使用是汉语所特有的,也是非常普遍的现象.如果不能正确地处理趋向词,必将严重影响汉英机器翻译的质量.结合一个汉英机器翻译系统中的实际情况,提出了一种基于规则的趋向词处理策略.  相似文献   

2.
智能机器翻译系统中的语境处理   总被引:1,自引:0,他引:1  
现有机器翻译系统一般都是集中在句子层面上进行翻译,较少考虑句子之间的语境信息,导致有许多问题不能很好解决.文中基于全句翻译的智能英汉机器翻译系统IMT/E-863构造了一个语言环境IMTENV,用来处理组合歧义、省略等语言现象.  相似文献   

3.
机器翻译涉及的技术很多。本文的主要工作有三部分:第一部分论述词处理的一些方法;第二部分讨论句型转换技术;第三部分探讨汉英机器翻译时译文生成的处理,包括建立汉英机器翻译的时态转换、相关匹配规则等。  相似文献   

4.
本文扼要地讨论了介词的特点, 简述了它在语言工程中的处理方法, 并提出了按不同的共性与个性、采取分层分级处理的策略。文章着重对介词的共性与个性和分层分级处理的基本思想和内容作了论述。  相似文献   

5.
在传统的机器翻译(machine translation,MT)与计算机辅助翻译(computer aided translation,CAT)中,译员与翻译引擎之间的交互受到很大限制,于是产生了交互式机器翻译(interactive machine translation,IMT)技术。但传统的模型只考虑当前源语与部分翻译的目标语的信息,没有将用户交互后的对齐信息加入到之后的预测模型中。该文基于词预测交互式机器翻译的研究思路,将用户交互翻译过程中的鼠标点选行为转化为中间译文的词对齐信息,进而在翻译交互过程中实现了对译文的动态词对齐标注,并在词对齐信息和输入译文的约束下提高了传统词预测的准确性。  相似文献   

6.
机器翻译的词处理研究   总被引:4,自引:1,他引:4  
本文首先在讨论汉语自动分词这一难题的基础上提出最大匹配分词的改进算法,然后论述词性兼类处理的一些方法,最后探讨了汉英机器翻译时名词的单复数处理算法。  相似文献   

7.
文中利用机器人学习的方法研究英汉机器释译中目标词选择的问题。  相似文献   

8.
兼类词在汉语专利语料中分布普遍。面向汉英专利机器翻译提出了一种基于规则的动-介兼类词识别方法。根据边界感知原则和兼类词的句法语义属性以及周围的语境信息,设计了一系列兼类排歧规则,同时分别提出了兼类词识别为动词或介词的策略,并以形式化的规则加以描述。相关实验测试表明提出的方法可以有效地识别动-介兼类词语,对改善翻译系统的翻译结果也有帮助。  相似文献   

9.
本文介绍了商品化英日机器翻译系统E-to-J中兼类词的消歧策略。作者根据机器翻译的实践,把英语中同形兼类词归纳为29种类型,提出了基于上下文环境的处理这些兼类词类型的消歧方法。  相似文献   

10.
在神经机器翻译中,因词表受限导致的集外词问题很大程度上影响了翻译系统的准确性。对于训练语料较少的资源稀缺型语言的神经机器翻译,这种问题表现得更为严重。近几年,受到外部知识融入的启发,该文在RNNSearch模型基础上,提出了一种融入分类词典的汉越混合网络神经机器翻译集外词处理方法。对于给定的源语言句子,扫描分类词典以确定候选短语句对并标签标记,解码端利用词级组件和短语组件的混合解码网络,很好地生成单词集外词和短语集外词的翻译,从而改善汉越神经机器翻译的性能。在汉越、英越和蒙汉翻译实验上表明,该方法显著提高了准确率,对于资源稀缺型语言的神经机器翻译性能有一定的提升。  相似文献   

11.
汉英机器翻译中时体态处理   总被引:7,自引:0,他引:7  
作为机器翻译系统,我们必须处理目标语中句子的时态和体态。介绍了汉语中句子的时体态形式,给出了汉语中时态、体态抽取分析算法,归纳出汉英机器翻译时时体态转换规则,介绍了时体态处理系统流程。  相似文献   

12.
李颖 《计算机应用》2004,24(6):137-141
文中针对一种特殊的语言现象(HNC称为包装句蜕)进行了分析,目的是为机器翻译提供一些理论支持。首先从目前机器翻译系统所暴露的问题中提出研究包装句蜕的必要性,然后是对包装句蜕进行语言学描述及汉英对比分析,从可计算的角度提出了包装句蜕的判别方法,最后是包装句蜕的机器处理策略及规则。  相似文献   

13.
汉维统计机器翻译中的形态学处理   总被引:1,自引:0,他引:1       下载免费PDF全文
针对汉语和维吾尔语语序差别(前者是主-谓-宾结构,后者是主-宾-谓结构)及形态差别较大的问题,通过编写调序规则将汉语调整为主-宾-谓结构,将维吾尔语单词切分为词干、词缀等更小的词素单元来训练统计模型,同时测试词素的切分粒度对翻译性能的影响.实验结果表明,对汉语句法结构的调整及以词干、词缀等更小的词素形式参与训练可以有效...  相似文献   

14.
汉藏短语对抽取中短语译文获取方法研究   总被引:1,自引:0,他引:1  
该文从法律法规和公文领域汉藏语料中对待翻译汉语短语提取藏语译文。目前普遍采用的短语对抽取方法需要依赖于词性或句法分析等资源或词对齐技术。考虑现阶段藏文资源不足,词法句法相关技术不成熟,该文提出藏文词串频率统计方法(TSM)和藏文词序列相交算法(TIA)两种方法来获取藏语译文。其中TSM抽取1-1连续和非连续短语准确率达到90%左右,但遗漏1-n情况。TIA能够抽取1-n连续和非连续藏文语块,准确率达到81%。  相似文献   

15.
人类社会步人信息时代.跨地区交流与合作不断加强,语言不通成为沟通的一大障碍,机器翻译研究工作具有广泛的社会效益和经济效益。伴随我国综合国力的增强,汉语在国际社会中的使用越来越频繁,而英语是使用最广泛的国际性语言.汉英机器翻译研究工作显得尤为重要。在汉英机器翻译过程中必须处理汉英时态转换问题,否则将影响翻译的准确率和译文阅读流畅度。  相似文献   

16.
基于实例的机器翻译处理方法   总被引:11,自引:0,他引:11  
杨宪泽 《计算机工程》2003,29(21):51-52,135
在机器翻译的研究中,基于实例是一种很好的方法。文章讨论了完全实例的机器翻译、实例句型转换的机器翻译以及实例近似机器翻译。  相似文献   

17.
Unknown words are one of the key factors that greatly affect the translation quality.Traditionally, nearly all the related researches focus on obtaining the translation of the unknown words.However, these approaches have two disadvantages.On the one hand, they usually rely on many additional resources such as bilingual web data;on the other hand, they cannot guarantee good reordering and lexical selection of surrounding words.This paper gives a new perspective on handling unknown words in statistical machine translation (SMT).Instead of making great efforts to find the translation of unknown words, we focus on determining the semantic function of the unknown word in the test sentence and keeping the semantic function unchanged in the translation process.In this way, unknown words can help the phrase reordering and lexical selection of their surrounding words even though they still remain untranslated.In order to determine the semantic function of an unknown word, we employ the distributional semantic model and the bidirectional language model.Extensive experiments on both phrase-based and linguistically syntax-based SMT models in Chinese-to-English translation show that our method can substantially improve the translation quality.  相似文献   

18.
汉蒙统计机器翻译中的形态学方法研究   总被引:1,自引:1,他引:1  
该文将形态学方法引入到汉蒙统计机器翻译的研究中,尝试解决译文词形选择及语序混乱问题。首先介绍语料库的准备对原始汉蒙平行语料库进行词法分析及标注,得到两组基础语料库,再由基础语料库生成两组用于形态学实验的派生语料库。其次阐述统计模型的训练,包括语言模型、翻译模型及生成模型。同时讨论了解码的扩展问题。最后重点分析两组形态学方法实验词素模型实验和factored方法实验。结果表明,相对于基线(baseline)实验,引入形态学方法后两组实验的BLEU评分均有所提高,译文词形选择及语序混乱问题得到了一定程度的解决。  相似文献   

19.
在神经机器翻译过程中,低频词是影响翻译模型性能的一个关键因素。由于低频词在数据集中出现次数较少,训练经常难以获得准确的低频词表示,该问题在低资源翻译中的影响更为突出。该文提出了一种低频词表示增强的低资源神经机器翻译方法。该方法的核心思想是利用单语数据上下文信息来学习低频词的概率分布,并根据该分布重新计算低频词的词嵌入,然后在所得词嵌入的基础上重新训练Transformer模型,从而有效缓解低频词表示不准确问题。该文分别在汉越和汉蒙两个语言对四个方向上分别进行实验,实验结果表明,该文提出的方法相对于基线模型均有显著的性能提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号