首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
李颖 《计算机应用》2004,24(6):137-141
文中针对一种特殊的语言现象(HNC称为包装句蜕)进行了分析,目的是为机器翻译提供一些理论支持。首先从目前机器翻译系统所暴露的问题中提出研究包装句蜕的必要性,然后是对包装句蜕进行语言学描述及汉英对比分析,从可计算的角度提出了包装句蜕的判别方法,最后是包装句蜕的机器处理策略及规则。  相似文献   

2.
专利文献的自动翻译是机器翻译的一个重要应用领域,复杂长句的翻译是汉英机器翻译的难点。本研究期望找出汉英复杂长句中小句变换的形式化转换规则。汉语复杂长句中会包含多个小句,这些小句都是独立存在的,但翻译成英语时,一般只有一个核一心小句,其他小句都变换成doing、todo、从句或短语等其它形式。文中以1300句汉英双语专利文献语料为研究对象,对汉语中的小句翻译为英语的变换情况进行分类研究,从小句句间关系、共享关系的角度出发,描述激活特征,并按五种变换方式分类,提出了十二条变换规则,小规模语料实验结果证明规则可行有效。下一步工作需要扩充研究语料,对语料进行更深入的挖掘和分析,在更大规模语料中验证规则的实用性。  相似文献   

3.
格式在HNC理论中是指广义作用句各主语块位置的不同排列组合方式。由于主语块的排列方式在汉英两种语言中表达的差异,汉语句子翻译到英语时常常发生格式转换。格式转换是HNC机器翻译理论的一个重要内容,是机器翻译理论实践的基础和前提。以HNC机器翻译理论为指导,以真实文本的专利文献汉英句对为分析对象,研究专利机器翻译中汉英两种语言之间广义作用句的格式转换规律,制定了排除规则、识别规则和转换规则,对部分规则进行了人工评测,结果表明准确率能达到85%左右。  相似文献   

4.
刘小蝶 《计算机科学》2021,48(z1):299-305
为了改善专利机器翻译中复杂名词短语的翻译效果,提出了一种基于规则的复杂名词短语识别和转换方法.通过分析汉英复杂名词短语的语义块和组合单元,利用边界感知策略,抽取汉语语言特征词,为汉语复杂名词短语中组合单元边界识别编制了57条识别规则,设计了合并策略,得到汉语复杂名词短语的形式化结构.通过对比汉英复杂名词短语的差异,确定...  相似文献   

5.
比较是人们常用的评估不同事物优劣、异同的表达方式,利用机器识别比较句并进一步抽取比较要素是语言信息处理领域一项新颖又有实用价值的课题。该文依据比较句与比较要素之间是一种“你中有我,我中有你”的共生关系,将比较句识别与比较要素抽取两个任务合二为一完成;根据词意分类,构建由领域词典、情感词典、标记词典、普通词典构成的词典系统;根据汉语比较句句义分类,构建比较句识别与比较要素抽取规则库。以第四届中文倾向性评测(COAE2012)发布的测试语料为实验对象,该系统取得了较好的实验(评测)结果。  相似文献   

6.
汉语和维吾尔语是在句法结构和语序上差异较大的两种语言。对于一个完备的汉维机器翻译系统而言,进行源语言的分析和目标语言时态、语态的准确表达是有必要的。针对统计机器翻译模型中所包含的句法、语义成分较低导致的准确率及语序问题,通过建立相关转换及匹配规则,以期用于机器翻译的混合方法之中来提高翻译系统的工作性能。  相似文献   

7.
一种句型转换和近似机器翻译方法及算法   总被引:6,自引:3,他引:3  
在机器翻译的研究中,混合式方法是一种好方法。本文讨论了句型转换的机器翻译和近似机器翻译,提出了规则索引算法和一种近似机器翻译的算法。  相似文献   

8.
HNC作用效应句的汉英句类转换   总被引:1,自引:1,他引:0  
作用效应句是作用句的一个特殊子类,是HNC57组基本句类中一个极富个性的重要句类。从HNC概念网络的角度看,作用效应句主要由使役类动词和逼迫类动词直接形成,或者由一般作用类动词(含泛动类动词) 通过“得”字结构间接形成。由这三类动词形成的作用效应句遵循不同的句类转换和格式转换规则,因此在汉英机器翻译中,需要采取不同的句类转换框架,以确保译文语句句法语义结构的正确性。初步的试验表明,有关作用效应句的这些句类-格式转换规则具有很好的适用性和覆盖率。  相似文献   

9.
该文以汉英机器翻译为应用目标,以概念层次网络理论的语义网络和句类分析方法为理论基础,探讨了句类依存树库构建的理论和标注实践等问题,描述了构建树库所需的概念类别标注集和句类关系标注集。并通过与已有汉语树库进行对比,以汉语显性轻动词句的标注为例,分析了汉语句类依存树库的特点。该文在应用层面定义了面向汉英机器翻译的融句法语义信息于一体的“句类依存子树到串”双语转换模板,尝试基于汉语句类依存树库提取汉英转换模板。  相似文献   

10.
机器翻译中规则和模板的协调方法研究   总被引:1,自引:0,他引:1  
本文讨论了机器翻译中的基于规则、基于翻译模板及转换模型的特点,分别比较了它们的优点和不足.同时讨论了协调基于模板方法与基于转换模型方法的合理途径.针对研制机器翻译系统的需要设计了将这几种方法有机地结合起来的算法.将本文提出的协调方法在汉英双向机器翻译系统中应用,取得了较好的实验结果.通过采用模板和去掉模板分别进行翻译实验,结果表明基于模板方法对于译文质量提高的贡献率分别为口语为12%,篇章翻译为8%.  相似文献   

11.
为了从海量的网络信息中迅速准确地获取评价信息,观点句识别已经成了自然语言处理的一个研究热点。现在观点句识别系统大都是基于机器学习的方法,一般使用机器学习的方法来进行分类会受到领域差异性影响。针对这个问题,该文对微博观点句识别系统是否会受到微博话题影响做了经验性研究,同时为了弥补训练数据的不足,该文通过规则方法自动标注网络数据进行了训练集的扩充。实验结果表明,微博话题间存在差异,进行分话题模型训练可以提升微博观点句识别系统的性能。  相似文献   

12.
为了改善专利文献的机器翻译效果, 提出了一种基于模板的机器翻译方法。通过分析汉英双语对齐的专利文献语料, 人工书写了600余条模板, 模板的设计思想源于弱化的正则文法; 设计和实现了一个模板翻译模块, 并将其与已有的一个基于规则的机器翻译系统相融合。实验结果表明, 40%以上的测试文本的翻译质量得到了提高, 因此, 这种基于模板的方法对于改善专利文献的机器翻译效果是有效的。  相似文献   

13.
本文介绍一个基于规则和转换翻译策略的日汉机器翻译系统的设计和实现.该系统的日语分析采用了基于短语结构文法和格语法的句法、语义分析技术.在句法分析中识别出动词短语时,利用动词格框架进行格短语的格角色识别.分析规则采用了复杂特征集和合一运算,并按层次进行设计.日语分析结果为带格角色标记的日语分析树.基于得到的日语分析树,系统采用了转换/生成一体化的汉语生成策略,按深度优先遍历分析树转换/生成汉语.另外,该翻译系统在基于规则的主框架之上,还辅助以翻译记忆的方法.本文的系统参加了863组织的三次机器翻译评测,其中,在2005年的评测中,自动评测的结果(NIST)为6.3052(对话)和6.7836(篇章).  相似文献   

14.
15.
机器翻译评测对机器翻译有着极其重要的意义,它对翻译系统性能的提高做出了很大的贡献,同时促进了机器翻译的发展.本文在HNC机器翻译策略的基础上,对翻译语料的句类转换和句式转换做了初步的研究,并利用句类转换和句式转换的理论,建立了基于句类信息的自动评测的打分机制.  相似文献   

16.
传统的神经机器翻译模型是一个黑盒子,并不能有效把术语信息添加进去。而利用用户提供的术语词典来联合训练神经机器翻译模型具有实际意义。据此,该文提出融入术语信息的新能源领域Transformer专利机器翻译模型,使用将源端术语替换为目标端术语以及在源端术语后增添目标端术语两种手段进行术语信息融合,实验表明,在构建的新能源领域专利汉英平行语料库和术语库上,提出的专利翻译模型优于Transformer基准模型。并评测了其在人工构建的数据集、中国专利信息中心的数据集及世界知识产权局的数据集上的翻译效果。  相似文献   

17.
随着深度学习的发展神经网络机器翻译有了长足的进步.众所周知,神经机器翻译方法对句子长度比较敏感.为了充分利用海量平行语料,考虑平行语料句子长度信息,把原平行语料划分若干个模块,为每一个模块训练一个子模型,提出一种按句子长度融合策略的神经机器翻译方法.当训练结束时,通过句长边界划分后的模型融合与三特征(困惑度、句长比与分...  相似文献   

18.
机器翻译涉及的技术很多。本文的主要工作有三部分:第一部分论述词处理的一些方法;第二部分讨论句型转换技术;第三部分探讨汉英机器翻译时译文生成的处理,包括建立汉英机器翻译的时态转换、相关匹配规则等。  相似文献   

19.
本文提出一种,针对专利文献的机器翻译系统中,通过人工撰写模板,提高翻译准确率的同时节省时间和人力的方法。此方法不仅仅限于韩汉翻译系统,也可广泛应用于其他语言之间的翻译系统。  相似文献   

20.
兼类词在汉语专利语料中分布普遍。面向汉英专利机器翻译提出了一种基于规则的动-介兼类词识别方法。根据边界感知原则和兼类词的句法语义属性以及周围的语境信息,设计了一系列兼类排歧规则,同时分别提出了兼类词识别为动词或介词的策略,并以形式化的规则加以描述。相关实验测试表明提出的方法可以有效地识别动-介兼类词语,对改善翻译系统的翻译结果也有帮助。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号