首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
机器翻译是对人工翻译的模拟.但是由于不同语言之间历史文化、风俗习惯等因素存在固有差异,所以相同的文字时常在不同环境下表达的意义不同,这使得机器翻译实现十分困难.独词句是语言学上的一种特殊的句型.独词句需要根据上下文环境来判断它的"句义",而不仅仅是它的"词义".然而目前大多数的计算机翻译软件,对独词句的处理都存在缺陷.本文希望能从语言学的角度,对翻译系统处理独词句提出更为合理的解决方法.  相似文献   

2.
机器翻译词义辨识对策   总被引:3,自引:1,他引:3  
词义辨识是机器翻译中最困难的问题之一, 不夸大地说, 它是全自动高质量机器翻译成败的关键。本文结合许多实例, 详细探讨了解决这个问题的各种方法及其相互关系, 这些方法包括成语加工、语法分析、语义分析、语境分析、代指分析、互补分析、中性词义以及一词多译等。它们的有机配合可以有效地解决绝大多数多义区分问题, 从而为机译系统的实用化奠定了基础。所有这些方法都已在JFY-IV英汉机译系统中得到广泛运用和验证。  相似文献   

3.
专利文献的自动翻译是机器翻译的一个重要应用领域,复杂长句的翻译是汉英机器翻译的难点。本研究期望找出汉英复杂长句中小句变换的形式化转换规则。汉语复杂长句中会包含多个小句,这些小句都是独立存在的,但翻译成英语时,一般只有一个核一心小句,其他小句都变换成doing、todo、从句或短语等其它形式。文中以1300句汉英双语专利文献语料为研究对象,对汉语中的小句翻译为英语的变换情况进行分类研究,从小句句间关系、共享关系的角度出发,描述激活特征,并按五种变换方式分类,提出了十二条变换规则,小规模语料实验结果证明规则可行有效。下一步工作需要扩充研究语料,对语料进行更深入的挖掘和分析,在更大规模语料中验证规则的实用性。  相似文献   

4.
一、前言人工智能是计算机科学中的尖端学科,而机器翻译又是其中最具挑战性的领域。当今世界,各种文字的信息每时每刻都在大量涌现,每年仅出版的文献就达500万篇,各国都要投入大量的人力、物力从事文字的翻译工作。随着我国改革、开放的逐步深入,与外界的交往愈来愈多,汉语与其它语言之间的数据处理工作日趋频繁;另外,很多单位都在引进、消化、吸收国外的先进技术,有大量的科技资料急需翻译。人们迫切希望能从繁重的翻译工作中解放出来。  相似文献   

5.
格式在HNC理论中是指广义作用句各主语块位置的不同排列组合方式。由于主语块的排列方式在汉英两种语言中表达的差异,汉语句子翻译到英语时常常发生格式转换。格式转换是HNC机器翻译理论的一个重要内容,是机器翻译理论实践的基础和前提。以HNC机器翻译理论为指导,以真实文本的专利文献汉英句对为分析对象,研究专利机器翻译中汉英两种语言之间广义作用句的格式转换规律,制定了排除规则、识别规则和转换规则,对部分规则进行了人工评测,结果表明准确率能达到85%左右。  相似文献   

6.
赵礼海 《电脑》1998,(4):14-16
随着计算机界在Internet等国际交往的增多,翻译软件慢慢成为业界的热点,由于本刊采编人员对翻译软件的研制都不甚了解,所以这次专门请了北京雅信工作室的主创人、“雅信译霸97”软件的作者——李晓明先生作为本次专访活动的特邀佳宾,来向各位读者介绍一下他自己和他所认识的翻译软件。 这次的采访依然是采用E-Mail形式进行的,一开始见面,大家先天南海北地广泛地聊了一下,没有马上转入翻译软件的话题,在寒喧过程中我们了解到,李晓明先生是陕西大荔人。他84年考入长沙国防科技大学学习,88年攻读硕士学位。91年3月毕业后分配到北京总参某部工作。目前正在负责雅信软件工作室的工作,全力开发“雅信译霸”专业版。  相似文献   

7.
独立的词义消歧模型性能已经获得很大提高, 但是对于独立消歧模型在机器翻译系统中应用的必要性和作用一直存在着不同的观点. 为了从更为一般性的角度评价这个问题, 本文突破了具体模型的限制, 通过在不同类型汉英机器翻译系统中引入不受特定条件约束的高精度全词消歧过程, 对词义消歧在机器翻译系统中的影响进行了较为充分和全面的评价. 实验结果证明词义消歧模型不仅本身具有一定的翻译能力, 而且可以提高不同类型的机器翻译系统的整体性能. 同时也说明当前的翻译系统在消歧能力上还有较大的提升空间.  相似文献   

8.
李颖 《计算机应用》2004,24(6):137-141
文中针对一种特殊的语言现象(HNC称为包装句蜕)进行了分析,目的是为机器翻译提供一些理论支持。首先从目前机器翻译系统所暴露的问题中提出研究包装句蜕的必要性,然后是对包装句蜕进行语言学描述及汉英对比分析,从可计算的角度提出了包装句蜕的判别方法,最后是包装句蜕的机器处理策略及规则。  相似文献   

9.
本文阐述NDJCMT系统中词的自动切分技术, NDJCMT是我们实现的一个日汉机器翻译实验系统, 词的自动切分是日语词素分析、句法及语义分析的基础, 是一项日本语计算机信息处理的基础性研完课题, 它涉及对语言本身的研究。日语和汉语类似, 词及词之间无分隔符, 通常假名、汉字混写, 给词的切分造成了困难。作者根据日语的特点, 提出了一种“ 句节数最少” 词的自动切分方法, 使用语言编程且在一机上获得实现。  相似文献   

10.
11.
随着统计机器翻译系统训练语料的不断增加,长句子的数量越来越多,如何有效地利用长句子中的信息改进翻译质量是统计机器翻译系统面临的主要问题之一。该文基于Xu的句子切分模型,提出了一种在训练阶段切分长句子的方法,该方法利用自动获取的边界词概率和切分后子句对的长度比例来指导切分过程,从而得到更符合语义信息的句子切分结果。在NIST测试集上的实验结果表明,该方法获得了最大0.5个BLEU值的提升。  相似文献   

12.
神经机器翻译由于无法完全学习源端单词语义信息,往往造成翻译结果中存在着大量的单词翻译错误。该文提出了一种融入单词翻译用以增强源端信息的神经机器翻译方法。首先使用字典方法找到每个源端单词对应的目标端翻译,然后提出并比较两种不同的方式,用以融合源端单词及其翻译信息: ①Factored 编码器: 单词及其翻译信息直接相加; ②Gated 编码器: 通过门机制控制单词翻译信息的输入。基于目前性能最优的基于自注意力机制的神经机器翻译框架Transformer,在中英翻译任务的实验结果表明,与基准系统相比,该文提出的两种融合源端单词译文的方式均能显著提高翻译性能,BLEU值获得了0.81个点的提升。  相似文献   

13.
汉英机器翻译中描述型复句的关系识别与处理   总被引:5,自引:0,他引:5  
鲁松  宋柔 《软件学报》2001,12(1):83-93
汉英机器翻译的复句处理不仅要依托于单句的处理,而且还要超越单句的辖域,深入考察复句内分句之间的内在联系.其中,在汉语描述型复句中存在着大量的无特定语言标记的非并列关系复句,为了辨别其中的内在联系,实现英语译文的正确生成,针对不同情况,给出了完整的关系判定规则,并提出采用中心分句动态判定方法来解决部分复句处理规则局部性的问题,最后通过实验系统得以验证.  相似文献   

14.
面向统计机器翻译的重对齐方法研究   总被引:3,自引:0,他引:3  
词对齐是统计机器翻译中的重要技术之一。该文提出了一种重对齐方法,它在IBM models获得的正反双向词对齐的基础上,确定出正反双向对齐不一致的部分。之后,对双向词对齐不一致的部分进行重新对齐以得到更好的对称化的词对齐结果。此外,该文提出的方法还可以利用大规模单语语料来强化对齐结果。实验结果表明,相比在统计机器翻译中广泛使用的基于启发信息的词对齐对称化方法,该文提出的方法可以使统计机器翻译系统得到更高的翻译准确率。  相似文献   

15.
模板的自动抽取算法对机器翻译的研究具有重要意义。从面向英汉翻译的角度出发,论文对基于句子比较的翻译模板抽取(ATTEBSC)算法及其改进开展了比较研究,结果发现传统ATTEBSC算法在处理大规模语料库时运行效率较低,而且产生的无用模板比例较高,其中一个重要原因是没有事先对双语对齐语料库进行分类处理。通过相似性分析对句子进行聚类处理后再运行ATTEBSC算法,则发现该算法的运行效率和有用模板的比例都获得了较大的提高。  相似文献   

16.
一种基于E-Chunk的机器翻译模型   总被引:7,自引:0,他引:7       下载免费PDF全文
李沐  吕学强  姚天顺 《软件学报》2002,13(4):669-676
提出了一种基于E-Chunk的多引擎机器翻译模型.该模型以中心语驱动的分析技术为基础,通过词汇相似特征计算E-Chunk的匹配代价,自底向上地完成最优E-Chunk覆盖的构造,并以E-Chunk为基本翻译单元完成机器翻译过程.初步的实验结果显示,该方法在面向领域文本的自动翻译方面是有效的.  相似文献   

17.
该文在回顾机器翻译发展的基础上,总结了主要的机器翻译方法,并主要阐述互联网机器翻译的特点及面临的挑战.面向互联网机器翻译的应用需求,并针对互联网资源具有海量、高噪声、时效性、稀疏的特点,提出了多策略混合翻译方法、资源挖掘和过滤以及分布式处理技术、领域自适应技术,针对数据稀疏论述枢轴语言技术和新语种快速部署技术;然后结合...  相似文献   

18.
汉语分词是搭建汉语到其他语言的统计机器翻译系统的一项重要工作。从单语语料中训练得到的传统分词模型并不一定完全适合机器翻译[1]。该文提出了一种基于单语和双语知识的适应于统计机器翻译系统的分词方法。首先利用对齐可信度的概念从双语字对齐语料中抽取可信对齐集合,然后根据可信对齐集合对双语语料中的中文部分重新分词;接着将重新分词的结果和单语分词工具的分词结果相融合,得到新的分词结果,并将其作为训练语料,利用条件随机场模型训练出一个融合了单双语知识的分词工具。该文用该工具对机器翻译所需的训练集、开发集和测试集进行分词,并在基于短语的统计机器翻译系统上进行实验。实验结果表明,该文所提的方法提高了系统性能。  相似文献   

19.
在基于语料库的机器翻译系统中,相似句对的检索对于翻译的质量具有非常重要的作用。本文提出一种新颖的方法,可以利用双语例句来帮助度量待翻译句子与例句的相似度。为了提高检索的效率,我们还提供了一个双层的语料库索引方法。由于我们的相似度度量在计算相似度时考虑了例句对最终翻译结果的影响,因此在翻译实验中取得了较好好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号