共查询到19条相似文献,搜索用时 78 毫秒
1.
机器翻译是对人工翻译的模拟.但是由于不同语言之间历史文化、风俗习惯等因素存在固有差异,所以相同的文字时常在不同环境下表达的意义不同,这使得机器翻译实现十分困难.独词句是语言学上的一种特殊的句型.独词句需要根据上下文环境来判断它的"句义",而不仅仅是它的"词义".然而目前大多数的计算机翻译软件,对独词句的处理都存在缺陷.本文希望能从语言学的角度,对翻译系统处理独词句提出更为合理的解决方法. 相似文献
2.
机器翻译词义辨识对策 总被引:3,自引:1,他引:3
词义辨识是机器翻译中最困难的问题之一, 不夸大地说, 它是全自动高质量机器翻译成败的关键。本文结合许多实例, 详细探讨了解决这个问题的各种方法及其相互关系, 这些方法包括成语加工、语法分析、语义分析、语境分析、代指分析、互补分析、中性词义以及一词多译等。它们的有机配合可以有效地解决绝大多数多义区分问题, 从而为机译系统的实用化奠定了基础。所有这些方法都已在JFY-IV英汉机译系统中得到广泛运用和验证。 相似文献
3.
王立霞 《计算机技术与发展》2012,(11):77-80,84
专利文献的自动翻译是机器翻译的一个重要应用领域,复杂长句的翻译是汉英机器翻译的难点。本研究期望找出汉英复杂长句中小句变换的形式化转换规则。汉语复杂长句中会包含多个小句,这些小句都是独立存在的,但翻译成英语时,一般只有一个核一心小句,其他小句都变换成doing、todo、从句或短语等其它形式。文中以1300句汉英双语专利文献语料为研究对象,对汉语中的小句翻译为英语的变换情况进行分类研究,从小句句间关系、共享关系的角度出发,描述激活特征,并按五种变换方式分类,提出了十二条变换规则,小规模语料实验结果证明规则可行有效。下一步工作需要扩充研究语料,对语料进行更深入的挖掘和分析,在更大规模语料中验证规则的实用性。 相似文献
4.
一、前言人工智能是计算机科学中的尖端学科,而机器翻译又是其中最具挑战性的领域。当今世界,各种文字的信息每时每刻都在大量涌现,每年仅出版的文献就达500万篇,各国都要投入大量的人力、物力从事文字的翻译工作。随着我国改革、开放的逐步深入,与外界的交往愈来愈多,汉语与其它语言之间的数据处理工作日趋频繁;另外,很多单位都在引进、消化、吸收国外的先进技术,有大量的科技资料急需翻译。人们迫切希望能从繁重的翻译工作中解放出来。 相似文献
5.
格式在HNC理论中是指广义作用句各主语块位置的不同排列组合方式。由于主语块的排列方式在汉英两种语言中表达的差异,汉语句子翻译到英语时常常发生格式转换。格式转换是HNC机器翻译理论的一个重要内容,是机器翻译理论实践的基础和前提。以HNC机器翻译理论为指导,以真实文本的专利文献汉英句对为分析对象,研究专利机器翻译中汉英两种语言之间广义作用句的格式转换规律,制定了排除规则、识别规则和转换规则,对部分规则进行了人工评测,结果表明准确率能达到85%左右。 相似文献
6.
随着计算机界在Internet等国际交往的增多,翻译软件慢慢成为业界的热点,由于本刊采编人员对翻译软件的研制都不甚了解,所以这次专门请了北京雅信工作室的主创人、“雅信译霸97”软件的作者——李晓明先生作为本次专访活动的特邀佳宾,来向各位读者介绍一下他自己和他所认识的翻译软件。 这次的采访依然是采用E-Mail形式进行的,一开始见面,大家先天南海北地广泛地聊了一下,没有马上转入翻译软件的话题,在寒喧过程中我们了解到,李晓明先生是陕西大荔人。他84年考入长沙国防科技大学学习,88年攻读硕士学位。91年3月毕业后分配到北京总参某部工作。目前正在负责雅信软件工作室的工作,全力开发“雅信译霸”专业版。 相似文献
7.
独立的词义消歧模型性能已经获得很大提高, 但是对于独立消歧模型在机器翻译系统中应用的必要性和作用一直存在着不同的观点. 为了从更为一般性的角度评价这个问题, 本文突破了具体模型的限制, 通过在不同类型汉英机器翻译系统中引入不受特定条件约束的高精度全词消歧过程, 对词义消歧在机器翻译系统中的影响进行了较为充分和全面的评价. 实验结果证明词义消歧模型不仅本身具有一定的翻译能力, 而且可以提高不同类型的机器翻译系统的整体性能. 同时也说明当前的翻译系统在消歧能力上还有较大的提升空间. 相似文献
8.
文中针对一种特殊的语言现象(HNC称为包装句蜕)进行了分析,目的是为机器翻译提供一些理论支持。首先从目前机器翻译系统所暴露的问题中提出研究包装句蜕的必要性,然后是对包装句蜕进行语言学描述及汉英对比分析,从可计算的角度提出了包装句蜕的判别方法,最后是包装句蜕的机器处理策略及规则。 相似文献
9.
10.
11.
12.
神经机器翻译由于无法完全学习源端单词语义信息,往往造成翻译结果中存在着大量的单词翻译错误。该文提出了一种融入单词翻译用以增强源端信息的神经机器翻译方法。首先使用字典方法找到每个源端单词对应的目标端翻译,然后提出并比较两种不同的方式,用以融合源端单词及其翻译信息: ①Factored 编码器: 单词及其翻译信息直接相加; ②Gated 编码器: 通过门机制控制单词翻译信息的输入。基于目前性能最优的基于自注意力机制的神经机器翻译框架Transformer,在中英翻译任务的实验结果表明,与基准系统相比,该文提出的两种融合源端单词译文的方式均能显著提高翻译性能,BLEU值获得了0.81个点的提升。 相似文献
13.
汉英机器翻译中描述型复句的关系识别与处理 总被引:5,自引:0,他引:5
汉英机器翻译的复句处理不仅要依托于单句的处理,而且还要超越单句的辖域,深入考察复句内分句之间的内在联系.其中,在汉语描述型复句中存在着大量的无特定语言标记的非并列关系复句,为了辨别其中的内在联系,实现英语译文的正确生成,针对不同情况,给出了完整的关系判定规则,并提出采用中心分句动态判定方法来解决部分复句处理规则局部性的问题,最后通过实验系统得以验证. 相似文献
14.
15.
模板的自动抽取算法对机器翻译的研究具有重要意义。从面向英汉翻译的角度出发,论文对基于句子比较的翻译模板抽取(ATTEBSC)算法及其改进开展了比较研究,结果发现传统ATTEBSC算法在处理大规模语料库时运行效率较低,而且产生的无用模板比例较高,其中一个重要原因是没有事先对双语对齐语料库进行分类处理。通过相似性分析对句子进行聚类处理后再运行ATTEBSC算法,则发现该算法的运行效率和有用模板的比例都获得了较大的提高。 相似文献
16.
17.
18.
汉语分词是搭建汉语到其他语言的统计机器翻译系统的一项重要工作。从单语语料中训练得到的传统分词模型并不一定完全适合机器翻译[1]。该文提出了一种基于单语和双语知识的适应于统计机器翻译系统的分词方法。首先利用对齐可信度的概念从双语字对齐语料中抽取可信对齐集合,然后根据可信对齐集合对双语语料中的中文部分重新分词;接着将重新分词的结果和单语分词工具的分词结果相融合,得到新的分词结果,并将其作为训练语料,利用条件随机场模型训练出一个融合了单双语知识的分词工具。该文用该工具对机器翻译所需的训练集、开发集和测试集进行分词,并在基于短语的统计机器翻译系统上进行实验。实验结果表明,该文所提的方法提高了系统性能。 相似文献
19.
在基于语料库的机器翻译系统中,相似句对的检索对于翻译的质量具有非常重要的作用。本文提出一种新颖的方法,可以利用双语例句来帮助度量待翻译句子与例句的相似度。为了提高检索的效率,我们还提供了一个双层的语料库索引方法。由于我们的相似度度量在计算相似度时考虑了例句对最终翻译结果的影响,因此在翻译实验中取得了较好好的效果。 相似文献