首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
The performance of a machine translation system heavily depends on the quantity and quality of the bilingual language resource.However,getting a parallel corpus,which has a large scale and is of high quality,is a very difficult task especially for low resource languages such as ChineseVietnamese.Fortunately,multilingual user generated contents (UGC),such as bilingual movie subtitles,provide us access to automatic construction of the parallel corpus.Although the amount of UGC parallel corpora can be considerable,the original corpus is not suitable for statistical machine translation (SMT) systems.The corpus may contain translation errors,sentence mismatching,free translations,etc.To improve the quality of the bilingual corpus for SMT systems,three filtering methods are proposed:sentence length difference,the semantic of sentence pairs,and machine learning.Experiments are conducted on the Chinese to Vietnamese translation corpus.Experimental results demonstrate that all the three methods effectively improve the corpus quality,and the machine translation performance (BLEU score) can be improved by 1.32.  相似文献   

2.
双语平行语料库在20世纪90年代受到重视并广泛建立,对语言对比研究以及包括自动翻译在内的翻译教学和双语词典的编撰具有重要意义。双语平行语料库在翻译教学中的应用主要体现在词汇、句子和语篇三个层次上。  相似文献   

3.
基于我们前期研制的IT文本英汉平行语料库,利用专门软件AntConc对所收集的平行语料库进行研究分析,并在翻译实践中,与双语词典进行对比,发现平行语料库能填补双语词典的义项缺失;词义更丰富;能实现双语翻译的对等性;并能为释义提供语境的优势。  相似文献   

4.
面向汉英机器翻译的双语语料库的建设及其管理   总被引:7,自引:0,他引:7  
近年来,在语言信息处理的研究和开发中,单语和多语语料库(主要是双语语料库)的作用日益突显出来。为了支持一项正在进行的汉英机器翻译系统的开发,我们建立了一个汉英双语语料库。本文简要介绍了该语料库的建设和管理情况。  相似文献   

5.
针对内蒙古地区机器翻译力量薄弱、技术落后等现状,提出一种基于实例的翻译方法,使用不同粒度的对齐技术对蒙汉双语语料库进行处理,根据相似度算法进行匹配和重组并生成译文.实验结果表明:利用实例库相似度检测的方法能够对特定领域的蒙古语做出有效的翻译,并在一定程度上提高翻译质量,在蒙汉机器翻译中具有较好的应用价值.  相似文献   

6.
提出一种新的搭配(Collocation)翻译方法,该方法在最大熵模型框架下,充分利用各种从单语和双语语料库中获取的信息.与过去的过分依赖双语语料库的方法不同,新的搭配翻译方法可以使用单语语料库训练翻译模型,在搭配内在信息的基础上,进一步引入了上下文信息.采用EM(Expectation Maximization)算法估计基于上下文的词汇翻译概率.本模型同时具备集成来自双语语料库信息的能力.实验表明,本文方法优于现有的基于单语语料库的搭配翻译方法,在双语语料库的支持下还可以得到更好的结果.  相似文献   

7.
机器翻译系统中,语言技术是居于核心地位的;谓语是句子结构的核心,动词又是谓语的主要形式,因此翻译系统中的动词的处理至关重要。本文依据汉藏翻译系统的需要,通过汉藏实际语料的对比分析,进行了汉藏动词的特点比较,就动词的分类、动词的时态及动词作句子各种成分时其形态的变化规律进行了深入的讨论,并提出了处理策略,为有效地提高系统的翻译质量提供了有益的方法和思路。  相似文献   

8.
首先介绍文献术语的重要性和分布情况,归纳常用的文献术语抽取方法,进而提出一种从英汉平行语料库中自动抽取术语的算法.主要采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐,并对英文语料和中文语料分别进行词性标注.统计已对齐和标注的双语语料中的名词和名词短语生成候选术语集.然后对每个英文候选术语计算与其相关的中文翻...  相似文献   

9.
0Howtoselectappropriatewoadsina~lationisoneofthemostdifficultpmblemsinmachine~slation.ItSaamsistoselectaappropriatewoadinatal'getlangUageaccoalingtothecontextofthesourcelangUage.Whetherwecanselectcorrecttal'getwordseffeCtthet~slationqUalitydirectly.ThemaingoftargetwordselectionissimilartolexicaltlansferandlexicaldisalnbigUation,anditisessentiallyaninstanceofwoldsensedisalnbigUationinmachinellanslahon.Thecurrentmethaneofselectingwoallinat-lanslationcanbedividedintolhreecategories,whichare1.t…  相似文献   

10.
提出了一种基于实例的机器辅助写作翻译方法,设计并实现了这个系统,用以辅助写作翻译过程,规范人与计算机的分工与协作。该系统可以对单词、词组,以及词的搭配给出更精确的翻译解释,实际应用的结果也表明,它能有效地帮助中/英文用户更流畅的书写和翻译英/中文,保证写作翻译的效率和质量。此系统具有文本搜索、对应片段搜索和翻译记忆管理工具,文本搜索工具允许用户查询已经翻译好的文本或参考文档;对应片段搜索工具帮助用户检索出一个单词或一种表达方式在源语言和目标语言中的对应翻译结果;翻译记忆管理工具保存了文本片段的在源语言和目标语言中的对应关系。  相似文献   

11.
提出了一种基于实例的机器辅助写作翻译方法,设计并实现了这个系统,用以辅助写作翻译过程,规范人与计算机的分工与协作。该系统可以对单词、词组,以及词的搭配给出更精确的翻译解释,实际应用的结果也表明,它能有效地帮助中/英文用户更流畅的书写和翻译英/中文,保证写作翻译的效率和质量。此系统具有文本搜索、对应片段搜索和翻译记忆管理工具,文本搜索工具允许用户查询已经翻译好的文本或参考文档;对应片段搜索工具帮助用户检索出一个单词或一种表达方式在源语言和目标语言中的对应翻译结果;翻译记忆管理工具保存了文本片段的在源语言和目标语言中的对应关系。  相似文献   

12.
基于实例的机器翻译——方法和问题   总被引:1,自引:0,他引:1  
介绍了基于实例的机器翻译方法,并对基于实例的机器翻译中的若干问题,如双语实例的加工对齐、实例的相似度计算和实例模板提取等问题作了说明。  相似文献   

13.
为框正英文标识语错误频出的现状,按照功能翻译理论的"目的法则",就城市标识语英译存在的问题及翻译技巧进行分析,将标识语英译方法归纳为硬译法、习惯表达翻译法、增减词法、转化法和结构重组法、套译法等。在实践中融会贯通,以实现标识语的信息功能和祈使功能。  相似文献   

14.
该文通过改进字节对编码算法,提出了带字数阈值的藏文字节对编码算法,优化了基于注意力机制的汉藏神经机器翻译模型.收集整理了100万汉藏句对和20万汉藏人名地名词典,训练了汉藏神经机器翻译模型.通过测试和验证,模型的BLEU值达到36.84.该模型的命名实体翻译效果优于已商用汉藏在线翻译系统.同时,该文的神经机器翻译模型已...  相似文献   

15.
为了提高当代汉英互译译者的素质,基于译作实例,结合自身的翻译实践,从高度的责任意识、深厚的语言功底、广博的言外知识、敏锐的感受能力以及相关的计算机及网络知识等方面探讨了新时期译者应具备的素质。认为,译者应与时俱进,从以上各方面不断提高自己的综合素质,确保译文的质量。  相似文献   

16.
基于汉英双语语料库的翻译等价单位自动获取研究   总被引:6,自引:0,他引:6  
双语语料库在机器翻译或机器辅助翻译研究中的重要作用已经越来越多地得到研究人员的认可。本文探讨了如何利用汉英双语语料进行汉英翻译等价单位的抽取,提出了基于词语关联度进行多词组合单位的识别方法,并利用假设-检验的方法,在汉英双语语料库中抽取翻译等价单位。本文还对不同的关联度量方法进行了对比,并提出利用范畴假设改进抽取算法的效率。  相似文献   

17.
以英汉机器翻译系统为研究背景,提出了一种基于规则的句子结构分析与转换方法。针对不同情况采取不同策略将复杂句分解成由一组简单句构成的复杂句子结构。简单句结构分析以谓语动词为中心,依据其EICG格约束和句子浅层分析结果填充格框架,从而得到整个句子的语法语义结构。句子结构转换依照句子分析结果和转换规则产生等价的目标语言的线性语法语义结构。系统运行结果表明,本文提出的方法能够正确有效地分析英语句子的结构并完成英汉句子的转换。  相似文献   

18.
一种改进的句子相似度计算模型   总被引:3,自引:0,他引:3  
在基于实例的机器翻译中,句子相似度计算是实例匹配的有效机制。该文对基于相同词的句子相似模型作进一步的改进,包括关键词抽取,以及在句子相似度的定义中引入同义词的情形。实验结果表明,改进方法比原方法具有较高的准确率。  相似文献   

19.
通过对菲律宾语的词法分析、句法分析、语义分析等基础研究和机器翻译、拼写检查、情感分析等应用技术的研究进展进行分析,得知菲律宾语仍属于语言资源较为缺乏的低资源语言,在菲律宾语自然语言处理领域,现有研究比较宽泛但不深入,与英语、汉语等语种的自然语言处理研究相比,还存在较大差距;相较而言,英菲平行语料库构建及其机器翻译的研究取得了较大进展,而其他领域研究进展相对缓慢。总体来说,通过跨语言处理技术构建跨语言平行语料库,推动深度学习应用于菲律宾语自然语言处理的方法研究,探讨基于规则、图模型、结构等方法对菲律宾语文本自动摘要的适用性,将是未来菲律宾语自然语言处理的主要研究方向。  相似文献   

20.
基于语料库的机器翻译系统   总被引:1,自引:0,他引:1  
基于语料库的机器翻译系统可分为两种:基于统计的机器翻译系统和基于实例的机器翻译系统。本文讨论这两种机器翻译系统的基本原理,并讨论了翻译记忆软件和本土化软件工具。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号