首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 421 毫秒
1.
交互式机器翻译(Interactive Machine Translation,IMT)是一种通过机器翻译系统与译员之间的相互作用指导计算机解码并改善输出译文质量的技术。目前主流的IMT方法使用译员确定的前缀作为唯一约束指导解码,交互方式受限,交互效率低。该文从交互方式和解码算法两个方面对IMT方法进行改进。在交互方式方面,允许译员译前从短语译项列表中为源语言短语选择正确译项。该文还提出了基于短语表的多样性排序算法,来提高短语候选译项的多样性,并根据译员的翻译认知过程设计交互界面,改善译员在翻译过程中的用户体验。在解码算法方面,将双语短语与前缀一同作为约束参与指导解码过程,提高翻译假设评价和过滤的准确性。在LDC汉英平行语料上进行了人工评测,实验结果表明该方法较传统的IMT方法能够减轻译员的认知负担,减少翻译时间,提升翻译效率。  相似文献   

2.
季铎  马斌  叶娜 《计算机应用》2015,35(4):1009-1012
以交互式机器翻译(IMT)为研究背景,针对用户在翻译过程中调用双语查词而导致的鼠标-键盘频繁切换的问题,提出了一种面向翻译查词行为的预测模型。该模型将查词行为转化为当前翻译条件下的译文选择问题,利用对齐模型、翻译模型和语言模型实现了高准确率的查词行为预测。在人工双语对齐语料的测试中,该方法预测准确率约为64.99%,特别对占有比例较高的名词预测正确率可达71.43%,能有效减少人工翻译中的重复性和机械性操作,改善了用户使用交互翻译系统的翻译体验,从而提高翻译效率。  相似文献   

3.
在传统的机器翻译(machine translation,MT)与计算机辅助翻译(computer aided translation,CAT)中,译员与翻译引擎之间的交互受到很大限制,于是产生了交互式机器翻译(interactive machine translation,IMT)技术。但传统的模型只考虑当前源语与部分翻译的目标语的信息,没有将用户交互后的对齐信息加入到之后的预测模型中。该文基于词预测交互式机器翻译的研究思路,将用户交互翻译过程中的鼠标点选行为转化为中间译文的词对齐信息,进而在翻译交互过程中实现了对译文的动态词对齐标注,并在词对齐信息和输入译文的约束下提高了传统词预测的准确性。  相似文献   

4.
机译知识获取是机器翻译系统研究中一个至关重要又极难解决的问题。目前多数机译系统的知识库都是由人工静态建立的, 系统不能自行对其进行扩充。本文介绍了一个智能机译系统IMT/EC来统中用多种途径进行知识获取的学习机制的设计与实现。这一机制实现了自动知识获取及动态知识维护, 使IMT/EC来统有护强的适应能力。  相似文献   

5.
张广才  张菊维 《计算机工程》2005,31(Z1):117-119
介绍了一个机器翻译辅助开发平台MTDevStudio中的部分关键技术,包括模型定义、句法树操作的实现、语料库规则提取与统计分析、翻译引擎的评测等,重点对基于规则的机器翻译的辅助开发实现进行了介绍。该平台有利于减少机器翻译过程中的大量重复性工作,使研究者致力于自然语言理解的核心理论研究。与其它辅助工具相比,该平台致力于集成机器翻译涉及到的全面工作,用户可以自定义机器翻译模型,可扩展性好,并由机器翻译专家实际参与使用、评价,取得了不错的效果。  相似文献   

6.
在很多领域中,全自动机器翻译的译文质量还无法达到令人满意的程度。要想获得正确无误的译文,往往需要翻译人员对自动翻译系统的输出进行后处理。在交互式机器翻译的框架内,翻译系统和译员协同工作,译员确认系统提供的译文中的最长正确前缀,系统据此对译文后缀进行预测,共同完成翻译任务。该文利用基于短语的翻译模型,建立了交互式机器翻译系统,并结合交互式机器翻译的特点,利用句法层面的子树信息来指导翻译假设的扩展。实验表明,该方法可以有效地减少人机交互次数。  相似文献   

7.
中等词汇的汉英语音翻译系统   总被引:1,自引:0,他引:1  
本文给出汉英语音翻译系统的组成,介绍了系统中连续汉语语音识别和汉英机器翻译的工作;我们已经在限定主题、中等词汇量的条件下实现了非特定人的连续语音识别,实现了汉英语音翻译实验演示系统。  相似文献   

8.
为提高汉-英统计机器翻译的翻译效果,提出一个基于依存句法关系的语言模型,在较成熟的基于短语翻译的统计特征下,对解码产生的NBEST候选翻译结果进行进一步约束,重新计算得分,调整NBEST候选翻译序列,以得到最佳翻译。实验以"Pharaoh"为比较基准,以500句汉英句对为测试集,最终的实验结果表明,提出的基于依存句法关系的语言模型可以在一定程度上提高汉-英统计机器翻译最佳翻译的正确率。  相似文献   

9.
赵斌 《网友世界》2014,(21):134-134
社会政治经济的快速发展加速了我国国际化的进程,由此产生了一个庞大的市场。但是由于翻译过程本身是个高强度的脑力和体力劳动,如何提高效率,节约时间成本和经济成本就成为了一个翻译者需要考虑的问题。机器翻译的日益完善为广大从事翻译的工作人员提供了福音。本文主要探讨如何把机器翻译和人工校对紧密结合起来提高翻译的质量和效率。  相似文献   

10.
针对传统英汉机器翻译系统翻译准确率低、语法理解错误,导致上下文衔接出现偏差、语义不连贯通顺的问题,设计一个基于特征提取的英汉机器自动转换翻译系统。首先,构建一个机器翻译语义模型,通过该模型对模糊语义的关系进行映射,以更好地提取出英语语句内容的特征;然后从系统硬件和软件两个部分进行具体设计,特别引入语义本体模型的源语句特征提取方法;最后通过实验对系统进行测试。通过人工评分后可知,本系统进行机器翻译后得到的平均分为3.725分,比设定的标准值F更高,说明本系统的翻译准确率较高,翻译质量较好,达到用户的自动转换翻译需求。  相似文献   

11.
在单语语料的使用上,统计机器翻译可通过利用语言模型提高性能,而神经机器翻译很难通过这种方法有效利用单语语料.针对此问题,文中提出基于句子级双语评估替补(BLEU)指标挑选数据的半监督神经网络翻译模型.分别利用统计机器翻译和神经机器翻译模型对无标注数据生成候选翻译,然后通过句子级BLEU指标挑选单语候选翻译,加入到有标注的数据集中进行半监督联合训练.实验表明,文中方法能高效利用无标注的单语语料,在NIST汉英翻译任务上,相比仅使用精标的有标注数据单系统,文中方法BLEU值有所提升.  相似文献   

12.
一个基于JAVA的堆栈式自然语言翻译解码器   总被引:1,自引:0,他引:1  
解码是统计学自然语言翻译系统的重要一步,解码器的任务是用从训练文本中学习到的语言/翻译模型的信息来确定源句子最可能的翻译句子,解码器的输入是翻译模型和语言模型,以及源语言句子,输出源语言句子最可能的对应目标句子/翻译。由于可能的目标句子很多,通常解码算法只能搜索一小部分可能的目标语言句子。该文介绍了一种基于堆栈算法的,用Java实现的解码器。Java平台提供了方便的跨平台的应用,高度安全、开放、健壮。解码器的实现重点在于解码算法和参数的选择。  相似文献   

13.
基于实例的汉英机器翻译系统研究与实现   总被引:8,自引:1,他引:8  
文章实现了一个基于实例的汉英机器翻译系统(Example-BasedChinese-EnglishMachineTranslation,简称E-BCEMT)。实验结果表明:以纯粹的中英对照的句子对的例句库为基础,且不进行深层次的语法分析,在给定的翻译模式下,该翻译系统在效率、翻译结果的正确率等方面取得了令人满意的结果。  相似文献   

14.
We present The Chinese Room , a visualization interface that allows users to explore and interact with a multitude of linguistic resources in order to decode and correct poor machine translations. The target users of The Chinese Room are not bilingual and are not familiar with machine translation technologies. We investigate the ability of our system to assist such users in decoding and correcting faulty machine translations. We found that by collaborating with our application, end-users can overcome many difficult translation errors and disambiguate translated passages that were otherwise baffling. We also examine the utility of our system to machine translation researchers. Anecdotal evidence suggests that The Chinese Room can help such researchers develop better machine translation systems.  相似文献   

15.
This paper describes the framework of the StatCan Daily Translation Extraction System (SDTES), a computer system that maps and compares web-based translation texts of Statistics Canada (StatCan) news releases in the StatCan publication The Daily. The goal is to extract translations for translation memory systems, for translation terminology building, for cross-language information retrieval and for corpus-based machine translation systems. Three years of officially published statistical news release texts at were collected to compose the StatCan Daily data bank. The English and French texts in this collection were roughly aligned using the Gale-Church statistical algorithm. After this, boundary markers of text segments and paragraphs were adjusted and the Gale-Church algorithm was run a second time for a more fine-grained text segment alignment. To detect misaligned areas of texts and to prevent mismatched translation pairs from being selected, key textual and structural properties of the mapped texts were automatically identified and used as anchoring features for comparison and misalignment detection. The proposed method has been tested with web-based bilingual materials from five other Canadian government websites. Results show that the SDTES model is very efficient in extracting translations from published government texts, and very accurate in identifying mismatched translations. With parameters tuned, the text-mapping part can be used to align corpus data collected from official government websites; and the text-comparing component can be applied in prepublication translation quality control and in evaluating the results of statistical machine translation systems.  相似文献   

16.
We propose Generate and Repair Machine Translation (GRMT), a constraint–based approach to machine translation that focuses on accurate translation output. GRMT performs the translation by generating a Translation Candidate (TC), verifying the syntax and semantics of the TC and repairing the TC when required. GRMT comprises three modules: Analysis Lite Machine Translation (ALMT), Translation Candidate Evaluation (TCE) and Repair and Iterate (RI). The key features of GRMT are simplicity, modularity, extendibility, and multilinguality.
An English–Thai translation system has been implemented to illustrate the performance of GRMT. The system has been developed and run under SWI–Prolog 3.2.8. The English and Thai grammars have been developed based on Head–Driven Phrase Structure Grammar (HPSG) and implemented on the Attribute Logic Engine (ALE). GRMT was tested to generate the translations for a number of sentences/phrases. Examples are provided throughout the article to illustrate how GRMT performs the translation process.  相似文献   

17.
分析了基于IBM Model 4的A*搜索算法和启发函数,由于仅靠启发函数难以找到最优译文,因此在搜索中采用了部分宽度搜索,以扩大搜索的范围。将该算法应用于汉英统计机器翻译中,实验结果表明改进后的算法获得了较好的翻译质量和效率。  相似文献   

18.
本文从人工翻译和机器翻译的经验出发,引入数据仓库和数据挖掘技术建造语料库,提出一个采用模板技术的译语精确生成和机助人译结合的动态机器翻译系统,专门用于英语词典的翻译出版,促使机器翻译走向实用化,初步研究取得了较好效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号