首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
机器翻译与自然语言处理的现状与趋势   总被引:1,自引:0,他引:1  
1991年12月9日,我们收到了日本电子工业振兴协会(Japan Electronic IndustryDevelopment Association)寄来的一份文件。该文件是关于当前机器翻译和自然语言处理研究现状和未来发展趋势的一份调查表,对于全面评价一个翻译系统或自然语言处理系统,以及正在进行着这方面研究工作的同志都有较高的参考价值。我们将其整理出来,愿能对我国机器翻译和自然语言处理的研究有所裨益。  相似文献   

2.
机器翻译(Machine Trans- lation)是通过计算机来实现不同自然语言之间的翻译。机器翻译是 自然语言处理(Natural Language Processing)的一个分支,机器翻译 与计算语言学(Computational Linguistics )、自然语言理解 (Natural Language Understanding)存在着密不可分的关系。机器翻译的研究与发展取决于计算机科学、数学、语言学、人工智能等多学科的发展,因此机器翻译可以说是一 个跨学科的综合性系统工程。人类 步入21 世纪以来,随着国际互联网 (Internet)的迅猛发展,网络信息 急剧膨胀,国际交流日益频繁以及 地球村的形成,机器…  相似文献   

3.
《计算机应用》2012,(4):1191
由中国计算机学会(CCF)主办的CCF中文信息技术专业委员会年度学术会议——自然语言处理与中文计算会议(以下简称NLP&CC)将于2012年10月31日—11月5日在北京召开。NLP&CC 2012以"互联网创新与应用"为主题,重点关注基于互联网、移动终端的自然语言处理与中文计算,包括Web挖掘、搜索与广告、数字出版、社会网络、机器翻译、智能问答等学术界与工业界的研究与技术创新问题,欢迎学术界和工业界同行围绕相关研究、理论及应用现状、标准、技术实现、工业界应用与用户实践等议题投稿,且论文内容具有创新性(从  相似文献   

4.
机器翻译是应用计算机实现从一种自然语言文本到另一种自然语言文本的翻译,是自然语言处理研究领域的一个分支。本文就现行机器翻译面临的问题,讨论基于实例的机器翻译方法及其优化策略。  相似文献   

5.
在自然语言处理中,机器翻译是一个最早的研究课题。远在1946年电子计算机问世之时,英国工程师A.D.Booth和美国工程师W.Weaver就提出了利用计算机进行机器翻译的想法。1954年,美国乔治敦大学在国际商用机器公司的协同下,用IBM-701计算机进行了世界上第一次机译试验,首次用机器把俄语译成了英语。五十年代,在世界范围内出现了机译的热潮。但六十年代中期,美国语言自动加工咨询委员会(简称ALP-AC)发表了《语言与机器》的黑皮书,否认了机译实用的可能性,致使许多国家的机译  相似文献   

6.
《中文信息学报》1999,13(4):65-65
中国中文信息学会自然语言处理专业委员会和国家自然科学基金委员会联合主办的《机器翻译与计算机语言信息处理国际会议》(International Conference on Machine Translation & Language Information Processing) ,于1999年6月26至28日在北京国谊宾馆举行。  相似文献   

7.
理性主义与经验主义相结合的机器翻译研究策略   总被引:1,自引:0,他引:1  
徐金安 《计算机科学》2011,38(6):223-229
主要介绍了基于规则、基于实例和基于统计等3种主流机器翻译方法,探讨了自然语言处理技术和机器翻译中基于规则的理性主义方法和基于统计的经验主义方法的优缺点,结合机器翻译研究的现状和发展方向,提出了规则和统计相结合的机器翻译方法的基本思路,阐述了词义消歧中的理性主义方法和经验主义方法相结合的发展方向,对机器翻译的发展趋势进行了探讨。  相似文献   

8.
多文档自动文摘综述   总被引:18,自引:9,他引:18  
秦兵  刘挺  李生 《中文信息学报》2005,19(6):15-20,56
多文档文摘是将同一主题下的多个文本描述的主要的信息按压缩比提炼为一个文本的自然语言处理技术。随着互联网上信息的日益丰富,多文档文摘技术成为新的研究热点。本文介绍了多文档文摘的产生和应用背景,阐述了多文档文摘和其他自然语言处理技术的关系,对多文档文摘国内外研究现状进行了分析,在此基础上汇总提出了多文档文摘研究的基本路线及关键技术,并总结了多文档文摘的未来及发展趋势。  相似文献   

9.
神经机器翻译前沿综述   总被引:3,自引:0,他引:3  
机器翻译是指通过计算机将源语言句子翻译到与之语义等价的目标语言句子的过程,是自然语言处理领域的一个重要研究方向。神经机器翻译仅需使用神经网络就能实现从源语言到目标语言的端到端翻译,目前已成为机器翻译研究的主流方向。该文选取了近期神经机器翻译的几个主要研究领域,包括同声传译、多模态机器翻译、非自回归模型、篇章翻译、领域自适应、多语言翻译和模型训练,并对这些领域的前沿研究进展做简要介绍。  相似文献   

10.
藏文信息处理已经从最初字处理转向了自然语言处理的阶段。现如今正逐步向句法分析、语句分析、自动文摘、自动分类和机器翻译迈进。但是这些都基于词的层面上研究处理,而词则受许多格标记和虚词的制约。因此,在藏文信息处理中对格标记的分词标注更是一件棘手和复杂的事。该文通过研究藏文信息中的兼类虚词na和la,提出了如何在不同的语境中,处理和解决这类词性的标注问题。  相似文献   

11.
近年来,discriminative re-ranking技术已经被应用到很多自然语言处理相关的分支中,像句法分析,词性标注,机器翻译等,并都取得了比较好的效果,在各自相应的评估标准下都有所提高。本文将以统计机器翻译为例,详细地讲解利用单纯形算法(Simplex Algorithm)对翻译结果进行re-rank的原理和过程,算法的实现和使用方法,以及re-rank实验中特征选择的方法,并给出该算法在NIST-2002(开发集)和NIST-2005(测试集)中英文机器翻译测试集合上的实验结果,在开发集和测试集上,BLEU分值分别获得了1.26%和1.16%的提高。  相似文献   

12.
机器翻译系统是一种典型的自然语言处理系统,语言技术是机器翻译系统中居于核心地位的技术。本文结合863 项目《班智达汉藏公文机器翻译系统》的研制实践,论述了词项信息同语法规则相结合的原则,提出了以动词为中心的句法分析二分法,从而在受限语言的范围内,为建立有较大适应性的机器翻译规则系统,有效地提高机器翻译语法分析的效率提供了有益的方法。  相似文献   

13.
译后编辑是近年来随机器翻译发展新兴的计算机应用研究领域。综述了译后编辑所涉及的三方面的技术问题:自动译后编辑,自动机器翻译质量评估以及译后编辑工作量测量。自动译后编辑与自动机器翻译质量评估均应用自然语言处理领域相关技术,通过自动完成部分编辑工作、筛选机器翻译译文来降低译员工作量,从而提高效率。对译后编辑工作量的研究侧重于分析机器翻译译文的错误对译员工作量的影响,为译后编辑系统环境的设计提供理论依据。总体而言,译后编辑技术研究的主要目的是提高译员的工作效率。  相似文献   

14.
随着自然语言处理研究的不断深入,人们不但迫切需要挖掘文本更多的潜在语言学信息,而且还力图通过机器学习预测这些潜在的语言学知识,以便更加有效地提高机器翻译的性能,同时为计算语言学服务。韵律作为语音学方面的知识,已经广泛用于到语音合成、文音转换、语音翻译各个语音方面,对基于语音的自然语言处理起到不可替代的作用。该文对韵律信息如何,并以何种方式改进机器翻译进行了介绍,并通过实验验证韵律信息对层次短语模型有改进。  相似文献   

15.
机器翻译评测的新进展   总被引:4,自引:2,他引:4  
机器翻译评测对机器翻译的研究和开发具有至关重要的作用,对其的研究一直是国内外机器翻译界的重点课题。本文首先全面地介绍了最近出现的而且受到极大关注的机器翻译评测技术,即IBM公司的BLEU机器翻译评测标准和NIST采用的机器翻译评测技术。实验表明,自动翻译评测技术能够接近人工评价,评测结果也是可接受的。因此,采用自动翻译评测技术能够给自然语言处理的研究人员和开发人员带来很大的便利性。本文还展示了一个开放式的可扩展的自动翻译评测的平台,完全实现了BLEU和NIST评测标准,并做出了一定的改进使得该系统具有良好的使用性和可扩展性。  相似文献   

16.
一、引言 人工智能(AI)中自然语言处理(理解)的研究在八十年代进入了并行处理阶段,国外已有众多研究成果[1]。进入九十年代,其研究水平已相当高,其中比较成功和有名的有美国卡内基·梅隆大学与南加利福尼亚大学联合研制的SNAP(语义网络阵列处理机),它由160个TMS320C32DSP芯片组成[2],用于机器翻译系统;美国卡内基·梅隆大学与日本NEC公司联合研制的大规模并行联想处理机IXM2,它由64个处理机组成[3],用于大规模并行句法分析。笔者1991年在澳大利亚墨尔本大学成功地用Encore多处理机系统进行了汉语并行句法分析[4]。最近我们承担了“汉藏英机器翻译系统”课题中的部分研究任务,进行了适用于MCP(现代汉语处理)的一种多处理机系统设计。  相似文献   

17.
自然语言生成(Natural Language Generation, NLG)任务是自然语言处理(Natural Languge Processing, NLP)任务中的一个子类,并且是一项具有挑战性的任务。随着深度学习在自然语言处理中的大量应用,其已经变成自然语言生成中处理各种任务的主要方法。自然语言生成任务中主要有问答任务、生成摘要任务、生成评论任务、机器翻译任务、生成式对话任务等。传统的生成模型依赖输入文本,基于有限的知识生成文本。为解决这个问题,引入了知识增强的方法。首先介绍了自然语言生成的研究背景和重要模型,然后针对自然语言处理归纳介绍了提高模型性能的方法,以及基于内部知识(如提取关键词增强生成、围绕主题词等)和外部知识(如借助外部知识图谱增强生成)集成到文本生成过程中的方法和架构。最后,通过分析生成任务面临的一些问题,讨论了未来的挑战和研究方向。  相似文献   

18.
机器翻译(MachineTranslation,简称MT)是21世纪科技领域的一个难题之一,而要实现机器翻译,对自然语言进行形式化是核心。机器翻译的突破依赖于语言学研究的突破。该文介绍一种汉语句子形式化的方法。涉及的内容包括Montague语法,范畴语法,内涵逻辑,汉语语法等。该文主要在理论上进行了探讨,并用例子进行详细说明该汉语句子形式化方法在英汉机器翻译中的应用。结果表明,该方法具有一定的有效性。  相似文献   

19.
自然语言处理及机器翻译(MT)是近几年来人工智能的一个重要发展方向,也是第五代计算机研制计划中的一个主要目标,它越来越受到人们的重视。本文对自然语言处理中具有代表性的形式分析系统——扩充转换网(ATN)作一些改进。 ATN是Woods在1970年提出的一种分析自然语言的方法。它具有比上下文无关文法(CFG)更强的分析处理功能。近十几年来,ATN文法不断得到完善、发展,但是这些改进都着重于增强ATN的功能,而ATN的形式没有改变,仍是Woods当初用Lisp表示的形式(文中简称为L-ATN)。 本文提出用PROLOG来表示ATN文法,称为PRO-ATN,使ATN具有一阶谓词逻辑的结构,从而PRO-ATN在清晰性、处理能力、简洁性、效率和灵活性方面都比L-ATN要好。本文比较了它们在这些方面的优缺点并介绍了一个用PRO-ATN实现的自然语言分析试验系统。  相似文献   

20.
基于规则和统计的中文自动文摘系统   总被引:6,自引:2,他引:6  
自动文摘是自然语言处理领域里一个重要课题,本文在传统方法基础上提出了一种中文自动文摘的方法。在篇章结构分析里,我们提出了基于连续段落相似度的主题划分算法,使生成的文摘更具内容全面性与结构平衡性。同时结合了若干规则对生成的文摘初稿进行可读性加工处理,使最终生成的文摘更具可读性。最后提出了一种新的文摘评价方法(F-new-measure)对系统进行测试。系统测试表明该方法在不同文摘压缩率时,评价值均较为稳定。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号