首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
基于HNC理论的句法结构歧义消解   总被引:3,自引:0,他引:3  
歧义消解是自然语言理解和处理所面对的核心问题。基于词组和短语的消歧不能保证消歧结果的正确,歧义的成功消解基于对语境或上下文(context)的正确理解。HNC理论采取的概念基元化、层次化、网络化、形式化策略以及在此基础上建立的句类和句式体系,为自然语言的歧义消解提供了最大的可能。基于HNC理论的歧义消解的总体原则是,以语句为基础,充分利用语句语境提供的句类知识,采取宏观消歧与微观消歧相结合的策略。对于经典句法歧义结构V+NP1+的+NP2,本文描述了其三重性歧义性质,并提出了三条准则和十个推论以实现对其歧义的消解。  相似文献   

2.
基于概率上下文无关文法的句法分析歧义消解新模式   总被引:2,自引:1,他引:2  
基于自然语言句法歧义消解常用的一种概率模型-概率上下文无关文法,融入上下文相关的概率信息,提出一种新的歧义消解计算模式,该模式经测试可以有效地提高句法分析中歧义消解的正确率。  相似文献   

3.
汉英机器翻译中基于实例的歧义结构消解   总被引:1,自引:0,他引:1  
歧义是自然语言特别是汉语的显著特点和普遍现象,也是当前汉英机器翻译系统的主要处理难点之一。通过对其中一些常见汉语歧义结构的分析,提出一种基于实例的歧义结构消解方法。由于歧义结构的对应实例具有较高的“结构”上的代表性,通过与这些实例的相似性比较可以较准确地把握待消歧语段的内部结构。  相似文献   

4.
本文分为三部分: 首先, 概述了目前自然语言理解主要是汉语理解技术的现状, 指出迄今为止用于自然语言理解的语言知识几乎都是来自书面语料的, 是单媒体的。 其次, 从七个不同层次分析了(汉语) 自然语言理解中存在的多重歧义问题, 指出多重歧义如何消解是目前自然语言理解中的难题。 第三, 论证了多媒体与虚拟现实技术在自然语言理解中的作用, 指出语言交际和交际环境的多媒体性质, 主张建立多媒体语言资料库, 获取多媒体语言交际知识, 从而从语言学的角度论述了将最新的多媒体和虚拟现实技术用于自然语言理解的必要与可能。  相似文献   

5.
DENG Fan  YU Bin 《微机发展》2008,18(6):107-110
针对中文中歧义字段对中文处理及理解带来的诸多问题提出了一种基于自然语言理解的中文汉字歧义消除算法。对于交集型歧义和组合型歧义,利用《知网》为主要语义资源,以知识图知识表示方法,通过提出的字段消歧算法,对歧义字段以及上下文的语义进行计算,从而选出正确的句子切分方案,达到消除歧义的目的。经过实验数据表明本算法提高了中文歧义字段歧义切分的正确率。  相似文献   

6.
限制汉语语法分析中歧义性的启发式方法   总被引:2,自引:1,他引:1  
汉语语法、语义分析中的歧义性是计算机理解汉语的难点之一。本文提出根据对汉语单词用法的规则化描述, 建立各个单词的启发式规则, 用以对句法分析中歧义结构进行约束的一种分析机制。  相似文献   

7.
越南语中存在大量的交叉歧义片段。为了解决交叉歧义给分词、词性标注、实体识别和机器翻译等带来的影响,该文选取统计特征、上下文特征和歧义字段内部特征,尝试性地构建最大熵模型,对越南语的交叉歧义进行消解。该文通过三种方法整理出包含174 646词条的越南语词典,然后通过正向和逆向最大匹配方法从25 981条人工标注好的越南语分词句子中抽取5 377条歧义字段,分别测试了三类特征对歧义模型的贡献程度,并对歧义字段做五折交叉验证实验,准确率达到了87.86%。同时,与CRFs进行对比实验,结果表明该方法能更有效消解越南语交叉歧义。  相似文献   

8.
扩充转移网络具有直观定量的特点,其在句法处理中的应用可推动自然语言的程序化研究.歧义现象类似“多车道单向”通行,各车道的认知选择具有非回溯的优先性.花园幽径现象是“单车道”单向通行,前期默认式选择蕴涵后期反叛式决定,折返性跨越式解读使其具有心理实验的“啊哈”体验.两种现象的程序化句法研究证实了歧义现象和花园幽径现象具有区别性特征这一论断.  相似文献   

9.
中文科技术语的结构描述及潜在歧义   总被引:6,自引:1,他引:5  
本文是作者最近在中文术语数据库研究中提出的“ 潜在歧义论”(简称PA论)的第一部分, 说明了中文科技术语中存在着PT-结构、SF-结构和LS-结构三个层次不同的结构, 而当术语的PT-结构与SF-结构不一一对应时, 就会产生潜在歧义, 这种潜在歧义普遍地存在于中文科技术语的PT-结构之中, 是中文词组型术语结构自动分析中的关键问题。“ 潜在歧义论” 为中文科技术语的自动分析提供了一个行之有效的“ 受限语法” 模型。  相似文献   

10.
一种面向网络答疑的汉语切分歧义消除算法   总被引:3,自引:0,他引:3  
针对网络答疑的特点,该文提出了一种汉语歧义消除算法,采用回溯机制及歧义消除评优算法相结合的方法消除汉语切分歧义。首先利用回溯机制发现句子的切分歧义字段,产生含有多种可能切分结果的候选集;然后针对网络答疑特点提出了评优算法,利用该算法计算候选结果的评价值,对其进行排序,选取分词最佳结果,从而消除歧义,提高分词的准确率。该算法已经在基于Web的自然语言答疑系统WebAnswerSystem中实现并得到了实际应用。实验结果表明,算法具有较高的准确率和召回率,对自然语言网络答疑中进行切分歧义消除是行之有效的。  相似文献   

11.
篇章标注是自然语言处理中的重要任务,很多其他任务,如自动摘要、机器问答等都可以通过篇章标注得到对文本内容和语义的认识,从而获得更好的结果。与此同时,篇章理解的理论如篇章修辞结构(RST),向心理论(CT)等与实际问题的结合并不紧密,难以实用。该文中我们参考现有的语言学理论和一些语篇标注库(如RST-DT,PDTB),并结合自然语言处理任务特点,提出了一套用于篇章标注的汉语标注体系。这个体系能够比较准确和全面地描述出篇章的内容和逻辑关系,并很好地服务于实际任务的需要。  相似文献   

12.
逐字分词法是以汉语词典为基础对中文语句通过匹配进行切分的方法。该方法在分词中无法解决交叉歧义与组合歧义带来的问题。本文以词典分词为基础,从序列标注的角度,在逐字匹配过程中使用CRFs标注模型提供辅助决策,由此来处理歧义问题。经实验和分析,该方法较传统的CRFs模型分词法和词典分词,更适合对分词速率及正确率都有一定要求的系统。  相似文献   

13.
This paper develops a semantics with control over scope relations using Vermeulen’s stack valued assignments as information states. This makes available a limited form of scope reuse and name switching. The goal is to have a general system that fixes available scoping effects to those that are characteristic of natural language. The resulting system is called Scope Control Theory, since it provides a theory about what scope has to be like in natural language. The theory is shown to replicate a wide range of grammatical dependencies, including options for, and constraints on, ‘donkey’, ‘binding’, ‘movement’, ‘Control’ and ‘scope marking’ dependencies.  相似文献   

14.
隐喻自动处理研究进展   总被引:1,自引:1,他引:0  
隐喻在人类语言中普遍存在,是自然语言理解必须面对的问题。该文首先探讨了对隐喻的认识及语言中隐喻表达的分类。把隐喻自动处理分为隐喻识别、隐喻理解和隐喻生成三个子任务,对以往的研究成果进行梳理,着重介绍近几年来隐喻自动处理研究的新成果、新特点。隐喻自动处理离不开隐喻知识库的支持,文章也介绍了国内外隐喻知识库建设的主要成果。隐喻自动处理的目的是为了提高自然语言处理的智能化水平,文章探讨了隐喻处理在自然语言处理任务中的应用。最后展望了汉语隐喻自动处理研究的前景。  相似文献   

15.
作为基础的表义单位,语素及此上的构词分析,既是汉语作为意合语言进行语义分析的起点,也是认知、理解词义的关键。该文提出了一种探寻汉语语义基元和分析词义的新的视角和方法: 基于语素义相似度计算形成“同义语素集”,用来表征“语素概念”,并借鉴生成词库理论形成“语素概念体系”;建立在此基础上的汉语语义构词分析,在全局性语义分析、数据挖掘等方面也有新的进展。这些思路、做法及语言资源建设,有望推动人文领域和计算应用等相关工作的开展。  相似文献   

16.
中文数据库自然语言查询系统Nchiql设计与实现   总被引:15,自引:0,他引:15  
中文数据库自然语言查询的研究有两个基本目标,首先解决NLIDB面临的可移植性和可用性的问题,其次提出适合中文自然语言查询处理的特有方法,为此开了了中文数据库自然语言查询系统NChiql,从总体设计的角度,介绍了NChiql中的可移植性体系结构、中文自然语言查询分析、基于数据库语言的自然语言查询分析与转换和智能界面管理等内容,实验表明,该系统具有良好的可用性及高效和鲁棒的语言分析器。  相似文献   

17.
信息安全是信息时代国家安全的重要领域,整个国家不但需要安全的信息传递的基础设施,还需要对于在此之上传递的内容进行安全监控。内容安全监控策略建立在全信息理论基础之上,是信息安全的新课题。  相似文献   

18.
汉语词语知识库是HNC知识库系统的重要组成部分,目前其结构设计简单,加大了对HNC符号解析的难度。该文在分析了HNC的编码特点的基础上,改进了汉语词语知识库模型,阐述了改进后汉语词语知识库实体属性的设计方法和知识库的填写原则,并用实例说明了改进后的词语知识库可以提高自然语言处理的效率。  相似文献   

19.
隐喻理解的计算模型综述   总被引:2,自引:0,他引:2  
国际上,隐喻在思维及语言中所处的中心地位正逐渐引起人工智能研究者的重视。但在国内学术界,还鲜有开展隐喻计算化这方面研究的;实际上,作为异常用法的隐喻现象是自然语言中的普遍情况,因此隐喻问题若得不到很好的解决,将成为制约自然语言理解和机器翻译的瓶颈问题。本文结合相关的隐喻理论基础,根据不同的计算路线对已有隐喻理解计算模型进行分类,包括基于语义优先方法、基于知识表示的方法、基于逻辑的方法和基于统计语料库的方法,并在分析这些方法的适用范围和优缺点的基础上,对隐喻的计算理解方法以及面向汉语的隐喻理解计算模型研究提出了展望和建议。  相似文献   

20.
文章探讨了如何让在手语新闻播报中的卡通人按照自然手语的语法规则而非正常人的语法规则来打手语。首先整理了现代汉语自然手语的规则并将其形式化,并建立了正常汉语到汉语自然手语转换的形式规则库;从而实现了现代汉语文本到相应的自然手语的手语动作序列的自动生成。最后将其嵌入到通过手语合成技术和卡通动画的手语新闻播报系统中,使其在线输出的是符合聋人习惯的自然手语。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号