共查询到20条相似文献,搜索用时 234 毫秒
1.
基于HNC理论的句法结构歧义消解 总被引:3,自引:0,他引:3
歧义消解是自然语言理解和处理所面对的核心问题。基于词组和短语的消歧不能保证消歧结果的正确,歧义的成功消解基于对语境或上下文(context)的正确理解。HNC理论采取的概念基元化、层次化、网络化、形式化策略以及在此基础上建立的句类和句式体系,为自然语言的歧义消解提供了最大的可能。基于HNC理论的歧义消解的总体原则是,以语句为基础,充分利用语句语境提供的句类知识,采取宏观消歧与微观消歧相结合的策略。对于经典句法歧义结构V+NP1+的+NP2,本文描述了其三重性歧义性质,并提出了三条准则和十个推论以实现对其歧义的消解。 相似文献
2.
3.
汉英机器翻译中基于实例的歧义结构消解 总被引:1,自引:0,他引:1
歧义是自然语言特别是汉语的显著特点和普遍现象,也是当前汉英机器翻译系统的主要处理难点之一。通过对其中一些常见汉语歧义结构的分析,提出一种基于实例的歧义结构消解方法。由于歧义结构的对应实例具有较高的“结构”上的代表性,通过与这些实例的相似性比较可以较准确地把握待消歧语段的内部结构。 相似文献
4.
本文分为三部分:
首先, 概述了目前自然语言理解主要是汉语理解技术的现状, 指出迄今为止用于自然语言理解的语言知识几乎都是来自书面语料的, 是单媒体的。
其次, 从七个不同层次分析了(汉语) 自然语言理解中存在的多重歧义问题, 指出多重歧义如何消解是目前自然语言理解中的难题。
第三, 论证了多媒体与虚拟现实技术在自然语言理解中的作用, 指出语言交际和交际环境的多媒体性质, 主张建立多媒体语言资料库, 获取多媒体语言交际知识, 从而从语言学的角度论述了将最新的多媒体和虚拟现实技术用于自然语言理解的必要与可能。 相似文献
5.
针对中文中歧义字段对中文处理及理解带来的诸多问题提出了一种基于自然语言理解的中文汉字歧义消除算法。对于交集型歧义和组合型歧义,利用《知网》为主要语义资源,以知识图知识表示方法,通过提出的字段消歧算法,对歧义字段以及上下文的语义进行计算,从而选出正确的句子切分方案,达到消除歧义的目的。经过实验数据表明本算法提高了中文歧义字段歧义切分的正确率。 相似文献
6.
限制汉语语法分析中歧义性的启发式方法 总被引:2,自引:1,他引:1
汉语语法、语义分析中的歧义性是计算机理解汉语的难点之一。本文提出根据对汉语单词用法的规则化描述, 建立各个单词的启发式规则, 用以对句法分析中歧义结构进行约束的一种分析机制。 相似文献
7.
越南语中存在大量的交叉歧义片段。为了解决交叉歧义给分词、词性标注、实体识别和机器翻译等带来的影响,该文选取统计特征、上下文特征和歧义字段内部特征,尝试性地构建最大熵模型,对越南语的交叉歧义进行消解。该文通过三种方法整理出包含174 646词条的越南语词典,然后通过正向和逆向最大匹配方法从25 981条人工标注好的越南语分词句子中抽取5 377条歧义字段,分别测试了三类特征对歧义模型的贡献程度,并对歧义字段做五折交叉验证实验,准确率达到了87.86%。同时,与CRFs进行对比实验,结果表明该方法能更有效消解越南语交叉歧义。 相似文献
8.
扩充转移网络具有直观定量的特点,其在句法处理中的应用可推动自然语言的程序化研究.歧义现象类似“多车道单向”通行,各车道的认知选择具有非回溯的优先性.花园幽径现象是“单车道”单向通行,前期默认式选择蕴涵后期反叛式决定,折返性跨越式解读使其具有心理实验的“啊哈”体验.两种现象的程序化句法研究证实了歧义现象和花园幽径现象具有区别性特征这一论断. 相似文献
9.
中文科技术语的结构描述及潜在歧义 总被引:6,自引:1,他引:5
本文是作者最近在中文术语数据库研究中提出的“ 潜在歧义论”(简称PA论)的第一部分, 说明了中文科技术语中存在着PT-结构、SF-结构和LS-结构三个层次不同的结构, 而当术语的PT-结构与SF-结构不一一对应时, 就会产生潜在歧义, 这种潜在歧义普遍地存在于中文科技术语的PT-结构之中, 是中文词组型术语结构自动分析中的关键问题。“ 潜在歧义论” 为中文科技术语的自动分析提供了一个行之有效的“ 受限语法” 模型。 相似文献
10.
一种面向网络答疑的汉语切分歧义消除算法 总被引:3,自引:0,他引:3
针对网络答疑的特点,该文提出了一种汉语歧义消除算法,采用回溯机制及歧义消除评优算法相结合的方法消除汉语切分歧义。首先利用回溯机制发现句子的切分歧义字段,产生含有多种可能切分结果的候选集;然后针对网络答疑特点提出了评优算法,利用该算法计算候选结果的评价值,对其进行排序,选取分词最佳结果,从而消除歧义,提高分词的准确率。该算法已经在基于Web的自然语言答疑系统WebAnswerSystem中实现并得到了实际应用。实验结果表明,算法具有较高的准确率和召回率,对自然语言网络答疑中进行切分歧义消除是行之有效的。 相似文献
11.
12.
逐字分词法是以汉语词典为基础对中文语句通过匹配进行切分的方法。该方法在分词中无法解决交叉歧义与组合歧义带来的问题。本文以词典分词为基础,从序列标注的角度,在逐字匹配过程中使用CRFs标注模型提供辅助决策,由此来处理歧义问题。经实验和分析,该方法较传统的CRFs模型分词法和词典分词,更适合对分词速率及正确率都有一定要求的系统。 相似文献
13.
Alastair Butler 《Journal of Logic, Language and Information》2007,16(3):241-264
This paper develops a semantics with control over scope relations using Vermeulen’s stack valued assignments as information
states. This makes available a limited form of scope reuse and name switching. The goal is to have a general system that fixes
available scoping effects to those that are characteristic of natural language. The resulting system is called Scope Control
Theory, since it provides a theory about what scope has to be like in natural language. The theory is shown to replicate a
wide range of grammatical dependencies, including options for, and constraints on, ‘donkey’, ‘binding’, ‘movement’, ‘Control’
and ‘scope marking’ dependencies. 相似文献
14.
15.
16.
中文数据库自然语言查询系统Nchiql设计与实现 总被引:15,自引:0,他引:15
中文数据库自然语言查询的研究有两个基本目标,首先解决NLIDB面临的可移植性和可用性的问题,其次提出适合中文自然语言查询处理的特有方法,为此开了了中文数据库自然语言查询系统NChiql,从总体设计的角度,介绍了NChiql中的可移植性体系结构、中文自然语言查询分析、基于数据库语言的自然语言查询分析与转换和智能界面管理等内容,实验表明,该系统具有良好的可用性及高效和鲁棒的语言分析器。 相似文献
17.
信息安全是信息时代国家安全的重要领域,整个国家不但需要安全的信息传递的基础设施,还需要对于在此之上传递的内容进行安全监控。内容安全监控策略建立在全信息理论基础之上,是信息安全的新课题。 相似文献
18.
19.
隐喻理解的计算模型综述 总被引:2,自引:0,他引:2
国际上,隐喻在思维及语言中所处的中心地位正逐渐引起人工智能研究者的重视。但在国内学术界,还鲜有开展隐喻计算化这方面研究的;实际上,作为异常用法的隐喻现象是自然语言中的普遍情况,因此隐喻问题若得不到很好的解决,将成为制约自然语言理解和机器翻译的瓶颈问题。本文结合相关的隐喻理论基础,根据不同的计算路线对已有隐喻理解计算模型进行分类,包括基于语义优先方法、基于知识表示的方法、基于逻辑的方法和基于统计语料库的方法,并在分析这些方法的适用范围和优缺点的基础上,对隐喻的计算理解方法以及面向汉语的隐喻理解计算模型研究提出了展望和建议。 相似文献
20.
文章探讨了如何让在手语新闻播报中的卡通人按照自然手语的语法规则而非正常人的语法规则来打手语。首先整理了现代汉语自然手语的规则并将其形式化,并建立了正常汉语到汉语自然手语转换的形式规则库;从而实现了现代汉语文本到相应的自然手语的手语动作序列的自动生成。最后将其嵌入到通过手语合成技术和卡通动画的手语新闻播报系统中,使其在线输出的是符合聋人习惯的自然手语。 相似文献