首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 718 毫秒
1.
中文词汇网络(Chinese WordNet, 简称CWN)的设计理念,是在完整的知识系统下兼顾词义与词义关系的精确表达与语言科技应用。中文词义的区分与词义间关系的精确表征必须建立在语言学理论,特别是词汇语义学的基础上。而词义内容与词义关系的发掘与验证,则必须源自实际语料。我们采用的方法是分析与语料结合。结合的方式则除了验证与举例外,主要是在大量语料上平行进行词义标记,以反向回馈验证。完整、强健知识系统的建立,是兼顾知识本体(ontology)的完备规范(formal integrity)和人类语言系统内部的完整知识。我们采用了上层共享知识本体(SUMO)来提供知识的规范系统表征。  相似文献   

2.
先秦汉语在汉语史研究上具有重要地位,然而以往的研究始终没有形成结构化的先秦词汇资源,难以满足古汉语信息处理和跨语言对比的研究需要。国际上以英文词网(WordNet)的义类架构为基础,建立了数十种语言的词网,已经成为多语言自然语言处理和跨语言对比的基础资源。该文综述了国内外各种词网的构建情况,特别是古代语言的词网和汉语词网,且详细介绍了先秦词网的构建和校正过程,构建了涵盖43 591个词语、61 227个义项、17 975个义类的先秦词网。该文还通过与古梵语词网的跨语言对比,尝试分析这两种古老语言在词汇上的共性和差异,初步验证先秦词网的价值。  相似文献   

3.
刘鹏远  赵铁军 《软件学报》2009,20(5):1292-1300
为了解决困扰词义及译文消歧的数据稀疏及知识获取问题,提出一种基于Web利用n-gram统计语言模型进行消歧的方法.在提出词汇语义与其n-gram语言模型存在对应关系假设的基础上,首先利用Hownet建立中文歧义词的英文译文与知网DEF的对应关系并得到该DEF下的词汇集合,然后通过搜索引擎在Web上搜索,并以此计算不同DEF中词汇n-gram出现的概率,然后进行消歧决策.在国际语义评测SemEval-2007中的Multilingual Chinese English Lexical Sample Task测试集上的测试表明,该方法的Pmar值为55.9%,比其上该任务参评最好的无指导系统性能高出12.8%.  相似文献   

4.
李生  张晶 《计算机科学》2001,28(9):95-98
1 词义消歧及其应用词义是词汇在一定的语言环境下反映的特定语言现象。它能够明确地表达该词汇在该语境下表达的语义属性如感知、行为和情绪等;表达该词汇与相关词汇之间的关系;并且表达该词汇所特有的知识及常识性的知识。透过词义,人们将能运用自己的思维描述该语言现象,对其进行推理,或者为指代词从上下文中找到指代物。在自然语言中,一个词汇往往存在多个词义,称为词的多义性。例如:Bank有“银行”、“河岸”的意思。但是当词汇处于一定的语言环境,则只有唯一的意思。例如;“He slipped down the bank”中,bank的意思是“河岸”。词义消歧就是使计算机自动为词汇选择正确意思,是自然语言处理领域中词汇级别上的最大难题。词义消歧不是自然语言处理的最终目的,而是自然语言处理中不可缺少的一个环节。其应用至少包括下述领域:  相似文献   

5.
对语言Ontology进行了研究,提出了一个面向多文种信息处理的语言Ontology,给出了其设计思想、定义和推理机制,还描述了其结构和构建方法。该Ontology采用分层的树形结构,收录了具有语义的四类词:名词、动词、副词和形容词,并以词义和文种为类节点、词为叶子节点进行组织。能表示各个文种词汇的语义,并以语义为轴心进行融合,以提供不同文种间词汇的转换关系。另外,还提供了词汇语义相似度计算方法以及推理机制来对语义进行推理。  相似文献   

6.
论述了一个基于单词分级字典的计算机英文词汇测试系统的设计与实现,该系统可以利用英语单词之间的相关特性来生成词汇测试题,以辅助词汇测试和单词记忆。此设计方法还能够用于生成其它拼音语言的词汇测试系统  相似文献   

7.
《软件工程师》2019,(3):26-28
关系代数语言是用传统的集合运算和专门的关系运算来表达查询的抽象语言,提供了一系列的关系代数操作,通过这种数学运行来指导数据库在关系操作上的程序实现。场景教学系统中每一个场景对应一个实际应用,场景中设置了问题,本文以系统数据库为例,给出了基于关系代数运算的数据统计分析过程,采用抽取样本法计算期望学习时长和学习时长标准差,并设计了一个测算学习者投入度的公式,对评价场景教学具有指导意义。  相似文献   

8.
AS3AP是一个针对关系数据库的通用测试标准,它能够用来比较各种不同架构和不同负载容量的关系数据库的性能。根据AS3AP标准提出了数据库性能测试的设计方案,并在此基础上将其实现。通过对数据库系统执行SQL语句效能的测试,以达到评价数据库对SQL语言的支持程度和运行效率的目的,同时也为各种不同数据库之间提供一个供比较的依据。  相似文献   

9.
胡华 《软件》1995,(3):61-64,F003
本文论述了一个基于单词分级字典的计算机英文词汇测试系统的设计与实现,该系统可以利用英语单词之间的相关特性来生成词汇测试题,以辅助词汇测试和单词的记忆。此外,本文讨论了设计方法还能够用于生成其它拼音语言的词汇测试系统。  相似文献   

10.
电子词典与词汇知识表达   总被引:3,自引:0,他引:3  
词汇知识的表达与取得是自然语言处理极须克服的问题,本论文提出一个初步的架构与常识的抽取机制。语言处理系统是以词为讯息处理单元,登录在词项下的讯息可以包括统计、语法、语义、常识等。语言分析系统利用〈词〉为引得取得输入语句中相关词汇的语法、语义、常识等信息,让语言处理系统有更好的聚焦能力,可以藉以解决分词歧义、结构的歧义。对于不易以人工整理取得的常识,本论文也提出计算机自动学习的策略,以渐进式的方式累积概念与概念之间的语义关系,来增进语言系统的分析能力。这个策略可行的几个关键技术,包括(1)未登录词判别及语法语义自动分类, (2)词义分析, (3)应用语法语义及常识的剖析系统。  相似文献   

11.
The purpose of our research is to consider how the paradigms of EuroWordNet and SIMPLE linguistic projects on the one hand and the OIL methodology on the other hand may affect each other. OIL (Ontology Inference Layer) aims at implementing the ``semantic' Web idea and is based on the notion of ontology, which is also employed in EuroWordNet and SIMPLE. In both latter projects the meanings of words are partially described by means of the finite sets of relations to other meanings of words, whereas in OIL the user is free to define the arbitrary relations of this kind.The relations considered in EuroWordNet and SIMPLE were defined on the basis of a careful observation of the large linguistic area, andt hey aim at reflecting the meaning as precisely as possible, therefore it seems useful to merge them with OIL. Moreover, the valuable feature of OIL is its formal language with precisely defined semantics. All things considered, we suggest how certain EuroWordNet and SIMPLE definitions may be expressed in OIL.  相似文献   

12.
该文吸收已有动词研究的相关成果,提出了动词语义词典开发的相关原则和研制思路,界定并描写了词典中所涉及的相关属性信息,并对词典的总体文件结构及其各个库的信息进行了描写和说明。最终开发了融合词汇语义和句法语义,涵盖词形、词性、释义、义类、义场、句法范畴信息、语义范畴信息、语义句模等多种信息参数的开放性的动词语义知识词典。该词典可以在歧义分化、词义关系考察、句法—语义接口、句模抽取等方面提供支持。  相似文献   

13.
This paper reevaluates some of the contributions of Montague grammar in view of the increasing importance of computational considerations in linguistic theory and the demand for linguistic theories that can provide support in the design of natural language systems. It also considers Montague grammar in relation to work on lexical semantics and semantic nets. In this perspective the techniques of Montague grammar for systematically linking syntactic form and a model-theoretic semantics emerge as the most significant feature of the theory, while a number of the specific semantic assumptions recede in importance. Yet, with different ways of thinking about the structure mapping between levels of linguistic form and interpretations (e.g., constraint systems), we can also implement this connection using different techniques from what Montague had at his disposal.  相似文献   

14.
A Semantic Network of English: The Mother of All WordNets   总被引:1,自引:0,他引:1  
We give a brief outline of the design and contents of the English lexical database WordNet, which serves as a model for similarly conceived wordnets in several European languages. WordNet is a semantic network, in which the meanings of nouns, verbs, adjectives, and adverbs are represented in terms of their links to other (groups of) words via conceptual-semantic and lexical relations. Each part of speech is treated differently reflecting different semantic properties. We briefly discuss polysemy in WordNet, and focus on the case of meaning extensions in the verb lexicon. Finally, we outline the potential uses of WordNet not only for applications in natural language processing, but also for research in stylistic analyses in conjunction with a semantic concordance.  相似文献   

15.
Abstract. Thesaurus is a collection of words classified according to some relatedness measures among them. In this paper, we lay the theoretical foundations of thesaurus construction through elementary meanings of words. The concept of elementary meanings has been advocated and utilized in compiling Webster's Collegiate Thesaurus. If each word is supplied with elementary meanings so that all its meanings are covered by them in a standard fashion, we can define various similarity measures for a given set of words. Here we take an axiomatic way to analyze semantic structure of word groups. Assuming an abstract semantic world, we deduce closed sets as generalized synonym sets. That is, we show that under certain natural axioms, we only need to consider closed sets as far as the semantics are concerned. We also show that the set of generalized synonyms described as a certain pair of closed sets has a lattice structure. In order to have a flexible thesaurus, we also analyze structure changes corresponding to three basic environmental changes: A new word-meaning relation is added, a new word or a new meaning is included with its word-meaning relations. Actually we give algorithms to have updated lattice structure from previous one for the three operations. Received: 5 May 1996 / 21 February 2000  相似文献   

16.
该文主要讨论名词的词义描写和研究问题。首先通过对几种主要的词汇语义学理论(包括结构主义语义学、生成主义语义学、概念语义学和自然语义元语言理论)进行介绍和评述,指出它们在对名词进行语义刻画方面存在缺陷和不足;然后,重点引入生成词库理论的物性结构的描写方式,阐明它与前几种理论的区别及其自身的特点;最后,在生成词库理论的基础上,展示物性结构知识在有关名词分析中的四个研究案例(词语缺省、隐喻义生成、供用句、中动句)和在自然语言处理中的可能应用。  相似文献   

17.
18.
19.
词向量能够以向量的形式表示词的意义,近来许多自然语言处理应用中已经融入词向量,将其作为额外特征或者直接输入以提升系统性能。然而,目前的词向量训练模型大多基于浅层的文本信息,没有充分挖掘深层的依存关系。词的词义体现在该词与其他词产生的关系中,而词语关系包含关联单位、关系类型和关系方向三个属性,因此,该文提出了一种新的基于神经网络的词向量训练模型,它具有三个顶层,分别对应关系的三个属性,更合理地利用词语关系对词向量进行训练,借助大规模未标记文本,利用依存关系和上下文关系来训练词向量。将训练得到的词向量在类比任务和蛋白质关系抽取任务上进行评价,以验证关系模型的有效性。实验表明,与skip-gram模型和CBOW模型相比,由关系模型训练得到的词向量能够更准确地表达词语的语义信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号