首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 359 毫秒
1.
论维吾尔语SUBS+NP结构的形式化描述   总被引:1,自引:0,他引:1  
该文按照数理逻辑的方法从句法格式,论元及论元模式,动词和名词之间语义关系及逻辑表达式等四个方面对SUBS+NP结构进行初步的形式化描述为自然语言信息处理服务。结果表明维吾尔语SUBS+NP结构中动词与名词之间的多种语义关系决定动词可能选择的表达形式即“”型动名词形式和形动词形式,并且动词与名词之间的语义关系服从句法的编码,借助两种句法形式表现出不同的语义内容。  相似文献   

2.
该文用定量和定性分析相结合的方法,考察了现代汉语双音节形名复合词的物性修饰关系,发现形语素有选择地约束名语素的不同物性角色。当形语素修饰名语素的形式角色或构成角色时,语义解读时常需要补充名词;当形语素修饰名语素的施成角色、功用角色或规约化属性时,语义解读时常需要补充动词。形名复合词的语义建构是物性结构和概念整合共同作用的结果,当形语素激活的物性角色或物性值不止一个时,就会出现多义或歧义。
  相似文献   

3.
该文以现代汉语(特别是网络搜索词)中的名名组合为主要研究对象,探索一种基于规则的汉语名名组合的自动释义方法。其研究步骤为: (1)利用《现代汉语语义词典》中名词的语义类别,来建立名名组合的语义类组合模式;(2)在“生成词库论”中物性角色思想的指导下,用名名组合中某个名词的施成角色或功能角色作为释义动词,来揭示这两个名词之间的语义关系;(3)以语义类组合模式为单位构建名名组合的释义模板,并汇集成名名搭配数据库;(4)利用《知网》资源,来获取具体名词的施成角色和功能角色,建立汉语名词知识库。在这两个数据库的基础上,我们初步实现了一个汉语名名组合的自动释义程序。  相似文献   

4.
本文首先介绍WordNet、VerbNet、PropBank和FrameNet这几个主流语义资源的结构,并分析其各自的缺陷;然后,介绍怎样在不同的资源之间建立起映射关系(包括义项映射和框架映射),达到语义资源的统一和整合,形成词汇语义资源的连接和互补;最后,介绍面向自动推理的更加深层的语义关系的表示和标注的趋向从动词的论元结构走向句子的命题结构,不同动词和句子所表达的事件及其关系,不同词类范畴(动词和事件名词等)所表示的相关事件及其关系,指代词、空语类跟有关表示事件的先行语之间的回指关系。  相似文献   

5.
本文以文献[2 ]中信息抽取模型( InfoX) 的测试语料(职务变动文本) 为主要对象,具体说明怎样建立从动词的论元结构到相关的事件模板的匹配关系。首先根据职务变更动词的有关句法、语义特点,把它分成六个小类:任命、担任、免职、辞职、调遣、受命;然后,分别描写每一小类动词的论元结构,特别是它们所支配的论元角色及其句法配置方式。最后,建立动词的论元角色跟事件模板元素的匹配关系,并揭示动词对文本筛选和合并都有导向作用,说明发展由动词驱动的信息抽取方法的可行性。  相似文献   

6.
中文是一种话题结构的语言,其表达方式比较灵活,但句法结构不如英文严谨,导致了事件中论元与触发词的关系较松散。现有的论元抽取方法多数是基于浅层语义的句法结构特征,从而造成了论元抽取性能低下。为了解决这个问题,提出了基于语义的中文事件论元抽取方法。该方法利用角色、实体和触发词的语义,弥补了论元抽取中单纯采用句法特征的缺陷。在ACE2005中文语料上的测试结果表明,该方法与基准系统相比具有更高的性能。  相似文献   

7.
为实现谓语动词对论元的自动选择,提出基于最小描述长度(MDL)和潜在语义聚类(LSC)的语义优选方法。基于MDL原则计算与动词搭配的名词的 值,根据LSC模型的EM算法求取动、名词的搭配概率P(v,n),并针对每一对动、名词计算 和P(v,n)之和,将其作为衡量两者语义关联度的标准。实验结果表明,该方法的F1值达到85.26%,优于单独使用MDL或LSC方法。  相似文献   

8.
在基于依存的语义角色标注研究中,大多数系统采用机器学习方法进行论元识别和分类。该文分析了依存树的特点,发现论元集中分布于依存树上的特定局部范围内,因此提出一种基于依存树距离的论元识别方法。该方法将候选论元限制在与目标动词的依存树距离不超过3 的范围内,通过制订规则,提取目标动词的最佳候选论元集合。在CoNLL2009中文语料上采用正确的依存树,识别出了98.5%的论元。在此基础上,结合基于机器学习的角色分类,系统F值达到89.46%,比前人的方法 (81.68%)有了较为显著的提升。  相似文献   

9.
该文吸收已有动词研究的相关成果,提出了动词语义词典开发的相关原则和研制思路,界定并描写了词典中所涉及的相关属性信息,并对词典的总体文件结构及其各个库的信息进行了描写和说明。最终开发了融合词汇语义和句法语义,涵盖词形、词性、释义、义类、义场、句法范畴信息、语义范畴信息、语义句模等多种信息参数的开放性的动词语义知识词典。该词典可以在歧义分化、词义关系考察、句法—语义接口、句模抽取等方面提供支持。  相似文献   

10.
与印欧语言不同,汉语的句子往往是由多个分句组成的复句。但目前的中文语义角色的标注语料和标注系统并没有对现代汉语的这个特点给予充分的重视。由于数据稀疏的问题,对于与动词跨分句的论元还没有一个有效的识别方法,直接影响了汉语真实文本语义角色标注的研究。运用统计和规则结合的方法,对与动词跨分句的论元进行识别。先用一条基本的规则识别出大部分的动词的论元,再找到规则识别的薄弱点,运用统计决策树融合多种特征构造模型,以进一步提高识别的准确率。实验结果表明,对于与动词的跨分句的论元,仅仅规则识别的F值就达到了65.3%,使用决策树后,F值提高到67.2%。  相似文献   

11.
该文首先介绍了鲁东大学进行的语义构词研究,说明了“无向型名词”的所指;进一步运用物性结构理论,分析语素义转指的六种类型,并提出结合转喻、隐喻、转隐喻理论共同解释“无向型名词”词义构成的研究方法;根据两个语素义如何通过转喻或隐喻转化为词义,将无向型词语分为八类。根据物性结构理论,具体分析无向型词语的语素义体现了哪种物性角色,语素义与词义是什么关系,语素义是基于相关性发生转喻还是基于相似性发生隐喻。最后总结了语素义整合转化为词义的特点,八种类型中前项—后项转喻(包含整体转喻)、前项—后项隐喻(包含整体隐喻)数量最多,符合人类普遍认知规律。  相似文献   

12.
A Semantic Network of English: The Mother of All WordNets   总被引:1,自引:0,他引:1  
We give a brief outline of the design and contents of the English lexical database WordNet, which serves as a model for similarly conceived wordnets in several European languages. WordNet is a semantic network, in which the meanings of nouns, verbs, adjectives, and adverbs are represented in terms of their links to other (groups of) words via conceptual-semantic and lexical relations. Each part of speech is treated differently reflecting different semantic properties. We briefly discuss polysemy in WordNet, and focus on the case of meaning extensions in the verb lexicon. Finally, we outline the potential uses of WordNet not only for applications in natural language processing, but also for research in stylistic analyses in conjunction with a semantic concordance.  相似文献   

13.
动词语义角色一直是国内外语言学界研究的重点和难点。在自然语言处理领域,相关的语言资源也在逐步构建。对于汉语而言,国内大部分工作集中在语义角色标注上。该文创造性地提出了一种三元搭配的动词语义角色知识表征形式,并在前人研究的基础上,提出了一套语义角色分类体系。在该体系指导下,对汉语动词进行了穷尽式的语义角色认定及相关知识加工,以构建汉语动词语义角色知识库。截至目前,该工程考察了5 260个动词,加工了语义角色及引导词的动词数量为2 685个,加工认定语义角色4 307个。  相似文献   

14.
Emotion classification is used in many commercial applications and research applications. The semantic classification models (or sentiment classification methods) are based on the vocabulary of the emotion dictionary being studied and being used very much to this day. In this study, a Vietnamese sentiment dictionary includes Vietnamese terms (Vietnamese nouns, Vietnamese verbs, Vietnamese adjectives, etc.) which the valences (and polarities) are calculated by using Ochiai measure through Google search engine and many Vietnamese adjective phrases which the valences (and polarities) are identified based on Vietnamese language characteristics. The Vietnamese adjectives often bear emotion which values (or semantic scores) are not fixed and are changed when they appear in different contexts of these phrases. Therefore, if the Vietnamese adjectives bring sentiment and their semantic values (or their sentiment scores) are not changed in any context, then the results of the emotion classification are not high accuracy. We propose many rules based on Vietnamese language characteristics to determine the emotional values of the Vietnamese adjective phrases bearing sentiment in specific contexts. Our Vietnamese sentiment adjective dictionary is widely used in applications and researches of the Vietnamese semantic classification.  相似文献   

15.
该文基于生成词库理论中的物性结构和语义类框架,对现代汉语双音节隐喻式名名复合词进了语义信息标注。在此基础上,我们对这些复合词进行了定量与定性分析,即考察了复合词在隐喻过程中涉及的物性角色、探索语义类对隐喻涉及物性角色的影响、以及语素语义类与复合词整体语义类之间的相关性。研究结果显示: 形式角色是隐喻式名名复合词中最常涉及的物性角色;自然类在发生隐喻时较多涉及构成角色,而人造类则较多涉及功用角色。并且,构词语素的语义类对复合词整体的语义类具有一定的预测性。  相似文献   

16.
该文主要讨论名词的词义描写和研究问题。首先通过对几种主要的词汇语义学理论(包括结构主义语义学、生成主义语义学、概念语义学和自然语义元语言理论)进行介绍和评述,指出它们在对名词进行语义刻画方面存在缺陷和不足;然后,重点引入生成词库理论的物性结构的描写方式,阐明它与前几种理论的区别及其自身的特点;最后,在生成词库理论的基础上,展示物性结构知识在有关名词分析中的四个研究案例(词语缺省、隐喻义生成、供用句、中动句)和在自然语言处理中的可能应用。  相似文献   

17.
An algorithm for semantic interpretation that integrates the determination of the meaning of verbs, the attachment and meaning of prepositions, and the determination of thematic roles is presented. The parser does not resolve structural ambiguity, which is solely the task of the semantic interpreter. Lexical semantic information about nouns and verbs is applied to the resolution of verb polysemy and modifier attachment. Semantic interpretation is centered on the representation of the meaning of the verb, called verbal concept. Verbal concepts are organized into a classification hierarchy. As long as the meaning of the verb remains unknown, parsing proceeds on a syntactic basis. Once the meaning of the verb is recognized, the semantic component makes sense of the syntactic relations built so far by the parser and of those still to be parsed. The algorithm has been implemented and tested on real–world texts.  相似文献   

18.
汉语复合名词短语因其使用范围广泛、结构独特、内部语义复杂的特点,一直是语言学分析和中文信息处理领域的重要研究对象。国内关于复合名词短语的语言资源极其匮乏,且现有知识库只研究名名复合形式的短语,包含动词的复合名词短语的知识库构建仍处于空白阶段,同时现有的复合名词短语知识库大部分脱离了语境,没有句子级别的信息。针对这一现状,该文从多个领域搜集语料,建立了一套新的语义关系体系,标注构建了一个具有相当规模的带有句子信息的基本复合名词语义关系知识库。该库的标注重点是标注句子中基本复合名词短语的边界以及短语内部成分之间的语义关系,总共收录27 007条句子。该文对标注后的知识库做了详细的计量统计分析。最后基于标注得到的知识库,使用基线模型对基本复合名词短语进行了自动定界和语义分类实验,并对实验结果和未来可能的改进方向做了总结分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号