首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
复合名词分析一直是语言研究和自然语言信息处理中的一个重要问题,涉及未登录词的识别、自动释义以及词典编纂等。生成词库理论是目前较新的一种语义学理论,我们拟利用该理论对汉语复合名词进行语义信息标注,建立一个词库。该文首先介绍了这一词库的标注框架,然后通过对“纸”、“石”构成的复合词的对比分析,展示了这一词库在复合名词构词、语义研究中的应用。研究结果显示,物性角色、自然类和人造类是非常重要的语义信息,能揭示复合名词构词和语义的一些模式和规律。  相似文献   

2.
该文讨论如何构造合适的汉语语义描写体系并建设相应的语义知识库,从而为文本语义的计算机自动分析提供可靠的资源。文章提出的技术路线是 在生成词库论和论元结构理论的指导下,分别描写名词的物性结构和动词、形容词的论元结构(包括物性角色或论元角色集合及其句法配置格式集合),标定名词、动词和形容词的情感评价色彩,揭示相关名词、动词和形容词的物性角色和论元角色之间的关联和推导关系,从而形成比较完整的关于名词、动词和形容词的实体指称、概念关系和情感评价等多层面的语义知识。最后,还展示了这种多层面的语义知识在语义自动计算中的运用案例。  相似文献   

3.
“网球问题”指怎样把racquet(网球拍)、ball(网球)和net(球网)之类具有情境联想关系的词汇概念联系起来、发现它们之间的语义和推理关系。这是一个自然语言处理和相关的语言知识资源建设的世界性难题。该文以求解“网球问题”为目标,对目前比较主流的几种语言词汇和概念知识库系统(包括WordNet、VerbNet、FrameNet、ConceptNet等)进行检讨,指出它们在解决“网球问题”上还都存在一定的局限性,着重分析它们为什么不能解决“网球问题”。进而指出基于生成词库论的名词物性结构知识描写体系可以解决“网球问题”,主张用名词的物性结构知识和相关的句法组合知识来构建一种以名词(实体)为核心的词汇概念网络,以弥补上述几种知识库系统的不足,为自然语言处理提供一种可资参考的词汇概念知识库体系。  相似文献   

4.
该文以现代汉语(特别是网络搜索词)中的名名组合为主要研究对象,探索一种基于规则的汉语名名组合的自动释义方法。其研究步骤为: (1)利用《现代汉语语义词典》中名词的语义类别,来建立名名组合的语义类组合模式;(2)在“生成词库论”中物性角色思想的指导下,用名名组合中某个名词的施成角色或功能角色作为释义动词,来揭示这两个名词之间的语义关系;(3)以语义类组合模式为单位构建名名组合的释义模板,并汇集成名名搭配数据库;(4)利用《知网》资源,来获取具体名词的施成角色和功能角色,建立汉语名词知识库。在这两个数据库的基础上,我们初步实现了一个汉语名名组合的自动释义程序。  相似文献   

5.
该文基于生成词库理论中的物性结构和语义类框架,对现代汉语双音节隐喻式名名复合词进了语义信息标注。在此基础上,我们对这些复合词进行了定量与定性分析,即考察了复合词在隐喻过程中涉及的物性角色、探索语义类对隐喻涉及物性角色的影响、以及语素语义类与复合词整体语义类之间的相关性。研究结果显示: 形式角色是隐喻式名名复合词中最常涉及的物性角色;自然类在发生隐喻时较多涉及构成角色,而人造类则较多涉及功用角色。并且,构词语素的语义类对复合词整体的语义类具有一定的预测性。  相似文献   

6.
该研究以动词的语义聚合层次为核心,构建了含有四个语义层级的动词分类系统,依托生成词库理论、语义格框理论和构式语法理论,从事件结构、语义格框架、物性角色、句法格式四个角度来对动词的自身属性以及组合性等特征进行描述,从而构造出能够解释并深入描述动动之间、动名之间甚至是超常搭配用法的汉语动词资源馆Chinese Verb Library(CVL)。实验表明,该研究可以为句法分析、语义角色标注、尤其是揭示隐含的谓间关系提供新的支持。  相似文献   

7.
数据库语义学(Database Semantics)是德国爱尔兰根一纽伦堡大学Hausscr教授于20世纪90年代提出的面向计算机自然语言处理的程序化语义学理论。这一理论不同于以往任何以元语言为基础的语义分析方法,它将自然语言的理解与生成建构为角色(即听者和说者)转换的规则理论体系。该理论建构自然语言交流模型的两个核心基础是左结合语法((LA)和词库数据结构(word bank)。以古汉语为例介绍和分析这一理论,通过顺次应用LA语法的3个变体:LA-hear, LA-think和LA-speak说明DI3S理解和生成自然语言的过程。  相似文献   

8.
BFS-CTC汉语句义结构标注语料库   总被引:3,自引:0,他引:3  
句义结构分析是汉语语义分析中不可逾越的重要环节,为了满足汉语句义结构分析的需要,基于现代汉语语义学理论构建了一种层次化的汉语句义结构模型,定义了标注规范和标记形式,建设了一个汉语句义结构标注语料库BFS-CTC(Beijing Forest Studio-Chinese Tagged Corpus)。标注内容方面,基于句义结构模型的定义标注了句义结构句型层、描述层、对象层和细节层中所包含的各个要素及其组合关系,包括句义类型、谓词及其时态、语义格类型等信息,并且提供了词法和短语结构句法信息,便于词法、句法、句义的对照分析研究;语料库组织结构方面,该语料库包括四个部分,即原始句子库、词法标注库、句法标注库和句义结构标注库,可根据研究的需要,在词法、句法、句义结构标注的基础上进行深加工,在核心标注库的基础上添加更多具有针对性的扩展标注库,利用句子的唯一ID号进行识别和使用;语料来源和规模方面,语料全部来自新闻语料,经过人工收集、整理,合理覆盖了主谓句、非主谓句、把字句等六种主要句式类型,规模已达到10 000句。同其他语义标注库相比,BFS-CTC基于现代汉语语义学,提供了多层次的句义结构标注信息,兼容进行了词法和语法标注,各类标注既可以单独使用也可综合使用进行横向分析,可用于自然语言处理多方面的研究,进一步推动汉语语义分析的研究和发展。  相似文献   

9.
该文首先介绍了鲁东大学进行的语义构词研究,说明了“无向型名词”的所指;进一步运用物性结构理论,分析语素义转指的六种类型,并提出结合转喻、隐喻、转隐喻理论共同解释“无向型名词”词义构成的研究方法;根据两个语素义如何通过转喻或隐喻转化为词义,将无向型词语分为八类。根据物性结构理论,具体分析无向型词语的语素义体现了哪种物性角色,语素义与词义是什么关系,语素义是基于相关性发生转喻还是基于相似性发生隐喻。最后总结了语素义整合转化为词义的特点,八种类型中前项—后项转喻(包含整体转喻)、前项—后项隐喻(包含整体隐喻)数量最多,符合人类普遍认知规律。  相似文献   

10.
基于篇章理解的自动文摘研究   总被引:8,自引:1,他引:7  
本文在自然语言理解的基础上, 对自动文摘系统进行研究。研究在两级上进行, 一级是基于中心名词, 中心动词同其修饰成分间关系研究, 实现句子成分过滤, 完成句子主干提取。一级是上下文级, 基于篇章文体结构, 句子语义关联, 分别实现摘要基集产生算法, 摘要基集扩充算法及摘要集合生成算法。摘要基集的产生依赖于中心段, 中心句选取, 摘要基集扩充和摘要集合产生依赖于模糊语义距离的测试。  相似文献   

11.
汉语的语义分析研究   总被引:5,自引:1,他引:5       下载免费PDF全文
汉语缺乏形态特征,用法十分灵活。汉语的分析仅通过句法是远远不够的,必须借助语义知识。本文分析了当前几种汉英翻译软件存在的问题,强调汉语语义分析的重要性,介绍了几种语义学理论,提出了一种语义分析方法。  相似文献   

12.
该文用定量和定性分析相结合的方法,考察了现代汉语双音节形名复合词的物性修饰关系,发现形语素有选择地约束名语素的不同物性角色。当形语素修饰名语素的形式角色或构成角色时,语义解读时常需要补充名词;当形语素修饰名语素的施成角色、功用角色或规约化属性时,语义解读时常需要补充动词。形名复合词的语义建构是物性结构和概念整合共同作用的结果,当形语素激活的物性角色或物性值不止一个时,就会出现多义或歧义。
  相似文献   

13.
_(γω)理论是一种一阶数学理论,它融合γω演算与谓词演算于一体.本文运用_(γω)理论来描述面向对象编程体裁(00PP)中一种多重继承机制的语义,它象公理语义一样抓住了(语义)问题的本质._(γω)理论在这里起了公理语义学的作用.这种语义描述简明得象Prolog程序一样,并且可望得到多层次多体裁编程语言Lyusia的支持,变得可执行的,从而可用作验证程序正确性.  相似文献   

14.
《计算机工程》2017,(5):143-148
在Word2vec框架内,针对微博文本的特点,提出采用词向量或高维词库映射计算句向量的方法。以3种算法构造句向量,即采用Word2vec对微博文本进行扩展后以TF-IDF方法表示句向量;将句子中每个词的词向量相加形成句向量;构建高维词库,将句子中的每个词映射到高维词库形成句向量。对比3种训练句向量的方法,选出最适合微博领域的模型。实验结果表明,采用高维词库映射的方法对微博的句向量计算的效果最佳。  相似文献   

15.
汉语框架语义网(Chinese FrameNet,CFN)是一个以Fillmore的框架语义学为理论基础、以英文FrameNet为参照、以汉语语料事实为依据的供计算机使用的汉语词汇语义数据库。该文首先介绍了汉语框架语义网的构建基础——框架语义学以及英语的框架语义网工程,然后具体分析了汉语框架语义网的构建技术,并对基于汉语框架网的语义角色自动标注研究进行了介绍,25个框架的交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%,61.62%;最后,介绍了几个基于汉语框架语义网的研究课题的进展情况。  相似文献   

16.
提出一种摘要式浏览视频文件的可视化方法,将顺序视频转化成图像形式摘要,能够帮助读者快速有效地获得视频数据的结构信息.算法通过检测视频中每帧的尺度不变特征(SIFT),应用改进的词袋模型构建特征词库并统计词频,将整段视频映射为高维词库空间的一条曲线.通过多维尺度分析(MDS)方法对该曲线降维,生成反映视频语义信息的一条三维平滑曲线.实验结果表明,该曲线很好地体现视频中各帧之间的关联性和语义转折,可辅助读者快速理解视频情节结构.  相似文献   

17.
该文吸收已有动词研究的相关成果,提出了动词语义词典开发的相关原则和研制思路,界定并描写了词典中所涉及的相关属性信息,并对词典的总体文件结构及其各个库的信息进行了描写和说明。最终开发了融合词汇语义和句法语义,涵盖词形、词性、释义、义类、义场、句法范畴信息、语义范畴信息、语义句模等多种信息参数的开放性的动词语义知识词典。该词典可以在歧义分化、词义关系考察、句法—语义接口、句模抽取等方面提供支持。  相似文献   

18.
语义学的研究目前活跃在二个领域中,一个是代数语义学,另一个是并发程序设计语言的各种形式语义的定义,本文主要介绍并发程序设计语言形式语义的基础,尤其是幂域理论、指称语义、操作语义、以及并发类型理论问题的讨论。  相似文献   

19.
文中关注计算机语言的形式语义学,旨在建立一种命令式模糊程序语言的指称语义与最弱(线性)前置条件语义.首先,借助模糊逻辑中的三角模、三角余模、非、蕴含以及模糊关系的合成等成功地完成了这两种语义的建模.这种方法为形式语义学的研究提供了一个新的视角.其次,证明了该语言的一些重要性质并讨论了最弱前置条件语义与最弱线性前置条件语义之间的关系.最后,证明了指称语义与最弱(线性)前置条件语义之间的对偶,该对偶表明了这两种语义可以相互诱导.  相似文献   

20.
“现代汉语述补结构用法词典”是人工建立、用于描述述补结构相关信息的语言知识资源。经过人工对词条的收集、释义等编写工作,词典已形成一定规模。在此基础上,尝试借助计算机技术,依据事件语义学的理论,利用现有语言知识资源以及大规模语料数据,寻找述结式复合事件语义距离计算的方法,对述结式进行定量描写,以帮助扩大词典规模,同时有助于深化对特有语言现象--述补结构的认识。实验结果表明该方法具有较高的准确率和识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号