首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 53 毫秒
1.
自然语言篇章理解及基于理解的自动文摘研究   总被引:7,自引:4,他引:3  
我们对文章结构进行了介析, 研究语言单位间的意义相关性, 基于这种相关性,提出意义分析方法, 并给出篇章的意义表示。最后, 分析了自动文摘研究现状, 介绍了我们在这方面的研究情况。  相似文献   

2.
本系统从世界现象的组成和人类的记忆结构特点出发, 结合汉语的具体情况, 从意义分析的角度将汉语的词汇分为描述性的词、过程性的词、辅助性的词三类。这三类词分别描述了世界现象中的事实、事件以及语言本身所具有的特性。在此基础上形成了汉语的篇章理解所依赖的知识表示和知识组织形式, 即以事实一事件网络为基本结构的记忆模型通过这个模型建立了汉语篇章理解系统的知识库, 以及与之相应的加工和管理机制系统对汉语篇章的分析是以词为引导进行的。汉语的词直接对应于事实一事件网络中的节点和辅助词表中的词项这些节点和词项综合了语法的、语义的、语用的知识,并且能根据处理的需要及时地为分析过程提供预期本系统通过阅读, 对自己的知识库进行动态的自我管理。在阅读了有关七种鸟类的汉语故事之后, 系统能够学习到有关鸟类的一些新概念, 并能回答相应的问题。汉语篇章理解需要依赖各种知识。这些知识来自语法、语义和语用三个方面为了使计算机能够更好地处理汉语的篇章, 必须对各方面的知识进行合理的组织和管理。由于语言是人们用来描述世界现象, 传递信息的工具, 对于自然语言理解的研究工作有必要从意义分析的角度进行。意义分析就是找出语言是如何对世界现象进行模拟, 进而发现特定的言语活动所描述的有关世界现象特征及其相互关系的过程。本文从汉语的词与世界现象的对应关系出发, 就汉语理解系统的建造进行了初步尝试。  相似文献   

3.
自然语言理解可以分为五个层次;单词、短评、句子、段落和篇章,每层次都与其它层次相关联,背景知识包含了所有层次的语言元素及其在实际环境中的使用,本文着重讨论了背景知识在汉语自动分词和基于语义关联的篇章理解。  相似文献   

4.
篇章关系研究,旨在推断同一篇章内相邻或跨度在一定范围内的文本片段之间的语义连接关系。语义连接关系对篇章内容理解和结构分析都具有重要作用,成为目前篇章分析领域的重点研究内容。该文针对三个中英文篇章关系研究领域的语料库: 基于修辞结构理论的篇章树库(Rhetorical Structure Theory Discourse Treebank,RSTDT)、宾州篇章树库(Penn Discourse Treebank,PDTB)和哈尔滨工业大学中文篇章关系语料库(HIT Chinese Discourse Treebank,HIT-CDTB),主要介绍篇章关系分析理论的语料资源与研究背景、标注与评测体系以及国内外研究现状。此外,总结相关工作,指出目前篇章关系,尤其是隐式篇章关系研究的主要难题。  相似文献   

5.
篇章结构分析旨在理解文章的整体结构及其各部分之间的语义联系.作为自然语言处理的研究热点,近年来篇章结构分析研究发展迅速.首先总结英语和汉语中篇章结构分析理论,然后介绍相关篇章语料库及其计算模型的研究.在此基础上,梳理了当前英语、汉语中篇章结构分析的相关工作脉络,构建了篇章结构分析研究框架,归纳总结出当前研究的趋势和热点.然后,简要介绍篇章结构在下游任务中的应用.最后,指出当前汉语篇章结构分析存在的问题与挑战,为今后的研究提供指导和帮助.  相似文献   

6.
基于情境理论的汉语理解模型   总被引:3,自引:0,他引:3  
  相似文献   

7.
汉语篇章修辞结构标注项目CJPL采用大陆主要媒体的财经评论文章为语料,依据修辞结构理论(Rhetorical Structure Theory,RST),定义了以标点符号为边界的篇章修辞分析基本单元和47种区分核心性单元的汉语修辞关系集,并草拟了近60页的篇章结构标注工作守则。这一工作目前完成了对97篇财经评论文章的修辞结构标注,在较大规模数据的基础上检验了修辞结构理论及其形式化方法在汉语篇章分析中的可移用性。树库所带有的修辞关系信息以及三类篇章提示标记的篇章用法特征,可以为篇章层级的中文信息处理提供一些浅层语言形式标记的数据。  相似文献   

8.
基于篇章理解的自动文摘研究   总被引:8,自引:1,他引:7  
本文在自然语言理解的基础上, 对自动文摘系统进行研究。研究在两级上进行, 一级是基于中心名词, 中心动词同其修饰成分间关系研究, 实现句子成分过滤, 完成句子主干提取。一级是上下文级, 基于篇章文体结构, 句子语义关联, 分别实现摘要基集产生算法, 摘要基集扩充算法及摘要集合生成算法。摘要基集的产生依赖于中心段, 中心句选取, 摘要基集扩充和摘要集合产生依赖于模糊语义距离的测试。  相似文献   

9.
汉语机器理解研究现状及展望   总被引:4,自引:0,他引:4  
分析了汉语不利于机器理解的几个特点,简要回顾了我国汉语机器理解研究的历史和取得的成果,指出了目前治语机器理解研究所面临的困难,并对研究前景作了展望。  相似文献   

10.
根据自然语言理解中在一定领域内篇章理解的特点,基于知识和内涵,分析了对时间名词理解的实现方法和难点,目的是对整个篇章的理解提供很好的支持。给出了篇章理解的总体流程,在此基础上讨论了时间语义理解在整个篇章理解的重要性和时间名词的语义和分类,并建立了时间名词的结构模型和理解流程;对时间名词内涵的理解方法做了介绍;结合Rough理论,提出了一种判断时间名词模糊相等的方法。  相似文献   

11.
汉语语篇理解中元指代消解初步   总被引:5,自引:1,他引:5  
张威  周昌乐 《软件学报》2002,13(4):732-738
指代消解是语篇机器理解中的重要一环.研究发现,由于表示语篇本身某一部分而非语篇内容的元指代现象普遍存在,语篇元指代消解也就成为困扰着语篇机器理解实现的困难之一.对语篇中的元指代现象进行了分析,提出句焦点的概念,并在句焦点集的基础上,用优先和过滤算法实现了元指代的消解.在使用自然语料的实验中表明,句焦点集的作用对于元指代机器消解有重要作用.它丰富了语篇分析和表述理论,对汉语语篇分析理解中寻找元指代关系,从而完成连贯语篇意义具有重要意义.  相似文献   

12.
篇章分析是自然语言处理领域研究的热点和重点。作为篇章分析的任务之一,篇章主次关系研究篇章的主要和次要内容,从而更好地理解和把握篇章的核心内容。该文重点研究宏观领域的中文篇章主次关系,提出了一种基于篇章主题的中文宏观篇章主次关系识别方法。该方法利用篇章单元间、篇章单元与篇章主题间的语义交互来识别主次关系,并有选择地应用篇章主题信息,有效提高了主次关系核心的识别。在中文宏观汉语篇章树库(MCDTB)上的实验结果显示,该方法优于目前性能最好的基准系统。  相似文献   

13.
该研究让20名被试对30篇汉语记叙文进行焦点标定,在焦点标定的基础上,结合文本标注和统计分析,对语篇修辞结构对焦点分布的影响进行了探讨。结果主要发现,记叙文语篇中有大约30%的小句没有获得焦点;核心性对焦点的分布有重要影响,大约80%的核心句中有焦点,而只有60%的辅助句中有焦点;最高层级的小句焦点数量相对较少;记叙文语篇主要由10种修辞关系构成,联合关系和阐述关系小句中焦点数量最多,归属关系小句中焦点数量最少。  相似文献   

14.
篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型的研究.针对上述问题,首先研究了汉语篇章话题结构的理论表示体系.分析了主述位理论、英语修辞结构理论和宾州篇章树库体系的优势,结合汉语复句句群理论以及汉语自身特点,提出了一种基于主述位理论的汉语篇章微观话题结构表示方式,并借助微观话题链构建了汉语篇章话题结构表示体系.随后,在此基础上,采用自顶向下、后向搜索的标注策略和人机结合的语料库标注方式,构建了基于篇章微观话题表示体系的汉语篇章话题结构语料库(Chinese discourse topic corpus, CDTC).CDTC共包含500个文档,对其进行了详细统计分析并展示了语料库的标注情况.与宾州篇章树库体系、广义话题结构理论的对比表明,所提篇章微观话题结构表示体系在理论上具有一定的优越性,并且符合汉语特点;一致性检验表明CDTC能够充分体现汉语篇章话题分析问题本身的难度,并能够为相关研究提供语料资源支持.  相似文献   

15.
研究汉语语篇特性时,省略是其一个重点。简要阐述了汉语省略的基本概念,介绍了通过三个平面理论进行的基于领域的省略恢复研究。提出了实现自然语言的真实理解的目标,分析探讨了它所面临的主要困难。提出了基于规则推理的知识库系统构建方案,同时在知识获取这一瓶颈问题中引入自然语言理解技术来进行专家经验性知识的自动获取。构建的省略恢复模型已被运用在领域自然语言理解中,结果表明其在汉语正式体省略恢复中具有一定优越性。  相似文献   

16.
自然语言理解的机器认知形式系统   总被引:1,自引:0,他引:1       下载免费PDF全文
自然语言理解是人工智能研究中的热点和难点之一。基于现有的相关理论,本文提出自然语言理解的形式化定义,以及改进相关的公理系统,从而统一“意思理解”和“道理理解”等两种理解类型。通过设计、开发和运行“篇章理解原型程序”,验证理论成果的正确性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号