共查询到16条相似文献,搜索用时 53 毫秒
1.
自然语言篇章理解及基于理解的自动文摘研究 总被引:7,自引:4,他引:3
我们对文章结构进行了介析, 研究语言单位间的意义相关性, 基于这种相关性,提出意义分析方法, 并给出篇章的意义表示。最后, 分析了自动文摘研究现状, 介绍了我们在这方面的研究情况。 相似文献
2.
本系统从世界现象的组成和人类的记忆结构特点出发, 结合汉语的具体情况, 从意义分析的角度将汉语的词汇分为描述性的词、过程性的词、辅助性的词三类。这三类词分别描述了世界现象中的事实、事件以及语言本身所具有的特性。在此基础上形成了汉语的篇章理解所依赖的知识表示和知识组织形式, 即以事实一事件网络为基本结构的记忆模型通过这个模型建立了汉语篇章理解系统的知识库, 以及与之相应的加工和管理机制系统对汉语篇章的分析是以词为引导进行的。汉语的词直接对应于事实一事件网络中的节点和辅助词表中的词项这些节点和词项综合了语法的、语义的、语用的知识,并且能根据处理的需要及时地为分析过程提供预期本系统通过阅读, 对自己的知识库进行动态的自我管理。在阅读了有关七种鸟类的汉语故事之后, 系统能够学习到有关鸟类的一些新概念, 并能回答相应的问题。汉语篇章理解需要依赖各种知识。这些知识来自语法、语义和语用三个方面为了使计算机能够更好地处理汉语的篇章, 必须对各方面的知识进行合理的组织和管理。由于语言是人们用来描述世界现象, 传递信息的工具, 对于自然语言理解的研究工作有必要从意义分析的角度进行。意义分析就是找出语言是如何对世界现象进行模拟, 进而发现特定的言语活动所描述的有关世界现象特征及其相互关系的过程。本文从汉语的词与世界现象的对应关系出发, 就汉语理解系统的建造进行了初步尝试。 相似文献
3.
自然语言理解可以分为五个层次;单词、短评、句子、段落和篇章,每层次都与其它层次相关联,背景知识包含了所有层次的语言元素及其在实际环境中的使用,本文着重讨论了背景知识在汉语自动分词和基于语义关联的篇章理解。 相似文献
4.
篇章关系研究,旨在推断同一篇章内相邻或跨度在一定范围内的文本片段之间的语义连接关系。语义连接关系对篇章内容理解和结构分析都具有重要作用,成为目前篇章分析领域的重点研究内容。该文针对三个中英文篇章关系研究领域的语料库: 基于修辞结构理论的篇章树库(Rhetorical Structure Theory Discourse Treebank,RSTDT)、宾州篇章树库(Penn Discourse Treebank,PDTB)和哈尔滨工业大学中文篇章关系语料库(HIT Chinese Discourse Treebank,HIT-CDTB),主要介绍篇章关系分析理论的语料资源与研究背景、标注与评测体系以及国内外研究现状。此外,总结相关工作,指出目前篇章关系,尤其是隐式篇章关系研究的主要难题。 相似文献
5.
6.
7.
汉语篇章修辞结构标注项目CJPL采用大陆主要媒体的财经评论文章为语料,依据修辞结构理论(Rhetorical Structure Theory,RST),定义了以标点符号为边界的篇章修辞分析基本单元和47种区分核心性单元的汉语修辞关系集,并草拟了近60页的篇章结构标注工作守则。这一工作目前完成了对97篇财经评论文章的修辞结构标注,在较大规模数据的基础上检验了修辞结构理论及其形式化方法在汉语篇章分析中的可移用性。树库所带有的修辞关系信息以及三类篇章提示标记的篇章用法特征,可以为篇章层级的中文信息处理提供一些浅层语言形式标记的数据。 相似文献
8.
基于篇章理解的自动文摘研究 总被引:8,自引:1,他引:7
本文在自然语言理解的基础上, 对自动文摘系统进行研究。研究在两级上进行, 一级是基于中心名词, 中心动词同其修饰成分间关系研究, 实现句子成分过滤, 完成句子主干提取。一级是上下文级, 基于篇章文体结构, 句子语义关联, 分别实现摘要基集产生算法, 摘要基集扩充算法及摘要集合生成算法。摘要基集的产生依赖于中心段, 中心句选取, 摘要基集扩充和摘要集合产生依赖于模糊语义距离的测试。 相似文献
9.
汉语机器理解研究现状及展望 总被引:4,自引:0,他引:4
分析了汉语不利于机器理解的几个特点,简要回顾了我国汉语机器理解研究的历史和取得的成果,指出了目前治语机器理解研究所面临的困难,并对研究前景作了展望。 相似文献
10.
11.
汉语语篇理解中元指代消解初步 总被引:5,自引:1,他引:5
指代消解是语篇机器理解中的重要一环.研究发现,由于表示语篇本身某一部分而非语篇内容的元指代现象普遍存在,语篇元指代消解也就成为困扰着语篇机器理解实现的困难之一.对语篇中的元指代现象进行了分析,提出句焦点的概念,并在句焦点集的基础上,用优先和过滤算法实现了元指代的消解.在使用自然语料的实验中表明,句焦点集的作用对于元指代机器消解有重要作用.它丰富了语篇分析和表述理论,对汉语语篇分析理解中寻找元指代关系,从而完成连贯语篇意义具有重要意义. 相似文献
12.
13.
14.
篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型的研究.针对上述问题,首先研究了汉语篇章话题结构的理论表示体系.分析了主述位理论、英语修辞结构理论和宾州篇章树库体系的优势,结合汉语复句句群理论以及汉语自身特点,提出了一种基于主述位理论的汉语篇章微观话题结构表示方式,并借助微观话题链构建了汉语篇章话题结构表示体系.随后,在此基础上,采用自顶向下、后向搜索的标注策略和人机结合的语料库标注方式,构建了基于篇章微观话题表示体系的汉语篇章话题结构语料库(Chinese discourse topic corpus, CDTC).CDTC共包含500个文档,对其进行了详细统计分析并展示了语料库的标注情况.与宾州篇章树库体系、广义话题结构理论的对比表明,所提篇章微观话题结构表示体系在理论上具有一定的优越性,并且符合汉语特点;一致性检验表明CDTC能够充分体现汉语篇章话题分析问题本身的难度,并能够为相关研究提供语料资源支持. 相似文献
15.
研究汉语语篇特性时,省略是其一个重点。简要阐述了汉语省略的基本概念,介绍了通过三个平面理论进行的基于领域的省略恢复研究。提出了实现自然语言的真实理解的目标,分析探讨了它所面临的主要困难。提出了基于规则推理的知识库系统构建方案,同时在知识获取这一瓶颈问题中引入自然语言理解技术来进行专家经验性知识的自动获取。构建的省略恢复模型已被运用在领域自然语言理解中,结果表明其在汉语正式体省略恢复中具有一定优越性。 相似文献
16.
黄培红 《计算机工程与科学》2007,29(6):113-116
自然语言理解是人工智能研究中的热点和难点之一。基于现有的相关理论,本文提出自然语言理解的形式化定义,以及改进相关的公理系统,从而统一“意思理解”和“道理理解”等两种理解类型。通过设计、开发和运行“篇章理解原型程序”,验证理论成果的正确性和有效性。 相似文献