首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于文本聚类的自动文摘系统的研究与实现   总被引:3,自引:0,他引:3       下载免费PDF全文
针对当前自动文摘方法的不足,提出了基于文本聚类和自然语言理解的自动文摘实现方法。可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高。将文本聚类引入自动文摘中,不但使单文档的文摘质景得到提高,而且能够实现多文档的自动文摘,这是现有的自动文摘技术所没有涉及的。实现了面向“塑料”行业的基于文本聚类和自然语言理解的自动文摘系统TCAAS。  相似文献   

2.
自动文摘是指利用计算机自动对文本编制摘要,是自然语言理解的重要应用领域之一。限于相关领域的已有水平,现阶段的自动文摘系统多数是以词语频率作为依据,以词频高的词语作为文章的关键词语,得到的文摘往往与原文中心思想相差甚远,因此,需要对文章的语法、语义和语境进行分析。本文利用HowNet得到词语概念的方法,建立基于概念的自动文摘系统。  相似文献   

3.
文中总结了自动文摘的主要研究方法和策略并把方法分成了三大类:自动摘录、基于信息抽取的自动文摘和基于理解的自动文摘.自动摘录方法是从文章中抽取重要句子来形成文摘;基于信息抽取的文摘方法是用从文章中抽取的信息填充已经编好的框架,然后用模板将内容输出;基于理解的文摘方法是利用自然语言处理技术生成文摘.文中重点总结了单主题文章和多主题文章的自动摘录方法,在多种算法进行优缺点比较后提出了一种新的多主题划分方法.  相似文献   

4.
自动文摘技术及应用*   总被引:4,自引:0,他引:4  
综述了自动文摘技术的研究进展。面向自动文摘系统用户,介绍了自动文摘系统及其应用,分析了机械文摘和理解文摘各自的特点,展望了自动文摘技术今后的发展方向和趋势。  相似文献   

5.
传统自动文摘方法并没有在语义层面上处理问题,所以近年来涌现出基于语义的理解分析法。本文提出一种基于本体的自动文摘方法,该方法采用领域本体将词特征映射为概念特征,然后调整特征词和文本语句权值,最后提取出合适的句子组合成文摘。该方法在统计的基础上加入语义分析,从而能够更精确地得到文本的主要内容,更方便阅读。在对竹藤领域的文本进行自动文摘实验后证明,该方法相比于传统自动文摘方法在文摘内容的准确度上有了较大的提高。  相似文献   

6.
全信息理论在自动文摘系统中的应用   总被引:9,自引:1,他引:8  
该文介绍了全信息理论提出的背景及其主要内容,并将其应用到一种智能业务──自动文摘系统中,设计实现了一个基于理解的、面向神经网络学习算法领域的中文9动文摘系统 Ladies。该系统综合利用语法信息和语义信息来理解原文的句法和含义,并通过语用信息制导,对原文进行文摘信息的过滤、提取和生成高质量的文摘。实验结果证明,这一方法是行之有效的。  相似文献   

7.
本文了自动文摘系统的历史和现状,首先提出了自动文摘的两个历史阶段:机械文摘和理解文摘阶段,随后综合有介绍了两个阶段有代表性的几个系统,最后,谈到我国发展的情况,并指出信息革命到来的两个努力方向问题-增加系统的鲁棒性和扩大系统输入的非受限性。  相似文献   

8.
面向特定领域的理解型中文自动文摘系统   总被引:8,自引:0,他引:8  
自动文摘是计算机通信网提供智能业务的关键技术之一.介绍了一个面向特定领域-神经网络学习算法的理解型中文自动文摘系统.与其他文摘系统相比,该系统首次采用了基于全信息模型的自然语言理解理论,通过设计义块组配的方法避开了传统的语法语义分析系统所遇到的各种难题,并通过语用信息制导,将语句理解与文摘信息提取直接相连,大大提高了理解的效率和文摘生成的速度.测试结果表明该系统的整套方法是行之有效的.  相似文献   

9.
提出了一种基于特征信息提取的中文自动文摘方法。通过对文章中可能影响文摘句提取质量的若干特征进行分析,设计了一种基于特征信息提取的句子重要度计算方法,并依此来抽取文摘句以生成摘要。实验结果验证了该方法的有效性,是对中文自动文摘方法中利用文章特征信息来抽取文摘句的一种有益的尝试。  相似文献   

10.
1.引言 Internet的迅猛的发展,使人们能方便快捷地获取众多的信息和服务。但是,面对Internet上浩瀚纷繁的信息海洋,人们常常会陷入窘迫的境地:一方面收到太多的信息无从选择和消化,淹没在繁杂的信息中;另一方面是信息的迷失,人们难于找到真正所需的信息。因此,信息社会对能够有效浓缩文本信息的网络自动文摘有着迫切的要求。自动文摘是自然语言理解的一个重要分支,而且文摘的研究也由来已久。早在50年代末,Luhn就首次设计了一个自动文摘系统,引起了世人的极大注目。从那时起,先后涌现了许多著名的系统。所谓自动文摘系统是指这样的一种软件系统,它能将给定原文的中心内容,或所需要的内容自动抽取出来,并用同于或不同于原文的句子表示出来。  相似文献   

11.
基于实体名的文本自动综述研究   总被引:1,自引:0,他引:1  
自动文摘是自然语言处理的一个重要分支,在信息检索领域中有着重要的用途.文本自动综述是自动文摘在多文档上的推广。本文提出了基于实体名扩展的自动综述方法,这种方法认为综述中的实体名个数反映其中所蕴含信,S量的多少。我们用该方法实现针对事件的自动综述生成,并参加了2003年文本理解会议(Document Understanding Conference,DUC)进行统一评测,DUC反馈的评测结果显示这种方法是有效的。此外,本文还对文本理解会议的任务、评测方法和测试结果做了简单介绍。  相似文献   

12.
自动文摘是利用计算机自动地从文本或文本集合中提炼出能准确、全面地反映文本主要内容的精简、连贯的短文,以满足一般性的或特殊性的用户需求。首先对自动文摘的定义、作用和分类进行概述,然后给出一种基于关键词检索的自动文摘技术,接着提出基于自动文摘的论文抄袭检测方法,并对实验结果进行分析,最后总结全文并对后续工作加以简单介绍。  相似文献   

13.
自动文摘基集语句的提取与润色的数学模型*   总被引:1,自引:0,他引:1  
针对统计和理解相结合的自动文摘方法,提出了一种新的内容词、有效词和特征词的动态加权函数以及句子重要性的动态加权函数.鉴于基于统计的自动文摘结果常常出现语句间缺乏连贯性及信息冗余的问题,设计了句间语义距离测试函数,并通过大量实验确定语句间语义距离的上限和下限.上限用于控制语句间的逻辑联系,下限用于解决文摘结果信息冗余的问题.实验结果证明,该模型能有效地提取文章中的重点语句,且很好地解决了统计文摘语句不连冠的瓶颈问题.  相似文献   

14.
王俊丽  魏绍臣  管敏 《计算机科学》2015,42(12):1-7, 39
互联网技术的快速发展使得信息的采集和传播速度达到了空前的水平,海量的数据使得人们获取有价值的信息越发困难。自动文摘技术可以从海量的信息中提取出能代表原文重要内容且简洁精练的一段文字,高度压缩文档是解决信息超载问题的有效方法,因此自动文摘技术的研究引起人们越来越多的关注。目前诸如统计分析、机器学习技术以及语言学知识等在已有的自动文摘系统中都有所应用。对基于图排序算法的自动文摘的研究成果进行综述,首先阐述自动文摘以及图排序算法的基本知识,然后重点从图的构建、图排序、句子选择3个方面系统地介绍基于图排序算法的自动文摘的研究现状,最后在分析 已有自动文摘系统的基础上,探讨了基于图排序算法的自动文摘的未来发展方向。  相似文献   

15.
王开铸  张军 《电脑学习》1995,(5):1-2,29
本文对计算机自动文摘系统的理解和模型两个基本问题进行了深入的探讨。给出理解的三种方式定义,特别是可操作的层次理解定义有助于文摘系统的实现。给出了由源文本到摘要的9种形式模型,从理论上对复杂系统加以清晰地描述。  相似文献   

16.
尽管抽取式自动文摘方法是目前自动文摘领域的主流方法,并且取得了长足的进步,但抽取式自动文摘形成的摘要由于缺乏句子之间的合理指代或篇章结构,使得文摘缺乏连贯性而影响可读性。为提高自动摘要的可读性,该文尝试将篇章修辞结构信息应用于中文自动文摘。首先,基于汉语篇章修辞结构抽取摘要,然后使用基于LSTM的方法对文本连贯性进行建模,并使用该模型对文摘的连贯性做出评价。实验结果表明: 在摘要抽取方面,基于篇章修辞结构的自动文摘相比于传统的抽取方法具有更好的ROUGE评价值;在使用基于LSTM连贯性模型评价摘要连贯性方面,篇章结构信息在自动抽取文摘时可以很好地提炼出文章的主旨,同时使摘要具有更好的结果。  相似文献   

17.
基于局部主题关键句抽取的自动文摘方法   总被引:2,自引:1,他引:1       下载免费PDF全文
徐超  王萌  何婷婷  张勇 《计算机工程》2008,34(22):49-51
自动文摘是语言信息处理中的重要环节。该文提出一种基于局部主题关键句抽取的中文自动文摘方法。通过层次分割的方法对文档进行主题分割,从各个局部主题单元中抽取一定数量的句子作为文章的文摘句。通过事先对文档进行语义分析,有效地避免了数据冗余和容易忽略分布较小的主题等问题。实验结果表明了该方法的有效性。  相似文献   

18.
一种基于文章主题和内容的自动摘要方法   总被引:8,自引:0,他引:8  
文章介绍了一种新的使用自然语言处理技术的自动系统。通过融合基于内容的方法和基于主题的方法,将主题与内容相结合,生成具有良好连贯性和流畅性的。该方法首先对主题词进行分析,动态地处理具有抽象标题和具体标题的文档;然后采用词汇、语法、语义分析等自然语言处理技术,对文章的文本内容进行深入分析;再根据线性加权融合两种分析得到的结果,生成;最后采用指代消解技术使生成的更连贯流畅。与仅基于内容的自动文摘系统相比较,评测结果显示,该系统生成的质量有明显提高。  相似文献   

19.
文本聚类在自动文摘中的应用研究   总被引:1,自引:0,他引:1  
针对当前自动文摘方法的不足,提出了基于文本聚类的自动文摘实现方法。将文本聚类引入自动文摘中,能实现多文档的自动文摘。实现了面向“塑料”行业的基于文本聚类的自动文摘系统TCAAS,其单文档自动文摘的正确率和召回率在80%以上,多文档自动文摘的正确率和召回率在75%以上。实验表明该方法可行,对自动文摘系统的设计具有借鉴意义和深入研究的价值。  相似文献   

20.
针对当前自动文摘方法的不足,提出了基于文本聚类的自动文摘实现方法.可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高.将文本聚类引入自动文摘中,不但使单文档的文摘质量得到提高,而且能够实现多文档的自动文摘,这是现有的自动文摘技术所没有涉及的.实现了面向"塑料"行业的基于文本聚类的自动文摘系统TCAAS.实验表明该方法可行, 对自动文摘系统的设计具有借鉴意义和深入研究的价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号