首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
信息抽取研究综述   总被引:89,自引:8,他引:89  
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹———通过系统化、大规模的定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。  相似文献   

2.
自然语言文本中存在大量否定和不确定表述,识别这些信息并将其与确定性内容分离,对自然语言处理的下游应用,如信息抽取、信息检索、情感分析等,都具有十分重要的意义.与英语相比,面向汉语的否定与不确定覆盖域检测研究目前较为匮乏.提出了一个基于双向长短期记忆(bidirectional long short-term memory, BiLSTM)网络和条件随机场(conditional random fields, CRF)的融合模型,将覆盖域检测任务作为序列标注问题,针对给定的否定或不确定关键词,识别其在句子中的语义作用范围.该模型既具有LSTM(long short-term memory)网络能够利用前向与后向上下文信息的特性,同时又能够借助CRF 层获取输出标签之间的依赖关系,这得益于该框架能够有效地对序列信息及长距离上下文依赖信息进行编码的优势.在CNeSp语料集上的实验结果验证了模型的有效性,其中,在金融新闻子数据集上,否定与不确定覆盖域检测准确率分别达到79.16%和76.79%,比目前基于传统机器学习的汉语覆盖域检测方法分别提升了25.06%和34.46%.  相似文献   

3.
开放信息抽取(open information extraction,OpenIE)旨在从自然语言文本中以关系短语及参数的形式生成信息的结构化表示,为知识库自动化构建、开放域问答和显式推理等下游任务提供基础支持。近年来,该领域的研究与应用不断深入,涌现了众多卓有成效的OpenIE研究思路和拓展模型。从OpenIE的定义、数据集和基准度量出发,详细深入地综述和比较了传统的OpenIE模型和基于神经网络的模型。针对传统方法,分类介绍了基于学习的模型和基于规则的模型,并深入研究了不同模型的评估方法,分析了不同类别模型之间的差异。针对基于神经网络的模型,根据抽取谓词的不同方式,将其分为联合抽取和分步抽取两种类型,并对每种模型进行了综述和对比分析。对OpenIE常用的数据集以及主要的评估基准进行了概述,并在此基础上进行了对比分析。从训练、改进以及应用三个角度对OpenIE的工作进行了总结,并对该工作的未来进行了展望。  相似文献   

4.
钱忠  李培峰  周国栋  朱巧明 《软件学报》2018,29(8):2427-2447
不确定和否定信息抽取是自然语言处理领域中的重要任务和研究热点.针对不确定和否定作用范围识别任务,本文提出了一种基于两层双向LSTM神经网络的作用范围识别方法.首先,对于从线索词到达词语的句法路径,本文使用第一层双向LSTM神经网络从中学习到有用特征.接着,本文将词法特征与句法路径特征一起组成当前词语的特征表示.最后,本文将作用范围识别问题看作序列标注任务,利用第二层双向LSTM神经网络界定当前线索词的作用范围.实验结果表明,本文提出的模型优于其它神经网络模型,并在BioScope生物医学语料上取得了良好性能.其中,在Abstracts子语料上的不确定和否定作用范围识别精确率分别达到86.20%和80.28%.  相似文献   

5.
关于不完全,不确定信息推理的基础探讨   总被引:1,自引:0,他引:1  
贲可荣  王戟 《计算机杂志》1993,21(3):1-6,20
  相似文献   

6.
自然语言中否定是一个普遍且复杂的现象,其能反转命题的真值、情感及态度的极性、观点的立场等。否定信息识别不仅在信息检索、情感分析、文本挖掘、信息抽取等领域中具有重要意义,也对文本的深层语义理解具有促进作用。对否定信息识别研究进行了深入分析,介绍了否定信息识别的任务框架,并对否定触发词检测、否定覆盖域界定、否定焦点识别三个子任务的解决思路及方法进行了详细阐述,最后总结并指出了否定信息识别研究中存在的问题及新方向。  相似文献   

7.
考虑不确定信息的QoS路由算法综述   总被引:2,自引:0,他引:2  
传统的QoS(服务质量)路由都假设网络结点的状态信息可以被准确地获知,但实际网络存在许多因素使得状态信息不确定,因此,近几年,考虑不确定信息的QoS路由算法得到了广泛深入的研究。文章讨论了网络状态的不确定信息产生的原因,分析并总结了目前考虑不确定信息的QoS单播和QoS多播路由算法,最后指出了该领域中需要进一步研究的热点问题。  相似文献   

8.
生物医学领域中的文本信息抽取技术与系统综述   总被引:3,自引:0,他引:3  
介绍了近年来的信息抽取技术的发展,着重介绍了目前在生物医学领域内的各类信息抽取系统,并展望了今后的发展方向。  相似文献   

9.
10.
王红卫  刘典  赵鹏  祁超  陈曦 《自动化学报》2016,42(5):655-667
层次任务网络(Hierarchical task network, HTN)规划作为一项重要的智能规划技术被广泛应用于实际规划问题中, 传统的HTN规划无法处理不确定规划问题.然而, 现实世界不可避免地存在无法确定或无法预测的信息, 这使许多学者开始关注不确定规划问题, 不确定HTN规划研究也成为HTN规划研究的前沿.本文从HTN规划过程出发分析了不确定HTN规划问题中涉及的三类不确定, 即状态不确定、动作效果不确定和任务分解不确定; 总结了系统状态、动作效果和任务分解等不确定需要扩展确定性HTN规划模型的工作, 以此对现有不确定HTN规划的研究工作加以梳理和归类; 最后,对不确定HTN规划研究中仍需要解决的问题和未来的研究方向作了进一步展望.  相似文献   

11.
基于多重启发式规则的中文文本特征值提取方法   总被引:2,自引:0,他引:2       下载免费PDF全文
本文根据中文文本的特点,以一种新的同义概念来替代传统的词为单位,并给出了同义概念之间权值的全新计算方法。我们不仅考虑了文本中词汇概率信息,还结合文本语义等多方面来提取文本特征值,从而提出了一种基于多重启发式规则的中文文本特征值提取方法,并给出了特征值提取模型和算法。通过与传统特征值提取方法的比较实验,证证明本文中提出的特征值提取方法能有效地提高文本分类正确率,并达到了有效降低特征向量维数的目的。  相似文献   

12.
目前,信息抽取研究主要面向肯定性信息,而自然语言文本中包含了大量否定性和不确定性信息,为了将此类信息与肯定性信息区分开,有必要针对否定性与不确定性信息抽取进行深入研究.针对这一任务,首次构建了一个16 841句的汉语语料资源,利用序列标注模型与卷积树核模型,系统地探索了各种序列化依存特征和结构化句法树特征的有效性,并提出了元决策树模型,对二者进行融合.实验结果显示,该方法在否定性和不确定性信息抽取任务上的精确率分别达到69.84%和58.57%,为相关研究打下了坚实的基础.  相似文献   

13.
控制与数据投机优化技术的研究   总被引:1,自引:0,他引:1  
控制投机和数据投机是提高程序指令级并行度的有效方法.为了保证投机指令的正确执行,须解决两个问题,即延迟触发控制投机指令导致的异常和数据投机中的别名歧义.这需要硬件的支持才能做到,所以以前在这方面的研究大多是在模拟器上进行的,侧重于描述对模拟器结构的扩展.而IA-64是第一个同时支持这两种优化的体系结构.基于此,作者用一个统一的框架在IA-64开放源码研究编译器(ORC)中首次实现了控制与投机优化.该文以编译器为侧重点,介绍了投机优化中的几个核心问题及其解决方法,其中包括一种新的用来维护投机代码正确性的算法.实验结果表明这种方法是有效的.  相似文献   

14.
关键词提取在自然语言处理领域有着广泛的应用,如何准确、快速地从文本中获取关键词信息已经成为文本处理的关键性问题。现有的关键词提取方法很多,但是这些关键词提取方法的准确率和通用性有待提高。因此,提出了一种改进的TextRank关键词提取方法,该方法使用TF-IDF方法与平均信息熵方法计算文本中词语的重要性,然后根据计算结果得到词语的综合权重。利用词语的综合权重改进TextRank算法的节点初始值以及节点概率转移矩阵,通过迭代的方式计算各个节点的权重,直至收敛,从而得到词语的权重信息,选择top N个词语作为关键词输出,实现关键词的提取功能。实验结果表明,相较于传统的TF-IDF方法和TextRank方法,提出的改进后的TextRank关键词提取方法有更好的通用性,提取的关键词的准确率更高。  相似文献   

15.
16.
We present a learning method called Negative Explanation Based Generalization (NEBG) that performs automatic changes of representation by computing the negation of an already known concept. NEBG is similar to EBG as a deductive and valid learning method using a single example. It is based on new logic programming techniques based on example-guided transformation of the completed database. We also introduce a very powerful heuristic based on functional properties of the application domain. The implemented algorithms are described and several examples are given.  相似文献   

17.
NLTK是Python中用于自然语言处理的第三方模块,但处理中文文本具有一定局限性.利用NLTK对中文文本中的信息内容进行抽取与挖掘,采用同语境词提取、双连词搭配提取、概率统计以及篇章分析等方法,得到一个适用于中文文本的NLTK文本内容抽取框架,及其具体的实现方法.经实证分析表明,在抽取结果中可以找到反映文本特点的语料内容,得到抽取结果与文本主题具有较强相关性的结论.  相似文献   

18.
潘正华 《软件学报》2014,25(6):1255-1272
在模糊知识表示与推理中,否定信息扮演了一个重要角色.从概念层面上区分了模糊知识中存在的3 种否定关系,即矛盾否定关系、对立否定关系和中介否定关系.为了建立能够完全描述这些不同否定关系的逻辑基础,提出一种区分矛盾否定、对立否定和中介否定的模糊命题逻辑形式系统FLCOM.讨论了FLCOM 特有的性质与意义,给出了FLCOM 的一种语义解释,并证明了可靠性定理.为了表明FLCOM 处理实际问题的适用性,进一步研究了FLCOM在一个模糊决策实例中的应用.具体地,基于FLCOM讨论了决策规则中的模糊命题及其不同否定的区分与形式表示,给出一种确定模糊命题及其不同否定的真值及其真值范围阈值的方法,并采用模糊产生式规则讨论了实例中的模糊推理与决策.从而表明,运用FLCOM 处理具有模糊性并且存在不同否定的实际问题是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号