首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
基于种子自扩展的命名实体关系抽取方法   总被引:6,自引:0,他引:6       下载免费PDF全文
何婷婷  徐超  李晶  赵君喆 《计算机工程》2006,32(21):183-184,193
命名实体间关系的抽取是信息抽取中的一个重要研究问题,该文提出了一种从大量的文本集合中自动抽取命名实体间关系的方法,找出了所有出现在同一句子内、词语之间的距离在一定范围之内的命名实体对,把它们的上下文转化成向量。手工选取少量具有抽取关系的命名实体对,把它们作为初始关系的种子集合,通过自学习,关系种子集合不断扩展。通过计算命名实体对和关系种子之间的上下文相似度来得到所要抽取的命名实体对。通过扩展关系种子集合的方法,抽取的召回率和准确率都得到了提高。该方法在对《人民日报》语料库的测试中,取得了加权平均值F-Score为0.813的效果。  相似文献   

2.
基于正反例训练的SVM命名实体关系抽取   总被引:1,自引:0,他引:1  
刘路  李弼程  张先飞 《计算机应用》2008,28(6):1444-1446
根据中文命名实体关系抽取的特点,从中文的形态学、语法及语义等几个方面选取特征并构建特征向量,然后将符合特定实体关系模板的候选命名实体对抽取出来并分为正反例。利用正反例样本对支持向量机(SVM)抽取器进行训练,以此来判断候选命名实体对的关系类型。实验证明,本方法能够有效提高中文命名实体关系抽取的准确率。  相似文献   

3.
关系实体抽取旨在从非结构化文本中识别命名实体并抽取实体间语义关系,现有的两阶段关系实体抽取方法存在模型无法复用、调优参数量大等问题,不便于工程实现。利用提示调优对已有方法进行改进,提出两阶段模型复用的关系实体抽取方法REPT(a model-reused method of two-staged relations and entities extraction with prompt tuning)。首先微调预训练语言模型进行关系分类,而后利用提示调优并复用前一阶段微调的预训练语言模型抽取实体。实验结果表明,该方法在调优参数只占基线模型约50%的情况下,达到与SOTA模型相媲美的性能。  相似文献   

4.
莫倩  张传想 《计算机仿真》2012,29(11):51-54,169
针对Web社会网络数据的特点,将话题追踪技术应用到社会网络关系分析当中,能够快速、有效地发现和拓展社会网络关系。介绍了系统采用的话题追踪的方法,以及如何对话题进行跟踪并自动采集话题信息,然后介绍了抽取网络实体及实体间关系的方法。描述了基于话题的社会网络关系分析系统的框架、主要功能和关键技术,并用可视化工具NetDraw给出了网络关系可视化图形,最后还对应用的结果进行了分析。  相似文献   

5.
针对中文电子病历中命名实体识别和实体关系抽取研究方法中存在的问题,提出了一种基于双向长短时记忆网络(bidirectional long short term memory)与CRF(conditional random field)结合的实体识别和实体关系抽取方法。该方法首先使用词嵌入技术将文本转换为数值向量,作为神经网络BiLSTM的输入,再结合CRF链式结构进行序列标注,输出最大概率序列,并对识别结果知识图谱化。实验证明,该方法对中文电子病历进行实体识别和实体关系抽取时的准确率、召回率、◢F◣值有明显的提升。实验结果满足临床中系统应用需求,对帮助研究构建临床决策支持系统、个性化医疗推荐服务有引导作用。  相似文献   

6.
王志娟  李福现 《计算机科学》2017,44(Z6):14-18, 28
跨语言命名实体对于机器翻译、跨语言信息抽取都具有重要意义,从命名实体的音译、基于平行/可比语料库的跨语言命名实体对齐、基于网络挖掘的跨语言命名实体对翻译抽取3个方面对跨语言命名实体翻译对抽取的研究现状进行了总结。音译是跨语言命名实体翻译对抽取的重点内容之一,基于深度学习的音译模型将是今后的研究重点。目前,跨语言平行/可比语料库的获取和标注直接影响基于语料库的跨语言命名实体对齐的深入研究。基于信息检索和维基百科的跨语言命名实体翻译对抽取研究将是跨语言命名实体翻译对抽取研究的趋势。  相似文献   

7.
实体关系抽取是数据挖掘和信息检索的重要研究内容,抽取的目标是发现数据集中两个不同实体之间的语义关系;犯罪网络是个小型的社会,具有社会化网络的特征,因此本文采用社会化网络的方法来分析犯罪网络中人物之间的关系。本文首先定义实体、实体关系以及关系描述词等概念,并引入了关系模型,用关系树的方法抽取案情信息中的实体关系,在此基础上提出发掘犯罪网络核心人物的 算法,最后设计并实现了犯罪网络挖掘系统。通过实验验证和用户反馈,本系统能在很大程度上提高公安人员办案效率,具有很高的实用价值。  相似文献   

8.
命名实体识别、排歧和跨语言关联   总被引:5,自引:0,他引:5  
命名实体是文本中承载信息的重要语言单位,命名实体的识别和分析在网络信息抽取、网络内容管理和知识工程等领域都占有非常重要的地位。有关命名实体的研究任务包括实体识别、实体排歧、实体跨语言关联、实体属性抽取、实体关系检测等,该文重点介绍命名实体识别、排歧和跨语言关联等任务的研究现状,包括难点、评测、现有方法和技术水平,并对下一步需要重点解决的问题进行分析和讨论。该文认为,命名实体识别、排歧和跨语言关联目前的技术水平还远远不能满足大规模真实应用的需求,需要更加深入的研究。在研究方法上,要突破自然语言文本的限制,直接面向海量、冗余、异构、不规范、含有大量噪声的网页信息处理。  相似文献   

9.
王勇超 《计算机应用研究》2021,38(4):1004-1007,1021
针对现有实体和关系联合抽取方法中存在的实体与关系依赖建模不足、实体发生重叠难以抽取其所涉及的多个关系的问题,设计了基于深度学习的联合抽取框架。首先针对依赖建模不足问题,从预训练语料中提取实体共现特征,建模了实体间的潜在语义关系和实体与关系之间的依赖关系。其次提出了新颖的指针标注方法,该标注方法可以通过指针表示关系类别,由于任一实体可以被多个指针指向,所以可以在一段文本中标注重叠的实体并抽取多个实体—关系三元组结果。最后,为了有效利用单词的丰富语义和指针之间依赖的信息,设计了一个标签感知注意力机制,融合了包括来自编码层的字词信息、相关的共现语义信息。与研究中前沿的联合提取方法相比,该方法在百度DuIE测试集上实现了F1值的增加。通过实验结果表明指针标注方法在一定程度上可以解决实体重叠问题。  相似文献   

10.
闫俊英 《福建电脑》2013,(5):59-61,73
对信息抽取技术的概念、发展及信息抽取系统的体系结构进行介绍。信息抽取技术的核心任务是命名实体识别和实体关系抽取,总结现有的各种关系抽取方法,常用的关系抽取技术主要分为基于知识工程、基于机器学习和基于Ontology三大类方法,分别对三种方法进行介绍。  相似文献   

11.
基于双向语义的中文实体关系联合抽取方法   总被引:1,自引:0,他引:1  
禹克强  黄芳  吴琪  欧阳洋 《计算机工程》2023,49(1):92-99+112
现有中文实体关系抽取方法通常利用实体间的单向关系语义特征进行关系抽取,然而仅靠单向语义特征并不能完全利用实体间的语义关系,从而使得实体关系抽取的有效性受到影响。提出一种基于双向语义的中文实体关系联合抽取方法。利用RoBERTa预训练模型获取具有上下文信息的文本字向量表征,通过首尾指针标注识别句子中可能存在关系的实体。为了同时利用文本中的双向关系语义信息,将实体分别作为关系中的主体与客体来建立正负关系,并利用两组全连接神经网络构建正负关系映射器,从而对每一个输入实体同时从正关系与负关系的角度构建候选关系三元组。将候选关系三元组分别在正负关系下的概率分布序列与实体位置嵌入特征相结合,以对候选三元组进行判别,从而确定最终的关系三元组。在DuIE数据集上进行对比实验,结果表明,该方法的精确率与召回率优于MultiR、CoType等基线模型,其F1值达到0.805,相较基线模型平均提高了12.8%。  相似文献   

12.
在知识互联的大数据环境下,初步构建的领域知识图谱可展示该领域知识的结构化信息,但实体之间隐含的潜在关系并未在图谱中得到充分表达。为解决领域知识图谱实体关系丰富和扩展问题,提出一种基于实体间关联规则分析与主题分析的关系发现方法。应用与领域实体相关的数据,通过实体间关联规则分析与实体相关数据集间主题分布相似度分析获取领域实体间潜在关系,将新发现的关系融合到初步构建的知识图谱中,实现领域知识图谱的潜在关系扩展。实验结果表明,该方法能够发现部门实体间的共性,挖掘出隐藏在领域实体间的关系,可有效地应用于领域实体间关系发现,丰富领域知识图谱。  相似文献   

13.
社会网络中的信息扩散是目前国际上关注的研究方向,而破产传染作为社会金融中一类特殊而又重要的传播现象,也是当前社会经济领域非常关心的问题.然而,已有的金融传播研究中通常只基于单层的交互关系来分析传播行为,忽略了真实金融主体之间多重社会关系的交叉性.针对该问题,基于多智能体对多重社会网络中的破产传染现象进行建模,构建了纵向复合和并行独立多重网络传染模型,前者关注不同关系网络层次之间的跨层间影响,后者偏重于单层网络的独立性和并行性.设置不同的约束条件,对比实验了两种模型不同的传染效果特征.实验结果揭示了两种模型不同的适用范围:模型选择应由实验目标是否存在明显的不同社会网络层次间的相互影响决定,纵向复合多重网络破产传染模型更适用于社会网络层次之间间接影响明显的环境.  相似文献   

14.
In the era of the social web, many people manage their social relationships through various online social networking services. It has been found that identifying the types of social relationships among users in online social networks facilitates the marketing of products via electronic “word of mouth.” However, it is a great challenge to identify the types of social relationships, given very limited information in a social network. In this article, we study how to identify the types of relationships across multiple heterogeneous social networks and examine if combining certain information from different social networks can help improve the identification accuracy. The main contribution of our research is that we develop a novel decision tree initiated random walk model, which takes into account both global network structure and local user behavior to bootstrap the performance of relationship identification. Experiments conducted based on two real‐world social networks, Sina Weibo and Jiepang, demonstrate that the proposed model achieves an average accuracy of 92.0%, significantly outperforming other baseline methods. Our experiments also confirm the effectiveness of combining information from multiple social networks. Moreover, our results reveal that human mobility features indicating location categories, coincidence, and check‐in patterns are among the most discriminative features for relationship identification.  相似文献   

15.
16.
17.
Mobile opportunistic networks (MONs) are intermittently connected networks, such as pocket switched networks formed by human-carried mobile devices. Routing in MONs is very challenging as it must handle network partitioning, long delays, and dynamic topology. Flooding is a possible solution but with high costs. Most existing routing methods for MONs avoid the costly flooding by selecting one or multiple relays to deliver data during each encounter. How to pick the “good” relay from all encounters is a non-trivial task. To achieve efficient delivery of messages at low costs, in this paper, we propose a novel group-based routing protocol in which the relay node is selected based on multi-level cross-community social group information. We apply a simple group formation method to both historical encounters (social relationships in physical world) and/or social profiles of mobile users (social relationships in social world) and build multi-level cross-community social groups, which summarize the wide range of social relationships among all mobile participants. Our simulations over several real-life data sets demonstrate the efficiency and effectiveness of the proposed method by comparing it with several existing MON routing schemes.  相似文献   

18.
金融风险预测在金融市场监管和金融投资中扮演重要角色, 近年来已成为人工智能和金融科技领域的热门研究主题. 由于金融事件的实体之间存在复杂的投资、供应等关系, 现有的金融风险预测研究常利用各种静态和动态的图结构来建模金融实体间的关系, 并通过卷积图神经网络等方法将相关的图结构信息嵌入金融实体的特征表示中, 使其能够同时表征金融风险相关的语义和结构信息. 然而, 以前的金融风险预测综述仅关注了基于静态图结构的研究, 这些研究忽视了金融事件中实体间关系会随时间动态变化的特性, 降低了风险预测结果的准确性. 随着时序图神经网络的发展, 越来越多的研究开始关注基于动态图结构的金融风险预测, 对这些研究进行系统、全面的回顾有助于学习者构建面向金融风险预测研究的完整认知. 根据从动态图中提取时序信息的不同途径, 首先综述3类不同的时序图神经网络模型. 然后, 根据不同的图学习任务, 分类介绍股价趋势风险预测, 贷款违约风险预测, 欺诈交易风险预测, 以及洗钱和逃税风险预测共4个领域的金融风险预测研究. 最后, 总结现有时序图神经网络模型在金融风险预测方面遇到的难题和挑战, 并展望未来研究的潜在方向.  相似文献   

19.
近年来,异质网络中的社区发现逐渐成为人们关注的研究热点,然而现有大多数非重叠或重叠的社区发现方法都局限于考虑单一类型的网络结构,而无法适用于包含多模实体及其多维关系的异质网络,基于位置的社交网络(location based social network, LBSN)作为最近兴起的一种新型异质网络,如何有效发现其含有多维关系的复杂社区结构对现有研究来说是一个挑战性的难题.为此,提出了一种融合用户与位置实体及其多维关系的社区发现方法MRNMF(multi-relational nonnegative matrix factorization),该方法通过建立基于非负矩阵分解的联合聚类目标函数,并考虑融入用户社交关系、用户-位置签到关系以及兴趣点特征等多维度的影响因素,能同时获得紧密关联的用户模糊社区与兴趣点聚簇结构,以有效缓解推荐中的数据稀疏问题.在2种真实LBSN数据集上的实验结果表明,所提出的MRNMF方法同时在兴趣点与朋友这双重推荐上比其他传统方法具有更优越的推荐性能.  相似文献   

20.
社交网络的研究应用领域广泛,大多数的研究主要关注于社交网络结构中节点和链接的变化,研究角度较为单一.而群组协作关系在社交网络中较为普遍,为更好地探索群组协作过程中群组级别网络结构的演变,首先将组级任务添加到用于图可视化的任务分类中,针对协作关系网络的特性,设置一个适用于群组协作关系分析的任务分类法,根据此任务分类法设置...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号