首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 406 毫秒
1.
事件抽取是构建知识图谱的关键前置任务之一,而事件论元抽取是事件抽取的子任务,对事件抽取质量有显著影响.针对现有的流水线式事件抽取方法在论元抽取时忽略了触发词和论元间、论元和论元间相互关系导致抽取质量低的问题,该文提出了一种基于双向门控循环神经网络(Bi-GRU)的事件论元抽取方法.该方法融合Bert词向量、词性特征、词...  相似文献   

2.
在公检法、纪检监察等领域的大数据分析中,结构化数据和非结构化文本数据往往成为主要数据源. 基于这类数据进行业务分析时,需要重点提取数据背后的隐型关联,而事件抽取是对此类文本数据进行关联分析的核心基础. 过往事件抽取任务将事件触发词识别和事件要素识别分开进行,由事件触发词识别得到的事件触发词及事件类型进行后续的事件要素识别,存在误差传播的问题,且以往的基于表示的方法构建的词向量,对于句子级特征的提取能力存在缺失. 提出了一种RBBLC联合抽取模型,以序列标注的方式同时完成事件识别和事件要素识别. 所提RBBLC模型基于RoBERTa构建包含更丰富上下文信息的词向量,继而应用BiLSTM-CNN的网络结构捕捉语句内部关联信息进行事件触发词及论元标签预测和事件类型预测. 在CEC语料库上进行了抽取实验和归纳分析,本方法的F1值、准确率、召回率三项指标较基线方法分别提高了16%、28%和24%,有效提升了事件抽取任务性能.  相似文献   

3.
针对触发词定义标准模糊、语料标注成本高等问题,提出一种基于事件模式及类型的事件检测深度学习模型(PTNN)。首先基于实体的语法及语义特征获取潜在论元;其次将潜在论元抽象为角色,结合语法、语义、角色特征构建嵌入表示,增强输入对事件模式的体现;最后利用Bi-LSTM和基于事件类型的注意力机制,完成事件及类型判定。模型在不识别触发词的前提下,通过强化事件模式特征实现事件检测,避免了触发词标注困难的问题,证明了事件模式在神经网络上对事件检测的积极作用,将同类方法的最优效果提升了3%,且达到了基于触发词的检测效果。  相似文献   

4.
为提高事件检测任务的性能,将该任务重定义为一种提示范式,该范式使用问答对的形式将事件检测转化为机器阅读问题。同时,设计了一种名为WLBert-BiGRU的学习模型对问答对中的事件触发词进行预测,该模型使用Weight-Layers策略丰富Bert模型的语义表征能力,并使用双向门控循环单元神经网络(Bi-GRU)方法强化模型对事件触发词的识别能力。在ACE 2005数据集上的实验结果表明,本文方法在事件触发词识别和分类上的F1指标分别达到了78.1%和75.1%,较现有的工作平均提高了4.18%和4.3%。  相似文献   

5.
现有的基于图卷积网络(GCNs)的协同过滤(CF)模型存在两大问题,大多数原始图因存在噪声及数据稀疏问题会严重损害模型性能;对于大型用户项目图来说,传统GCN中的显式消息传递减慢了训练时的收敛速度,削弱了模型的训练效率.针对上述2点,提出融合图增强和采样策略的图卷积协同过滤模型(EL-GCCF).图初始化学习模块通过生成2种图结构,综合考虑图中的结构和特征信息,对原始图进行增强,有效缓解了噪声问题.通过多任务的约束图卷积跳过显式的消息传递,利用辅助采样策略有效缓解训练中的过度平滑问题,提高了模型的训练效率.在2个真实数据集上的实验结果表明,EL-GCCF模型的性能优于众多主流模型,并且具有更高的训练效率.  相似文献   

6.
针对一类存在数据丢包的网络控制系统,在系统状态无法直接测量的情况下,基于状态观测器和事件触发机制,提出了一种事件触发预测控制算法。首先,在传感器端建立了基于输出信息的事件触发机制1,用来减少传感器端到控制器端的信息发送次数,减少数据量的发送。其次,在控制器端建立事件触发机制2和状态观测器,用来重构和预测系统的状态和未来的控制输入序列,并发送给执行器端。执行器从接收到的序列中选择合适的控制输入作用于被控对象。然后利用Lyapunov稳定性理论,结合线性矩阵不等式,同时设计出反馈矩阵和事件触发机制中的参数。最后,通过仿真验证了所提方法的有效性。  相似文献   

7.
为有效汇聚实体间信息,利用实体间路径信息判断语义关系,提出一种基于提及图和显式路径的文档级关系抽取方法。利用基于提及对类型的图构建方法,通过融合提及间天然存在的结构化信息,结合图注意力网络,实现实体间信息的汇聚;利用基于显式路径的关系推理方法,包括显式路径构建方法和启发式的路径特征融合方法两个子方法,通过显式方式构建关系推理路径,将推理路径分为句内推理路径、句间推理路径、直接推理路径,实现区分句内推理和句间推理,差异化融合路径特征,提高关系路径推理能力,增强关系抽取的准确度。在3个公开数据集上的对比试验表明,本方法在F1和Ign F1指标上较目前主流方法存在优越性,验证了基于提及图和显式路径的文档级关系抽取方法能够更有效地支持文档级关系抽取任务。  相似文献   

8.
LDA是对主题到文档的全局结构建模,但其特征中缺少文档内部的局部词之间的关系,只能获得稀疏特征。Word2vec是一种基于上下文预测目标词的词嵌入模型,然而,基于这种方法只能以局部信息表示文档特征,缺乏全局信息。LDA和Word2vec的文本表示模型是基于主题向量和文档向量计算新的特征表示文本,但直接计算所得的稀疏主题特征与基于词向量的文档特征的距离,缺乏特征的一致性。本文提出了Huffman-LDA和Weight-Word2vec的文本表示模型,首先,使用LDA模型得到主题向量后构建主题哈夫曼树,再运用梯度上升方法更新主题向量,新的主题向量包含不同主题词之间的关系,求得的特征不再具有稀疏性;然后,使用LDA主题向量与主题矩阵中词的主题特性计算词权重更新Word2vec的词向量,使得词向量包含主题词之间的关系进而表示文档向量;最后,通过主题向量和文档向量的欧式距离得到具有强分类特征的文本表示。实验结果表明,该方法可获得更强的文本表示特征,有效提高文档分类精度。  相似文献   

9.
为了获取高质量的隐式主题结果,提高服务聚类精度,解决服务描述文档文本短带来的语义稀疏性与噪声问题,提出词向量与噪声过滤优化的词对主题模型(BTM-VN). 该模型以词对为基础,拓展服务描述文档,获取额外的语义信息,设计利用主题分布信息进行代表词对概率计算的策略,通过在采样过程中计算代表词对矩阵,提高代表词对在当前主题的权重,降低噪声词对服务描述文档主题获取的干扰. 利用词向量筛选待训练的词对集合,减少共现意义低的词对组合,解决词对主题模型耗时较长的问题. 使用优化的密度峰值聚类算法对经BTM-VN训练后的服务主题分布矩阵进行聚类. 实验结果表明,基于BTM-VN的服务聚类方法在3种聚类评价指标上的表现均优于传统的服务聚类算法.  相似文献   

10.
提出了融合产品静态特性信息和动态演变信息的集成化产品模型框架,该框架支持数据集成和设计过程集成。静态特性信息中的产品核心信息和领域公共信息封装在主模型中,包含领域相关信息的领域模型是外层衍生模型,通过对主模型进行信息抽取和补充来快速建立;动态演变信息记录领域模型的创建历史链,使一次生成的中间模型尽可能地为其他领域共享,从而显著提高模型的可重用性。讨论了主模型表达、从CAD模型抽取主模型、从主模型抽取领域模型等关键技术。在此基础上,开发了一个集成化产品建模原型系统SCC-ProModeling,可以有效提高领域模型的重构速度。该系统在中国航天“型号工程”中得到了初步应用。  相似文献   

11.
针对LSTM网络进行主题词提取时因没有考虑中心词的下文对主题词的影响而导致提取准确率低的问题,提出了一种双向LSTM引入Attention机制模型(Att-iBi-LSTM)的主题词提取方法。首先利用LSTM模型将中心词的上文和下文信息在两个方向上建模;然后在双向LSTM模型中引入注意力机制,为影响力更高的特征分配更高的权重;最后利用softmax层将文档中的词分为主题词或非主题词。并且还提出了一种两阶段模型训练方法,即在自动标注的训练集上进行预训练之后,再利用人工标注数据集训练模型。实验在体育、娱乐和科技3种新闻文本上进行主题词提取任务,实验结果表明本文提出的Att-iBi-LSTM模型与SVM、TextRank和LSTM相比F1值分别提高了13.78%、24.31%和3.32%,使用两阶段训练方法的Att-iBi-LSTM比一阶段训练的F1值提高了1.56%。  相似文献   

12.
针对电阻抗成像(EIT)研究中电导率分布的不确定性问题,提出基于灵敏度分析的改进稀疏网格配点法以量化不确定性. 以4层同心圆头模型为算例,采用基于方差的全局灵敏度分析法对其进行分析,发现各层电导率的变化对输出电位的影响程度各不相同. 考虑模型中各维输入变量对输出结果不同程度的影响,改进传统稀疏网格配点法. 改进方法对各维输入变量配置不同的精度水平,将EIT模型的隐式表达式转化为显式表达式,构造出高精度的替代模型. 与蒙特卡洛(MC)法、混沌多项式展开(PCE)法和传统稀疏网格配点法相比,改进方法能够以更少的计算成本获得较高精度的量化结果. 仿真结果验证了所提改进方法的高效性.  相似文献   

13.
针对散射中心重叠的情况,利用散射中心空域及其散射机理的稀疏特性,提出一种基于全极化属性散射中心模型的合成孔径雷达目标属性特征提取算法.根据散射中心空域与散射机理的稀疏特性,对目标的极化分解系数矩阵分别施加行稀疏约束与矩阵稀疏约束.由于极化散射机理字典包含未知参数,在此采用坐标轮回下降法分别估计极化分解系数矩阵与极化散射机理字典,同时提取属性散射中心及其极化特征等属性特征.基于电磁计算数据的实验结果,验证了该算法能够利用极化信息提取散射中心的属性特征.  相似文献   

14.
微博内容具有信息混杂和不确定性等特点,传统可信度判别方法存在一定局限性。因此,该文提出一种面向微博可信度评估的辩论有向图模型,从辩论的角度出发,以图模型直观、形象化地描述了辩论推演过程。通过话题语料构成争议节点,利用争议间的主题情感和潜在逻辑关系定义规则可信度,并设置图中边的权值来代表争议间的防卫和攻击强度。根据相关算法得出结论的可信度,递归进行辩论图演化,得到需判别信息的可信度。实验结果表明该模型比传统方法综合指标值平均提升6%。  相似文献   

15.
语法是否具有可教性的争议至今尘埃未定,实践中很多教师仍然在教授语法。关于教授方法是隐性还是显性更好也尚无定论,近来的趋势是倾向于显性的学习。大学英语课时有限而任务繁重,可以采用"隐性课堂教学"加"显性自学"的方式来解决这一矛盾。计算机辅助教学的发展和大学生的学习特点都决定了语法可以"显性自学",其关键是找到合适的自学课件。语法的"显性自学"对课件的要求是高度的可定制性和对教师的完全替代性。  相似文献   

16.
在机械故障诊断中,针对传统方法提取微弱故障特征时易受强背景噪声干扰而精度低的问题,提出了一种基于数据驱动的广义最小最大凹惩罚函数增强的稀疏特征提取方法。该方法利用非凸的最小最大凹惩罚函数建立无约束优化问题目标函数来提高故障特征的提取精度。该惩罚函数非凸可加强特征的稀疏性,并且证明了保持目标函数整体呈现严格凸性所需要满足的约束条件。将近端算法用于所构造的无约束优化问题的求解。此外,研究了数据驱动的正则化参数设置准则,保证所提出的稀疏特征提取方法具有参数自适应性。在仿真信号和实际故障实验中验证了所提出的自适应稀疏增强的特征提取方法,结果表明所提出的方法可以精准地提取出故障特征且效果更稀疏。  相似文献   

17.
近年来,机器学习技术广泛用于从功能磁共振成像(functional magnetic resonance imaging,fMRI)数据中解码视觉信息、精神状态、情绪和其它感兴趣的大脑感知和认知功能。然而,由于fMRI数据样本维数高,样本量少,一般需要利用特征提取方法去除多余的预测变量和实验噪声等信息,避免机器学习模型出现过拟合问题,提高模型的预测准确率和泛化能力。介绍和讨论了常用fMRI数据有监督特征提取方法的一般原理和研究现状,并着重分析其性能和可能改进方向,最后对特征提取方法在fMRI中的研究方向进行了展望。  相似文献   

18.
基于Petri网的应急管理工作流模型   总被引:2,自引:0,他引:2  
讨论了由Petri网发展起来的工作流网WF-net的定义、工作流执行结构及任务触发方法,引入WF-net建立应急管理信息系统工作流模型,提出了一种基于Petri网工作流模型的建模方法及其相关规则.以一个省级应急管理系统为例,详细阐述了构建Petri网工作流模型的过程,并利用验证工具对该模型进行了正确合理性分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号