共查询到20条相似文献,搜索用时 109 毫秒
1.
2.
阮娟 《智能计算机与应用》2015,(2):58-61
随着互联网技术的迅猛发展,因特网成为目前新闻信息最丰富最主要的来源。本文在分析新闻网页的基础上,分析了目前现有的信息抽取技术和XML技术,提出了一个基于XML技术的Web新闻抽取系统。本文主要是充分运用XML中的XPath技术在数据定位方面的优势,并提出一种基于DOM树的XPath生成算法,使用XSLT语言用于描述抽取规则,并使用路径表达式XPath定位待抽取的信息点。 相似文献
3.
随着数据存储和数据处理技术的不断进步,个人信息广泛存在于各类文档之中,个人信息保护已成为目前科研界和工业界亟待解决的重要问题,而个人信息抽取是个人信息保护的前提和核心概念之一。针对内容复杂,格式多样,不确定性高的各类复杂文档进行个人信息抽取,本文提出了一种基于神经网络的个人信息自动化抽取的统一方法。该方法整合了流式文档和版式文档的信息抽取能力,同时结合了正则匹配和深度学习神经网络模型来输出个人信息抽取结果。此外,方法中的个人信息抽取模型通过改造输入数据的方式来融合文档的布局信息进行训练,并在训练过程中采取了迭代标注和扩展训练数据的方法,以此提高模型训练的效率和效果。 相似文献
4.
随着社会法治化发展,法院受案数量呈爆发式增长,各证据要素之间关联较弱,影响法律审判效率.基于上述问题,提出一种基于深度学习的多维度证据要素关联关系抽取模型,设计基于BERT_BiGRU_CNN模型的证据要素关联关系抽取算法.本文以裁判文书为数据集,使用BERT训练所需字词向量,开展BERT、BERT_CNN、BERT_... 相似文献
5.
关系抽取是信息抽取中的一个重要子任务,很多关系抽取任务利用现有的词法分析和句法分析等基本的NLP处理工具来生成特征,但是该特征提取方法完全利用之前的经验进行,特征的质量过度依赖于已有的NLP工具的准确率,存在误差传播的问题.近年来随着深度学习的发展,卷积神经网络学习算法在很多自然语言处理任务中取得了较好的效果.文中应用... 相似文献
6.
基于特征组合的中文实体关系抽取 总被引:2,自引:0,他引:2
结合中文关系抽取的要求,以ACE2005的中文语料为数据进行关系抽取实验.在抽取中文词法、实体、句法,语法基本特征后,提出采用特征组合方法,使用支持向量机的机器学习(SVM)方法,在上关系探测和关系大类上F值分别提高了1.36%和3.97%,达到72.77和61.03,并分析出各部分组合特征的贡献.实验数据表明词语和实体组合特征对中文关系抽取的作用较大. 相似文献
7.
8.
随着社交媒体的发展及成熟,每天在互联网环境中都会产生大量的用户评论信息。抽取评价短语、评价对象和观点持有者等情感要素,已经成为了中文观点挖掘和情感分析的重要先决任务。针对中文情感要素抽取任务,本文提出了一个统计和规则相结合的级联模型,主要贡献包括:(1)针对汽车领域评论信息,构建情感要素标注语料库和相关词典;(2)对于以往研究较少关注的中文评价短语,本文详细分析阐述其定义和分类;(3)结合统计和规则,分别针对评价短语和情感要素提出级联抽取策略。实验结果充分证明了该级联模型的有效性,相比较于其它基于规则的情感要素抽取算法有效提升了召回率,同时为后续社交媒体情感分析任务提供了有力的支持。 相似文献
9.
实体关系抽取是知识库构建中至关重要的一个环节.在众多的实体关系抽取方法中,远程监督结合神经网络模型的方法在准确率等性能上是比较令人满意的,但远程监督获取的标注语料中往往存在大量的噪声数据,给实体关系抽取模型的训练带来了很大的影响.本文提出一种基于改进注意力机制的卷积神经网络实体关系抽取模型.该模型针对包含同一实体对的句子集合,从中尽可能地找出所有体现该实体对关系的正实例,构建组合句子向量,抛弃可能的噪声句子,从而最大程度地降低噪声句子的影响又能充分利用正实例的语义信息.实验证明,本文提出的关系抽取模型在准确率上优于对比的关系抽取模型. 相似文献
10.
11.
在摩尔定律的推动下,工艺节点在不断演进,集成电路设计复杂度也在不断增加,电子设计自动化(EDA)技术面临着来自运行时间与计算资源等诸多方面的挑战。为了缓解这些挑战,机器学习方法已被纳入EDA工具的设计流程中。与此同时,鉴于电路网表作为图形数据的本质,图神经网络(GNN)在EDA流程中的应用正变得越来越普遍,为复杂问题的建模以及最优问题的求解带来了新思路。该文首先对GNN与EDA技术的概念内涵进行了简要的概述,详细地梳理了GNN在高层次综合(HLS)、逻辑综合、布图规划与布局、布线、反向工程、硬件木马检测以及测试点插入等不同EDA设计流程中的主要作用,以及当前基于GNN的EDA技术的一些重要探索。以希望为集成电路设计自动化以及相关领域的研究人员提供参考,为我国先进集成电路产业的发展提供技术支持。 相似文献
12.
病毒漏洞的大量出现,给网络安全带来了一定的威胁,尤其是DDoS攻击给网络安全敲响了警钟。在安全网络研究方面,攻击图是很好的一种研究方法,它能够给出清晰的结构图,使网络安全人员找到可能的攻击路径,从而重点防范,以减少网络安全事故的发生。论文介绍了这种基于攻击图的网络安全分析方法,最后给出一个系统原型。 相似文献
13.
14.
工业机器人作为智能制造的重要载体,在大范围复杂任务中具有巨大潜力。但是,定位精度低且难以控制的问题阻碍了机器人在高精度任务的进一步推广。为了提升机器人作业精度,该文提出一种基于时空混合图卷积网络的机器人定位误差预测及补偿方法。首先通过设计图关系编码模块、时空混合特征解码模块,构建基于图卷积网络的机器人位姿误差预测模型;然后,针对传统迭代补偿方法中机器人逆解次数多导致效率低的问题,该文将定位误差补偿问题转化为优化问题,并利用遗传算法同时对位置和姿态进行误差补偿;最后,通过拉丁超立方抽样方法获得训练集,实现机器人定位误差预测模型的训练,并通过实验验证了定位误差预测的准确性以及补偿的效果。 相似文献
15.
针对自适应可见性图(AVG)算法复杂度过高且精度提升不明显的缺点,该文提出一种基于单通道多尺度图神经网络(SMGNN)的自动调制识别(AMR)框架,并对框架各个部分进行了可解释性研究。首先利用多层感知机和1维卷积自适应地实现了单通道信号序列和图之间的映射,有效降低了AVG算法的复杂度;其次,设计了一种多尺度图神经网络,将不同分辨率的特征进行融合,提升了模型识别准确率。实验表明,该文提出的SMGNN算法相比于AVG算法节省了近1/2的参数量,且识别精度得到了较大的提升。 相似文献
16.
基于贝叶斯神经网络的垃圾邮件过滤方法 总被引:10,自引:2,他引:10
垃圾邮件过滤是当前互联网应用中急需解决的一个重要课题,日益受到人们的关注。本文提出了一种基于贝叶斯神经网络BNN(Bayesian Neural Network)的垃圾邮件过滤方法,利用贝叶斯推理和神经网络相结合的贝叶斯神经网络算法对用户给定的正常/垃圾邮件集合进行训练,得到邮件过滤模型。并且提出了一种有效的特征选择方法,采用信息增益准则,有效降低了特征维数。经过实验测试,本文提出的方法可以实现对垃圾邮件的有效过滤。 相似文献
17.
该文提出了一种用递推最小二乘法训练傅里叶基神经网络权值的频谱分析方法。其主要思想是采用递推最小二乘法训练傅里叶基神经网络权值,根据权值获得信号的幅度谱和相位谱。该方法不涉及复数的乘法运算和加法运算,便于软件和硬件实现,特别适合于DSP软硬件实现。仿真结果表明,该方法不仅计算精度高,计算速度快,而且具有噪声滤波功能,是一种有效的频谱分析方法。 相似文献
18.
19.
针对卷积编解码网络(CED, Convolution encoder-and-decoder)对语音时序相关信息捕获困难的问题,本文提出了一种基于门控残差卷积编解码网络的语音增强方法。该方法在卷积编解码网络的基础上引入了门控机制、膨胀卷积与残差连接:门控机制能够很好地处理序列前后相关信息;膨胀卷积使得卷积过程获得更大的感受野,提取更加丰富的全局信息;残差连接能够防止梯度消失与梯度爆炸,提升网络精度。此外,采用频域损失函数与时域评价指标联合优化的策略对网络进行训练,以进一步提升网络增强效果。实验表明,在匹配噪声和不匹配噪声下,相比于基线CED与其他对比方法,本文方法取得了更高的PESQ、STOI与SI-SDR,对语音的清浊音都有较好恢复效果,且具有较强的泛化能力。 相似文献
20.
基于耦合的混沌神经网络建模方法 总被引:3,自引:0,他引:3
混沌状态下神经网络行为的研究是神经网络理论的一个新内容,由于它可能揭示脑活动的深层机制而广受重视,但是混沌网络信息处理能力进行大量和深入研究却遇到许多障碍,其问题之一是难以为网络系统选择适当的非线性参数。本文提出一种建立混沌神经网络模型的简单耦合方法,解决了选择参数的困难,计算机模拟结果表明,用该模型研究混沌状态下网络动态行为是有效的。 相似文献