首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 346 毫秒
1.
深网入口自动识别是深网数据集成的前提和基础.由于表单在设计上具有较大的随意性,使得深网入口缺乏统一的构建标准,难以利用确定性的规则对其进行判断.首先基于统计特征,抽取了部分表单属性作为深网入口与非深网入口的可区分特征,在此基础上,提出了一种利用神经网络进行深网入口自动识别的方法.不同于基于规则的判断方法,神经网络是被训练的,不需要任何先验知识,这种特性使其非常适合于对具有复杂表现形式的深网入口进行判定.实验结果表明了该方法的有效性.  相似文献   

2.
针对深层网中数据量大导致无法被传统搜索引擎索引的问题,在提取网页中,改进启发式规则识别表单查询入口,在表单标签与内容匹配时,改进基于语义的相似度匹配算法进行表单内容填充。实验结果表明,提取表单标签的准确率达到94.23%,匹配成功率达到88.83%,填充成功率达到95.43%。  相似文献   

3.
深网资源是指隐藏在HTML表单后端的Web数据库资源,这些资源主要通过表单查询的方式访问。然而,目前的网页采集技术由于采用页面超链接的方式采集资源,所以无法有效覆盖这些资源,为此,该文提出了一种基于领域知识抽样的深网资源采集方法,该方法首先利用开源目录服务创建领域属性集合,接着基于置信度函数对属性进行赋值,然后利用领域属性集合选择查询接口并生成查询接口赋值集合,最后基于贪心选择策略选择置信度最高的查询接口赋值生成查询实例进行深网采集。实验表明,该方法能够有效地实现深网资源的采集。  相似文献   

4.
针对深层网中数据量大导致无法被传统搜索引擎索引的问题,在提取网页中,改进启发式规则识别表单查询入口,在表单标签与内容匹配时,改进基于语义的相似度匹配算法进行表单内容填充。实验结果表明,提取表单标签的准确率达到9423%,匹配成功率达到88.83%,填充成功率达到95.43%。  相似文献   

5.
形态特征及神经网络在木材横纹压缩中的应用研究   总被引:2,自引:0,他引:2  
形态特征描述与细胞自动识别分类是木材横纹压缩微观构造变异研究的重要步骤。通过运用Freeman链码实现木材细胞形态特征的定量分析,这些特征量的提取为从微观角度分析横纹压缩过程中木材产生的强度变化提供了重要的理论依据。同时在此基础上,基于神经网络对信息处理的自组织、自学习功能,采用前馈BP网对木材细胞进行了自动识别分析,通过实验分析,研究中建立的神经网络具有良好的鲁棒性和细胞识别能力。  相似文献   

6.
Deep Web入口探测与分类方法研究   总被引:1,自引:0,他引:1  
传统的使用语料库对入口标签字符串进行匹配的方法受限于语料库的完整性和匹配算法的灵活性。为突破这种局限,引入了基于表单元件统计特征的Deep Web入口探测方法和使用文本分类方法对其进行分类的双层分类模型,并提出了两种特征权重计算方法用于特征选取。在TEL-8 Query Interfaces数据集上,测试结果体现了双层分类模型的优越性和特征向量维归约的必要性。  相似文献   

7.
基于模糊神经网络的水淹层自动识别   总被引:1,自引:0,他引:1  
针对油田水淹层识别存在的模糊性和多解性,提出了一种基于模糊神经网络的水淹层自动识别方法。该方法将神经网络技术所具有的高度自适应性、容错性及固有的并行处理能力与模糊逻辑所具有的模拟人类思维中的模糊综合判别特点有机地结合,实现了多因素模糊综合判断推理来完成水淹层自动识别。采用该方法,对大庆油田135个地层样本进行处理,符合率达87.6%。结果表明该方法对解决水淹层自动识别问题具有良好的适应性,可提高水淹层自动识别的精度。  相似文献   

8.
本文深研究了基于BP神经网络的指纹识别。对采集到的指纹图像进行预处理,消除假的特征点,利用指纹图像的脊线端点和分叉点作为最终特征点,提取其特征点坐标和方向作为神经网络的特征输入向量,实验证明该方法具有较好的实验效果。  相似文献   

9.
车徽识别是车辆自动识别技术一个新的研究方向,它对智能交通中车辆识别技术的完善和发展具有重要的理论意义与应用价值.对多种车徽进行了研究,提出了一种基于知识的车徽识别方法.该方法以专家系统理论为理论基础,用车徽的间隙数、轮廓特征、神经网络权值以及车徽识别的规则来建立知识库,利用推理机进行车徽的识别.实验结果证明,该方法识别速度快.识别率高.  相似文献   

10.
抑郁症是最常见的心理障碍之一,严重困扰患者的工作和生活。随着情感感知技术的发展,开发抑郁症自动识别系统具有广阔的前景。基于视频人脸图像,结合级联深度神经网络和多特征(全局特征和局部特征)对抑郁症BDI-II分值进行预测。设计全局特征网络、局部特征网络(眼部,嘴部)三个分支,利用FaceNet网络和深度神经网络提取全局特征,利用基于四元数的局部二进制编码和深度神经网络提取局部特征。在融合层将全局特征向量和局部特征向量拼接,接入第三个深度神经网络对抑郁程度进行预测。在AVEC2013和AVEC 2014抑郁症数据库上进行测试,实验结果表明,与其他基于视觉的方法相比,该方法取得了更小的平均绝对误差和均方根误差。  相似文献   

11.
针对无线传感器网络(WSN)节点容易出现故障从而导致网络瘫痪的问题,提出了一种基于改进的深度森林的无线传感器网络故障分类方法;深度森林是基于森林的集成学习方法,其输入是多维特征向量,特征向量将由多粒度扫描和级联森林这两个主要组成部分进行处理,多粒度扫描通过处理数据之间的关系来增强数据表示的能力,级联森林用于分类或预测;针对级联森林部分随着层数的增加可能造成的维数问题进行优化后,将该算法用于故障分类可以提高故障诊断的精确度;在仿真验证阶段,将该算法与深度神经网络(DNN)和支持向量机(SVM)算法进行对比;结果显示,该算法可以准确地识别出不同的故障类型,并且在损坏故障和电源故障的识别达到了最高精度,综合平均精度在98.4%;对偏移故障、漂移故障和通信故障的识别略低于卷积神经网络(CNN)算法,但综合训练时间、参数调节来看,该算法更能满足实际工程的需要。  相似文献   

12.
基于网页上下文的Deep Web数据库分类   总被引:6,自引:0,他引:6  
马军  宋玲  韩晓晖  闫泼 《软件学报》2008,19(2):267-274
讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属性标记词的归一过程是把同义标记词用代表词进行替代的过程.给出了采用分层模糊集合对给定学习实例所发现的领域和语言知识进行表示和基于这些知识对标记词归一化算法.基于上述预处理,给出了计算Deep Web数据库的K-NN(k nearest neighbors)分类算法,其中对数据库之间语义距离计算综合了数据库表之间和含有数据库表的网页的内容文本之间的语义距离.分类实验给出算法对未预处理的网页和经过预处理后的网页在数据库分类精度、查全率和综合F1等测度上的分类结果比较.  相似文献   

13.
利用神经网络进行辐射源个体识别时,训练样本的单一性会导致深度网络出现过拟合的现象,继而影响辐射源个体识别的精确性。针对该问题,本文提出一种基于PID算法的深度卷积网络结构,该结构通过在传统卷积神经网络的输出层与输入层间构建一条反馈回路,采用PID算法将网络输出错误率转化为划分训练集数据构成的概率,通过优化训练集数据构成,达到抑制过拟合的目的。将该方法应用于超短波电台识别,平均识别率达到92.59%,识别率方差约为传统算法的1/3,训练用时减少约35 min,上述指标均优于传统神经网络。实验结果表明,该算法增强了深度网络的鲁棒性,有效地抑制了过拟合现象。  相似文献   

14.
针对语音识别的特点,对BP神经网络在语音识别技术中的应用进行了探索性研究,进而结合人工智能领域较为有效的方法——遗传(GA)算法,针对传统BP算法识别准确率高但训练速度慢的缺点,对BP网络进行改进,构建了一种基于遗传神经网络的语音识别算法(GABP),并建立相应的语音识别系统。仿真实验表明,该算法有效地缩短了识别时间,提高了网络训练速度和语音的识别率。  相似文献   

15.
针对语音识别的特点,对BP神经网络在语音识别技术中的应用进行了探索性研究,进而结合人工智能领域较为有效的方法——遗传(GA)算法,针对传统BP算法识别准确率高但训练速度慢的缺点,对BP网络进行改进,构建了一种基于遗传神经网络的语音识别算法(GABP),并建立相应的语音识别系统。仿真实验表明,该算法有效地缩短了识别时间,提高了网络训练速度和语音的识别率。  相似文献   

16.
This paper proposes a novel algorithm for localizing slab identification numbers (SINs) in factory scenes. Automatic identification of product information is important for the process management, and localization of SINs in complex scenes is a major challenge for the recognition. A previous rule-based localization algorithm for SINs requires lots of prior knowledge and heuristic tuning for parameters. In this paper, a deep convolutional neural network (DCNN) is employed to overcome these limitations, and accumulated confidence is proposed to utilize neighboring outputs of the DCNN in a scene. The localization error is remarkably reduced to 1.44% by the proposed algorithm compared to 4.59% in the previous work. The proposed data-driven method can be applied to construct other automatic identification systems with minimal manual handling.  相似文献   

17.
针对现有基于大数据和深度学习的目标检测框架难以实现在低功耗移动和嵌入式设备上实时进行视频目标检测的问题,改进了基于深度学习的目标检测框架SSD,提出一种改进的多目标检测框架LSTM-SSD,将其专用于交通场景视频多目标检测。将单图像检测框架与递归神经网络-LSTM网络相结合,形成交织循环卷积结构,通过采用一种Bottleneck-LSTM层提炼传播帧间的特征映射实现了网络帧级信息的时序关联,极大降低了网络计算成本;将时间感知信息与改进的动态卡尔曼滤波算法结合起来,实现了对视频中受光照变化、大面积遮挡等强干扰影响目标的追踪识别。实验表明,改进后的LSTM-SSD在应对多目标、杂乱背景、光照变化、模糊、大面积遮挡等检测难度较大的情况时,均能获得较好的效果,相比于其他基于深度学习的目标检测框架,各类目标识别的平均准确率提高了5%~16%,平均准确率均值提高了约4%~10%,多目标检测率提高了4%~19%,检测帧率达到43 fps,基本满足实时性的要求。其实现了算法精度与运行速率的平衡,取得了较好的检测识别效果。  相似文献   

18.
19.
王涛  马川  陈淑平 《计算机应用研究》2021,38(8):2543-2548,2555
通过研究对抗性图像扰动算法,应对深度神经网络对图像中个人信息的挖掘和发现以保护个人信息安全.将对抗样本生成问题转换为一个含有限制条件的多目标优化问题,考虑神经网络的分类置信度、扰动像素的位置以及色差等目标,利用差分进化算法迭代得到对抗样本.在MNIST和CIFAR-10数据集上,基于深度神经网络LeNet和ResNet进行了对抗样本生成实验,并从对抗成功率、扰动像素数目、优化效果和对抗样本的空间特征等方面进行了对比和分析.结果表明,算法在扰动像素极少的情况下(扰动均值为5)依然可以保证对深度神经网络的有效对抗,并显著优化了扰动像素的位置及色差,达到不破坏原图像的情况下保护个人信息的目的.该研究有助于促进信息技术红利共享与个人信息安全保障之间的平衡,也为对抗样本生成及深度神经网络中分类空间特征的研究提供了技术支撑.  相似文献   

20.
特征学习是模式识别领域的关键问题。基于自动编码器的深度神经网络通过无监督预训练与有监督微调能够有效地提取数据中关键信息,形成特征。提出一种基于栈式去噪自编码器的边际Fisher分析算法,该算法将边际Fisher分析运用于有监督微调阶段,进一步提升算法的特征学习能力。实验结果表明,该算法与标准的栈式去噪自编码器和基于受限玻尔兹曼机的深度信念网相比,具有更好的识别效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号