首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
针对普适交通模式的场景感知功耗高、场景复杂的问题,提出一种融合残差网络(ResNet)和带孔卷积的交通模式识别算法。首先,使用快速傅里叶变换(FFT)将一维传感器数据转换为二维频谱图像;然后,使用主成分分析(PCA)算法对频谱图像降采样;最后,使用ResNet挖掘交通模式的局部特征,使用带孔卷积挖掘交通模式的全局特征,从而实现对八种交通模式进行识别。与决策树、随机森林、AlexNet等八种算法在实验中的对比评估结果显示,融合ResNet和带孔卷积的交通模式识别算法在静止、走路、跑步等八类交通模式上均有最高准确率。该算法具有良好识别精度和鲁棒性。  相似文献   

2.
环境声音分类(ESC)是音频处理领域的重要分支之一,在未来多媒体应用中有重要的作用。音频识别是提取音频中特定的声学特性,将音频分类至样本对应的正确场景,有助于感知和理解周围环境。现阶段音频识别主要是通过信号处理技术和机器学习方法达成。随着人工智能飞速发展,传统的音频处理技术以及机器学习方法面临着巨大的挑战,ESC的识别准确性有待进一步提高。结合残差网络和随机森林两种方法,将一维时域信号的音频数据转换为二维数据形式的梅尔声谱图,预训练残差网络获得一个精度较高的网络模型作为特征提取器,利用该网络模型提取音频中的深层特征,再利用随机森林对深层特征进行分类。该方法在ESC任务上识别率提升了近10%,取得了较好的分类结果。  相似文献   

3.
张杨  郝江波 《计算机应用》2022,(6):1708-1715
针对目前已有的基于深度学习的恶意代码检测方法提取特征不足和准确率低的问题,提出一种基于注意力机制和残差网络(ResNet)的恶意代码检测方法 ARMD。为了支持该方法的训练,从Kaggle网站获取了47 580个恶意和良性代码的Hash值,并利用VirusTotal分析工具提取每个代码数据调用的API,在此之后将所调用的API整合为1 000个不重复的API作为检测的特征来构造训练样本数据;然后根据VirusTotal的分析结果进行良恶性判定进而标记样本数据,并采用SMOTE增强算法使数据样本均衡化;最后构建并训练注入注意力机制的ResNet,从而实现恶意代码检测。实验结果表明ARMD的恶意代码检测准确率为97.76%,且与目前已有的基于卷积神经网络(CNN)和ResNet模型的检测方法相比,平均精确率至少提高了2个百分点,验证了ARMD的有效性。  相似文献   

4.
张杨  郝江波 《计算机应用》2022,(6):1708-1715
针对目前已有的基于深度学习的恶意代码检测方法提取特征不足和准确率低的问题,提出一种基于注意力机制和残差网络(ResNet)的恶意代码检测方法 ARMD。为了支持该方法的训练,从Kaggle网站获取了47 580个恶意和良性代码的Hash值,并利用VirusTotal分析工具提取每个代码数据调用的API,在此之后将所调用的API整合为1 000个不重复的API作为检测的特征来构造训练样本数据;然后根据VirusTotal的分析结果进行良恶性判定进而标记样本数据,并采用SMOTE增强算法使数据样本均衡化;最后构建并训练注入注意力机制的ResNet,从而实现恶意代码检测。实验结果表明ARMD的恶意代码检测准确率为97.76%,且与目前已有的基于卷积神经网络(CNN)和ResNet模型的检测方法相比,平均精确率至少提高了2个百分点,验证了ARMD的有效性。  相似文献   

5.
近年来,合成孔径雷达(SAR)在改善溢油检测方面得到了广泛应用。然而,由于其特殊的成像机理,乘性相干斑噪声和其他物理现象引起的暗斑一直影响着溢油检测的精度。单独使用一种特征很难对图像上的油膜和类油膜现象进行区分,针对这一问题提出了利用多特征融合结合深度残差网络(ResNet)的方式来区分全极化图像上的油膜和类油膜现象。实验中将C波段的三种极化特征:极化散射熵(Entropy)、平均散射角(Alpha)和单次散射特征值相对差异度(SERD)组合在一起,形成一个优化特征子集,在确定的三种极化特征对应的特征图上选取多个感兴趣区域作为ResNet网络的训练集和测试集。该实验所用训练集由3 600个原油样本、3 600个生物油样本和3 600个乳化油样本(共计10 800个)组合而成。测试集由600个原油样本、600个生物油样本和600个乳化油样本(共计1 800个)组合而成,最终得到97.56%的分类精度。用同样的实验数据采用同是深度学习的VGG和AlexNet分类算法进行油膜和类油膜的分类,并与ResNet算法分类结果进行对比分析。为了减弱过拟合现象以及获得更可靠的实验结果,分别进行了[K]-交叉验证和ROC曲线实验。结果表明所提出的算法是有效的。  相似文献   

6.
2020年新冠疫情爆发,佩戴口罩是有效抑制疫情反弹的重要措施之一,研究利用机器视觉技术检测人脸是否佩戴口罩有重要的现实意义。本文针对视频图像中人脸佩戴口罩时存在遮挡、检测目标较小、特征信息不明显、目标靠近群体不易识别等问题,提出一种基于DCN-SERes-YOLOv3的人脸佩戴口罩检测算法。首先,采用ResNet50与YOLOv3相结合的方式,将主干网络替换为ResNet50残差网络,为了平衡模型的精度与速度,对残差块中的卷积层改进并加入平均池化层,降低模型的损失与复杂度,提高检测速度;其次,将ResNet50残差网络中第4个残差块的常规卷积替换为DCN可变形卷积,提高模型适应人脸佩戴口罩时发生几何形变的能力;最后,引入SENet通道注意力机制,增强特征信息的表达能力。实验结果表明,本文算法的平均精度值高达95.36%,比传统YOLOv3算法提高了约4.1个百分点,且检测速度提高了11.7 fps,本文算法提高了检测人脸佩戴口罩任务的精度与速度,有较好的应用前景。  相似文献   

7.
王正刚  刘忠  金瑾  刘伟 《计算机应用》2023,(12):3955-3964
针对现阶段我国海关风险布控方法存在效率、准确率较低、人力资源占用过多的问题和智能化分类算法小型化部署需求,提出一种基于改进蝶形反馈型神经网络(BFNet-V2)的海关风险布控方法。首先,运用编码填充(FC)算法实现海关表格数据到模拟图像的语义替换;其次,运用BFNet-V2训练模拟图像数据,由左右两条链路、不同卷积核和块、小块的设计组成规则的神经网络结构,并添加残差短路径干预改善过拟合和梯度消失;最后,提出历史动量自适应矩估计算法(H-Adam)优化梯度下降过程,取得更优的自适应学习率调整方式,并分类海关数据。选取Xception(eXtreme inception)、移动网络(MobileNet)、残差网络(ResNet)和蝶形反馈型神经网络(BF-Net)为基线网络结构进行对比。BFNet-V2的接受者工作特征曲线(ROC)和查准率-查全率曲线(PR)包含了基线网络结构的曲线,与4种基线网络结构相比,基于迁移学习(TL)的BFNet-V2分类准确率分别提高了4.30%、4.34%、4.10%和0.37%。在真实标签数据分类过程中,BFNet-V2的查获误判率分别降低了70.09%、...  相似文献   

8.
改进的SSD航拍目标检测方法   总被引:2,自引:0,他引:2  
近年来,无人机技术的快速发展使得无人机地面目标检测技术成为计算机视觉领域的重要研究方向,无人机在军事侦察、交通管制等场景中具有普遍的应用价值.针对无人机场景下目标分辨率低、尺度变化大、相机快速运动、目标遮挡和光照变化等问题,提出一种基于残差网络的航拍目标检测算法.在SSD(single shot multibox detector)目标检测算法的基础上,用表征能力更强的残差网络进行基准网络的替换,用残差学习降低网络训练难度,提高目标检测精度;引入跳跃连接机制降低提取特征的冗余度,解决层数增加出现的性能退化问题.同时,针对SSD目标检测算法存在的目标重复检测和小样本漏检问题,提出一种基于特征融合的航拍目标检测算法.算法引入不同分类层的特征融合机制,把网络结构中低层视觉特征与高层语义特征有机地结合在一起.实验结果表明,算法在检测准确性和实时性方面均具有较好的表现.  相似文献   

9.
针对烟雾发生场景复杂,小目标烟雾检测困难的问题,提出一种改进的YOLOv5烟雾检测模型。为了增加模型对目标烟雾的检测精度,结合加权双向特征金字塔网络(BiFPN)结构对特征融合过程进行修改,并在通道和空间维度上加入混合注意力机制对融合特征图的权重进行重新赋值,在增强烟雾目标特征的同时抑制无关区域特征,使烟雾特征表达具有更高的鲁棒性;使用α-CIOU替换G-IOU作为预测框回归损失,提升预测框的预测精度;剔除分类损失以降低模型的复杂度。实验结果表明,改进后的YOLOv5烟雾检测模型相比于YOLOv5模型检测精度更高,其准确率达到99.35%,召回率达到99.18%,并且检测速度可达46 frame/s,该算法能有效提取烟雾的整体特征,对于复杂场景下的烟雾以及小目标烟雾检测任务更为适用。  相似文献   

10.
特征融合是文本检测算法的重要步骤。为提升文本检测的召回率和准确率,提出一种利用RefineNet(Refinement Network)网络进行特征融合的改进EAST(Efficient and Accurate Scene Text Detector)算法。以ResNet(Residual Network)残差网络作为特征提取层的骨干网络,提取出2-5层的特征图;用RefineNet取代East模型中的维度拼接算法,融合多分辨率特征,将4路特征图合并成1路RCU(Residual Conv Unit)输出;经过卷积、池化和上采样等操作在输出层得到文本框的置信度、文本框的位置信息以及文本框旋转角度,通过非最大值抑制输出检测结果。实验结果表明,在相同实验环境条件下,采用该方法比原EAST方法准确率提高约2百分点,召回率提高约8百分点。  相似文献   

11.
邹斌  张聪 《计算机应用》2023,43(1):61-66
为提高拥挤场景下的人群检测准确率,提出一种基于改进Faster R-CNN的密集人群检测算法。首先,在特征提取阶段添加空间与通道注意力机制,使用加强的双向特征金字塔网络(S-BiFPN)替代原网络中的多尺度特征金字塔(FPN),使网络对重要特征进行自主学习并加强对图像深层特征的提取;其次,引入多实例预测(MIP)算法对实例进行预测,以避免模型对拥挤场景下的目标造成漏检;最后,对模型中的非极大值抑制(NMS)进行优化,并额外增设一个交并比(IoU)阈值,以对检测结果的干扰项进行精确抑制。在开源的密集人群检测数据集上进行测试的结果显示,相较于原Faster R-CNN算法,所提算法的平均精度(AP)提升5.6%,Jaccard指数值提升3.2%。所提算法具有较高检测精度和稳定性,可以满足密集场景人群检测的需求。  相似文献   

12.
针对车牌检测模型泛化性低,在智慧交通的不同应用场景中复用困难的问题,提出一种自适应置信度阈值的非限制场景车牌检测算法。首先,构建多预测头网络模型,利用分割预测头减少模型复用的预处理工作,利用自适应置信度阈值预测头提升模型的检测能力,并利用多尺度融合机制及边框回归预测头来提升模型的泛化能力;其次,采用可微分二值网络训练方法,利用可微分二值变换联合训练分类置信度及置信度阈值来学习模型参数;最后,利用连通感知非极大值抑制(CANMS)方法提升车牌检测的后处理速度,并引入轻量级网络ResNet18作为特征提取骨干网络,以减少模型参数量,进一步地提高检测速度。实验结果表明,在中国城市停车场数据集(CCPD)的6个不同限制条件特点的场景中,所提算法可获得平均99.5%的准确率与99.8%的召回率,并达到每秒70帧的高效检测速率,优于Faster R-CNN、SSD等锚框类算法的性能;在3个补充场景测试集上,所提算法对不同分辨率、不同拍摄距离、不同拍摄俯仰角等非限制场景下的车牌检测精度均高于90%。可见,所提算法在非限制场景下具备良好的检测性能及泛化能力,可以满足模型复用的要求。  相似文献   

13.
在使用探地雷达(GPR)生成的Bscan图像进行地下目标检测时,当前基于深度学习的目标检测网络模型存在训练样本需求量高、耗时长,不能区分目标显著程度,难以识别复杂目标等问题。针对以上问题,提出一种基于直方图的双阈值分割算法。首先,根据地下目标的GPR图像直方图分布特性,快速从直方图中计算出分割地下目标所需的两个阈值;然后,采用支持向量机(SVM)和LeNet的组合分类器模型对分割结果进行分类识别;最后,进行分类结果整合并统计精确度数值。相较于传统的最大类间方差法(Ostu)、迭代法等阈值分割算法,所提算法获得的地下目标分割结果结构更加完整,并且几乎不含噪声。在真实数据集上,所提算法的平均识别准确率达到了90%以上,比仅使用单一分类器的平均识别准确率提高40%以上。实验结果表明,所提算法能够同时有效分割显著和非显著性地下目标,且采用的组合分类器能够获得更好的分类结果,适用于小样本数据集的地下目标自动检测和识别。  相似文献   

14.
刘博  卿粼波  王正勇  刘美  姜雪 《计算机应用》2022,42(7):2052-2057
复杂场景下的群体活动识别是一项具有挑战性的任务,它涉及一组人在场景中的相互作用和相对空间位置关系。针对当前复杂场景下群组行为识别方法缺乏精细化设计以及没有充分利用个体间交互式特征的问题,提出了基于分块注意力机制和交互位置关系的网络框架,进一步考虑个体肢体语义特征,同时挖掘个体间交互特征相似性与行为一致性的关系。首先,采用原始视频序列和光流图像序列作为网络的输入,并引入一种分块注意力模块来细化个体的肢体运动特征;然后,将空间位置和交互式距离作为个体的交互特征;最后,将个体运动特征和空间位置关系特征融合为群体场景无向图的节点特征,并利用图卷积网络(GCN)进一步捕获全局场景下的活动交互,从而识别群体活动。实验结果表明,此框架在两个群组行为识别数据集(CAD和CAE)上分别取得了92.8%和97.7%的识别准确率,在CAD数据集上与成员关系图(ARG)和置信度能量循环网络(CERN)相比识别准确率分别提高了1.8个百分点和5.6个百分点,同时结合消融实验结果验证了所提算法有较高的识别精度。  相似文献   

15.
在拥有海量数据和强大计算能力的人工智能时代,音频场景分类成为了场景理解的重要研究内容之一.针对音频场景分类建模困难和精确率不高的问题,本文提出一种基于卷积神经网络和极端梯度提升算法相结合的系统模型.首先,将预处理后的音频信号转换成梅尔声谱图,然后输入到卷积神经网络中完成抽象特征提取,最后利用极端梯度提升算法进行分类.为了评估模型的有效性,在城市音频场景UrbanSound8K数据集上进行分类性能测试,结果表明,该混合算法模型对音频场景的分类精确率可以达到89%,优于传统的神经网络算法模型,说明该混合模型对音频场景分类问题的有效性.  相似文献   

16.
针对传统的二分类音频隐写分析方法对未知隐写方法的适应性较差的问题,提出了一种基于模糊C均值(FCM)聚类与单类支持向量机(OC-SVM)的音频隐写分析方法。在训练过程中,首先对训练音频进行特征提取,包括短时傅里叶变换(STFT)频谱的统计特征和基于音频质量测度的特征,然后对所提取的特征进行FCM聚类得到C个聚类,最后送入多个超球面的OC-SVM分类器进行训练;检测过程中,对测试音频进行特征提取,根据多个超球面OC-SVM分类器的边界对待测音频进行检测。实验结果表明,该隐写分析方法对于几种典型的音频隐写方法能够较为正确地检测,满容量嵌入时,测试音频的总体检测率达到85.1%,与K-means聚类方法相比,所提方法的检测正确率提高了至少2%。该隐写分析方法比二分类的隐写分析方法更具有通用性,更适用于隐写方法事先未知情况下的隐写音频的检测。  相似文献   

17.
王萍  陈楠  鲁磊 《计算机应用》2023,43(2):529-535
已有跌倒检测工作主要关注室内场景,且大多偏重对人员身体姿态特征进行建模,而忽略了场景背景信息以及人员与地面的交互信息。针对这个问题,从实际电梯场景应用入手,提出一种基于场景先验及注意力引导的跌倒检测算法。首先,利用电梯历史数据,以高斯概率分布建模的方式从人员的活动轨迹中自动化地学习场景先验信息;随后,把场景先验信息作为空间注意力掩膜与神经网络的全局特征融合,以此聚焦地面区域的局部信息;然后,将融合后的局部特征与全局特征采用自适应加权的方式进一步聚合,从而形成更具鲁棒性和判别力的特征;最后,将特征送入由全局平均池化层和全连接层构成的分类模块中进行跌倒类别预测。在自构建的电梯场景Elevator Fall Detection和公开的UR Fall Detection数据集上的实验结果表明,所提算法的检测准确率分别达到了95.36%和99.01%,相较于网络结构复杂的ResNet50算法,分别提高了3.52个百分点和0.61个百分点。可见所构建的高斯场景先验引导的注意力机制可使网络关注地面区域的特征,更有利于对跌倒的识别,由此得到的检测模型准确率高且算法满足实时性应用要求。  相似文献   

18.
叶利华  王磊  赵利平 《计算机应用》2017,37(7):2008-2013
针对低小慢无人机野外飞行场景复杂自主降落场景识别问题,提出了一种融合局部金字塔特征和卷积神经网络学习特征的野外场景识别算法。首先,将场景分为4×4和8×8块的小场景,使用方向梯度直方图(HOG)算法提取所有块的场景特征,所有特征首尾连接得到具有空间金字塔特性的特征向量。其次,设计一个针对场景分类的深度卷积神经网络,采用调优训练方法得到卷积神经网络模型,并提取深度网络学习特征。最后,连接两个特征得到最终场景特征,并使用支持向量机(SVM)分类器进行分类。所提算法在Sports-8、Scene-15、Indoor-67以及自建数据集上较传统手工特征方法的识别准确率提高了4个百分点以上。实验结果表明,所提算法能有效提升降落场景识别准确率。  相似文献   

19.
魏彤  李绪 《机器人》2020,42(3):336-345
现有的同步定位与地图创建(SLAM)算法在动态环境中的定位与建图精度通常会大幅度下降,为此提出了一种基于动态区域剔除的双目视觉SLAM算法.首先,基于立体视觉几何约束方法判别场景中动态的稀疏特征点,接下来根据场景深度和颜色信息进行场景区域分割;然后利用动态点与场景分割结果标记出场景中的动态区域,进而剔除现有双目ORB-SLAM算法中动态区域内的特征点,消除场景中的动态目标对SLAM精度的影响;最后进行实验验证,本文算法在KITTI数据集上的动态区域分割查全率达到92.31%.在室外动态环境下,视觉导盲仪测试中动态区域分割查全率达到93.62%,较改进前的双目ORB-SLAM算法的直线行走定位精度提高82.75%,环境建图效果也明显改善,算法的平均处理速度达到4.6帧/秒.实验结果表明本文算法能够显著提高双目视觉SLAM算法在动态场景中的定位与建图精度,且能够满足视觉导盲的实时性要求.  相似文献   

20.
In order to solve low separability and rough details in scene recognition,remote sensing image scene oriented convolutional neural network recursive recognition model is presented.Firstly,deep convolutional neural network with multi\|convolutional layers and multi\|pooling layers is constructed by multi\|resolution scenes.Then quad\|grids are subdivided to DCNN scene recursive recognition based on Confusion Index (CI)by softmax probability,and multi\|sliding windows are used to tune recursively for accurately locating scene targets.Experimental results show that the proposed model can adapt scene recognition with different scale,and significantly improve the accuracy compared with the commonly used DCNN.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号