首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
针对遥感图像中飞机目标检测精度低、检测速度慢、背景复杂等问题,提出了一种基于深度学习的改进YOLOv4目标检测算法。改进YOLOv4的主干特征提取网络,保留高分辨率的特征层,去除了用于检测大目标的特征层,减少语义丢失。在卷积神经网络中使用DenseNet(密集连接网络)加强对飞机目标的特征提取,减少梯度消失问题。对数据集使用[K]-means算法得到效果最佳的先验框数量和尺寸。在RSOD(Remote Sensing Object Detection)数据集和DIOR(Detection In Optical Remote sensing images)数据集上的实验表明,该算法满足实时性的需求,且该算法的精确度达到95.4%,较原算法提升了0.3个百分点;召回率达到86.04%,提升了4.68个百分点;mAP值达到85.52%,提升了5.27个百分点。  相似文献   

2.
仪表检测是智能仪表测试不可或缺的环节,其效果直接决定仪表测试的准确率。针对仪表检测背景复杂且要求速度快的特点,提出一种基于改进YOLOv3的目标检测算法。基于YOLOv3算法,首先使用DenseNet(Densely Connected Convolutional Networks)替换Darknet中的最后2个网络块,以加强模型对特征的重用。然后采用轻量化的Darknet-46作为特征提取网络,并将DenseNet中的卷积神经网络修改为深度可分离卷积网络,再将所有检测层(YOLO Detection)之前的6层卷积修改为2层,以减少模型的参数。同时引入GDIOU(generalized-IOU and distance-IOU, GDIOU)边界框以回归坐标损失,并根据检测需求重新调整损失函数的权重。实验结果表明,相比原算法,改进的YOLOv3算法参数数量减少40%,在仪表检测中的精确率和召回率分别达到95.83%和94.98%,分别提高2.21个百分点和2.09个百分点,平均精度提高2.42个百分点,检测速度提高30.18%。  相似文献   

3.
针对无人机航拍图像中目标小、尺度不一和背景复杂等导致检测精度低的问题,提出一种基于改进YOLOv5的无人机航拍图像目标检测算法DY-YOLOv5。该算法在检测头部分利用具有多重注意力机制的目标检测头方法Dynamic Head,提升检测头在复杂背景下的检测表现。在原模型neck部分增加一次上采样和Concat操作,并执行一个包含极小、小、中目标的多尺度特征检测,提升模型对中、小目标的特征提取能力。引入密集卷积网络DenseNet,将其与YOLOv5s主干网络的C3模块进行融合,提出C3_DenseNet模块,以加强特征传递并预防模型过拟合。在VisDrone2019数据集上应用DY-YOLOv5算法,平均精度均值(mAP)达到了43.9%,较原YOLOv5算法提升了11.4个百分点。召回率(Recall)为41.7%,较原算法提升了9.0个百分点。实验结果证明,改进算法显著提高了无人机航拍图像目标检测的精度。  相似文献   

4.
陈立潮  张雷  曹建芳  张睿 《计算机应用》2020,40(10):2881-2889
为了充分利用图像信息以提高现有交通监控下车型分类的效果,在胶囊网络的基础上增加梯度直方图卷积(HOG-C)特征提取方法,提出HOG-C特征的胶囊网络模型——HOG-C CapsNet。首先,使用梯度统计特征提取层对图像中的梯度信息进行统计,构建方向梯度直方图(HOG)特征图;其次,使用卷积层提取出图像的颜色信息,把提取出的颜色信息与HOG特征图融合构成HOG-C特征图;最后,输入卷积层提取HOG-C特征图的抽象特征,并通过胶囊网络对提取的抽象特征进行具有三维空间特征表达的胶囊封装,使用动态路由算法实现车型分类。在BIT-Vehicle数据集上对该模型和其他相关模型进行的对比实验中,该模型得到98.17%的准确率、97.98%的平均精确率均值(MAP)、98.42%的平均召回率均值(MAR)和98.20%的综合评价指标。实验结果表明,该模型在交通监控下的车型分类上具有更好的效果。  相似文献   

5.
为提高血管内超声(Intravenous Ultrasound,IVUS)图像在动脉粥样硬化识别准确率,实现更高效的计算机辅助诊断,提出综合使用图像增强、特征提取和基于批量归一化(Batch Normalization,BN)优化残差网络的血管内超声图像识别方法。使用Sobel算子在原图像水平和垂直方向进行边缘检测,在此基础上获得锐化增强图像,结合使用灰度共生矩阵提取纹理特征信息;为丰富网络的特征信息,防止梯度消失,使用残差学习对卷积神经网络进行改进。批量归一化通过拟合数据特征分布减少内部协变量转移加速网络收敛。实验结果表明上述方法相比较传统机器学习与改进前的卷积神经网络识别错误率平均降低了58.23%。  相似文献   

6.
针对古代壁画图像数量少、质量差、特征提取困难和存在壁画文本与绘画风格相似等问题,提出了一种融合迁移学习的Inception-v3模型来对古代壁画的朝代进行识别与分类。首先,将Inception-v3模型在ImageNet数据集上进行预训练以得到迁移模型;然后,将迁移模型在小型壁画数据集上进行参数微调后对壁画图像提取高层特征;其次,增加两个全连接层来增强特征表达能力,并用颜色直方图与局部二值模式(LBP)纹理直方图提取壁画的艺术特征;最后,将高层特征与艺术特征相融合,用Softmax分类器进行壁画的朝代分类。实验结果表明,所提出的模型训练过程稳定,在构造的小型壁画数据集上,其最终准确率为88.70%,召回率为88.62%,F1值为88.58%,以上各评价指标均优于AlexNet、VGGNet等经典网络模型;与LeNet-5、AlexNet-S6等改进的卷积神经网络模型相比,该模型对各朝代类别准确率平均提升了至少7个百分点。可见,该模型泛化能力强,不易出现过拟合现象,能有效识别壁画所属朝代。  相似文献   

7.
针对现有的手写数学公式识别(HMER)方法经过卷积神经网络(CNN)多次池化后,图像分辨率降低、特征信息丢失,从而引起解析错误的问题,提出基于注意力机制编码器-解码器的HMER模型。首先,采用稠密卷积网络(DenseNet)作为编码器,使用稠密连接加强特征提取,促进梯度传播,并缓解梯度消失;其次,采用门控循环单元(GRU)作为解码器,并引入注意力机制,将注意力分配到图像的不同区域,从而准确地实现符号识别和结构分析;最后,对手写数学公式图像进行编码,将编码结果解码为LaTeX序列。在在线手写数学公式识别竞赛(CROHME)数据集上的实验结果表明,所提模型的识别率提升到40.39%,而在3个级别的允许误差范围内,识别率分别提升到52.74%、58.82%和62.98%。相较于双向长短期记忆(BLSTM)网络模型,所提模型的识别率提高了3.17个百分点;而在3个级别的允许误差范围内,识别率分别提高了8.52、11.56和12.78个百分点。可见,所提模型能够准确地解析手写数学公式图像,生成LaTeX序列,提升识别率。  相似文献   

8.
陈立潮  张雷  曹建芳  张睿 《计算机应用》2005,40(10):2881-2889
为了充分利用图像信息以提高现有交通监控下车型分类的效果,在胶囊网络的基础上增加梯度直方图卷积(HOG-C)特征提取方法,提出HOG-C特征的胶囊网络模型——HOG-C CapsNet。首先,使用梯度统计特征提取层对图像中的梯度信息进行统计,构建方向梯度直方图(HOG)特征图;其次,使用卷积层提取出图像的颜色信息,把提取出的颜色信息与HOG特征图融合构成HOG-C特征图;最后,输入卷积层提取HOG-C特征图的抽象特征,并通过胶囊网络对提取的抽象特征进行具有三维空间特征表达的胶囊封装,使用动态路由算法实现车型分类。在BIT-Vehicle数据集上对该模型和其他相关模型进行的对比实验中,该模型得到98.17%的准确率、97.98%的平均精确率均值(MAP)、98.42%的平均召回率均值(MAR)和98.20%的综合评价指标。实验结果表明,该模型在交通监控下的车型分类上具有更好的效果。  相似文献   

9.
针对壁画图像自身存在多义性、不同朝代的壁画绘画风格存在差异性和传统的人工直接参考壁 画文本或历史文献识别壁画朝代存在费时、费力等问题,提出了适应性增强胶囊网络(AEC)的古壁画朝代识别 算法,对莫高窟壁画自动进行朝代识别。在原生胶囊网络基础上,首先引入预先卷积结构对壁画图像进行高层 特征提取;其次增加均层激活增强模型的拟合性能;最后对胶囊网络进行适应性增强,在提高梯度平滑度的基 础上利用自适应学习率进行优化提高模型的分类精度。实验结果表明在所构造的 DH1926 壁画数据集上,AEC 模型准确率为 84.44%、平均精确度(MAP)为 82.36%、平均召回率(MAR)为 83.75%、综合评价指标为 83.96%。 与改进的卷积神经网络(CNN)和原生胶囊网络等其他网络结构相比,各项评价指标均有 3%以上的提升,有较 强的拟合性能,能够多层次提取壁画的丰富特征,表达图像更细节的语义信息,在莫高窟壁画朝代识别中具有 更高的准确度和更好的鲁棒性,有一定的应用价值与研究意义。  相似文献   

10.
徐代  岳璋  杨文霞  任潇 《计算机应用》2020,40(5):1315-1321
为了进一步提高对拼接、缩放旋转、复制粘贴三种主要篡改手段的识别准确率,增强算法普适性,提出了一个基于三向流特征提取的卷积神经网络篡改图像识别系统。首先,分别根据图像局部彩色不变量特性比较特征子块相似度,根据噪声相关性比较篡改区域边缘的噪声相关系数,以及根据图像重采样痕迹计算子块标准偏差对比度,完成了对图像RGB流、噪声流和信号流的特征提取;然后,通过多线性池化,结合改进的分段AdaGrad梯度算法,实现了特征降维和参数自适应更新;最后,通过网络训练和分类,完成了对拼接、缩放旋转、复制粘贴这三种主要的图像篡改手段的识别与相应的篡改区域的定位。为衡量所提模型的效果,在VOC2007和CIFAR-10两个数据集上进行了实验。在约9000张图像上的实验结果表明,该模型对拼接、缩放旋转、复制粘贴这三种篡改手段均能进行较准确的识别与定位,识别率分别为0.962、0.956和0.935。与对照文献的双向流特征提取方法相比,该模型的识别率分别提高了1.050%、2.137%、2.860%。三向流特征提取模型丰富了卷积神经网络对图像的特征信息采集,提高了网络的学习性能与识别精度,同时改进的梯度算法通过分段控制参数学习率的下降速度,降低了过拟合,减少了收敛震荡,提高了收降速度,实现了算法的优化设计。  相似文献   

11.
针对白细胞数据样本少、类间差别小及目标尺寸小导致的检测精度低、效果不佳等问题,提出一种基于改进YOLOv5的白细胞检测算法YOLOv5-CHE.在主干特征提取网络的卷积层中添加坐标注意力机制,以提升算法的特征提取能力;使用四尺度特征检测,重新获取锚点框,增加浅层检测尺度,来提高小目标的识别精度;改变边框回归损失函数,以...  相似文献   

12.
针对中华传统刺绣工艺传承保护问题中的分类任务,传统的刺绣分类方法存在耗时长、精度低以及需要大量掌握专业知识的人力资源等问题;设计了一种基于改进DenseNet的刺绣图像分类识别方法;构建刺绣图像分类识别数据集;采用局部二值模式LBP、Canny算子边缘提取以及Gabor滤波等方式提取纹理特征,将不同特征图与原图合并为四至六通道图像数据集送入网络进行消融试验,扩充了数据集宽度;为稳定训练过程,加速损失收敛速度,提出引入SPP (spatial pyramid pooling)结构优化模型;为提高分类识别精度使用Leaky ReLU激活函数优化ReLU函数;实验结果表明基于改进DenseNet的刺绣图像分类识别方法可解决传统刺绣图像分类方法中存在的问题,改进后的刺绣图像分类模型与基准模型相比准确率提高了8.1%,高达97.39%。  相似文献   

13.
针对传统卷积神经网络对多传感器指纹识别泛化能力降低、准确率不高的问题,提出改进的Stacking集成学习算法。首先将AlexNet进行改进,在AlexNet中引入深度可分离卷积减少参数量,加快训练速度;引入空间金字塔池化,提升网络获取全局信息的能力;引入批归一化,加快网络收敛速度,同时提升网络在测试集上的准确率;使用全局平均池化替代全连接层,防止过拟合。然后将DenseNet和改进的AlexNet 2种卷积神经网络作为Stacking的基学习器对指纹进行分类,获得预测结果。最后对相同基学习器训练得到的各个模型,根据预测精度对各预测结果赋权,得到的预测结果再由元分类器分类。改进的Stacking算法在多传感器指纹数据库上进行实验,最终识别准确率达98.43%,相对AlexNet提升了20.05%,相对DenseNet提升了4.25%。  相似文献   

14.
针对传统模板分析在实际攻击中的难解问题,重点研究了在图像识别领域具有优异特征提取能力的VGGNet网络模型,提出了一种基于VGGNet网络模型的模板攻击新方法。为了防止信号质量对模型准确率带来较大影响,采用相关性能量分析方法对采集到的旁路信号质量进行了检验;为了适应旁路信号数据维度特征,对网络模型结构进行适度调整;在网络训练的过程中,对梯度下降速率较慢、梯度消失、过拟合等问题进行了重点解决,并采用五折交叉验证的方法对训练好的模型进行验证。最终实验结果表明,基于VGGNet模型的测试成功率为92.3%,较传统的模板攻击效果提升了7.7%。  相似文献   

15.
尚常军  丁瑞 《计算机应用》2016,36(10):2885-2889
针对复杂环境下的深度图像手势特征提取信息冗余量大、编码不稳定等问题,提出了一种改进的基于曲率局部二值模式(LBP)的深度图像手势特征提取算法。该算法首先通过坐标转换将分割出的手势深度数据转换为点云数据;其次利用移动最小二乘法对手势点云数据进行曲面拟合;然后计算出能够更加准确描述物体三维表面几何信息特征的高斯曲率;最后利用改进的LBP均匀模式对高斯曲率数据进行编码形成特征向量。在美国手语(ASL)手势数据库上该算法的平均识别率达到了92.1%,与3D局部二值模式(3DLBP)和梯度LBP相比分别提高了18.5个百分点和13.7个百分点。实验结果表明,该算法可以区分外部轮廓相似但内部结构不同的手势,有效提高了在描述手势深度图像内部细节方面的准确性。  相似文献   

16.
端到端双通道特征重标定DenseNet图像分类   总被引:1,自引:0,他引:1       下载免费PDF全文
目的 针对密集连接卷积神经网络(DenseNet)没有充分考虑通道特征相关性以及层间特征相关性的缺点,本文结合软注意力机制提出了端到端双通道特征重标定密集连接卷积神经网络。方法 提出的网络同时实现了DenseNet网络的通道特征重标定与层间特征重标定。给出了DenseNet网络通道特征重标定与层间特征重标定方法;构建了端到端双通道特征重标定密集连接卷积神经网络,该网络每个卷积层的输出特征图经过两个通道分别完成通道特征重标定以及层间特征重标定,再进行两种重标定后特征图的融合。结果 为了验证本文方法在不同图像分类数据集上的有效性和适应性,在图像分类数据集CIFAR-10/100以及人脸年龄数据集MORPH、Adience上进行了实验,提高了图像分类准确率,并分析了模型的参数量、训练及测试时长,验证了本文方法的实用性。与DenseNet网络相比,40层及64层双通道特征重标定密集连接卷积神经网络DFR-DenseNet(dual feature reweight DenseNet),在CIFAR-10数据集上,参数量仅分别增加1.87%、1.23%,错误率分别降低了12%、9.11%,在CIFAR-100数据集上,错误率分别降低了5.56%、5.41%;与121层DFR-DenseNet网络相比,在MORPH数据集上,平均绝对误差(MAE)值降低了7.33%,在Adience数据集上,年龄组估计准确率提高了2%;与多级特征重标定密集连接卷积神经网络MFR-DenseNet(multiple feature reweight DenseNet)相比,DFR-DenseNet网络参数量减少了一半,测试耗时约缩短为MFR-DenseNet的61%。结论 实验结果表明本文端到端双通道特征重标定密集连接卷积神经网络能够增强网络的学习能力,提高图像分类的准确率,并对不同图像分类数据集具有一定的适应性、实用性。  相似文献   

17.
通过对原SSD(Single Shot Multibox Detector)模型的研究与分析,针对其对小目标检测能力较弱的问题,提出了一种基于密集模块与特征融合操作的改进模型。该模型以Inception-ResNet-V2与DenseNet为基础,吸取了inception模块中稀疏连接与密集网络中密集连接的研究思路,将两种方法融合在一起,提出了Inception-Dense特征提取结构。在多尺度检测的部分,借鉴并改进了特征金字塔的特征融合模块来加强对中小目标的检测能力。根据改进模型及实验数据集的相关特性,对默认框的映射机制也进行了重新设定。结果表明:该方法在Kitti数据集上的平均测试精确度(mAP)为83.8%;识别率相比于原SSD模型的72.8%,提升了11个百分点。FPS方面也有接近38%的提升,从原来的39提升到了54。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号