首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 457 毫秒
1.
由于自然条件下拍摄的花卉图像背景复杂,而且其存在类内差异性大和类间相似性高的问题,现有主流方法仅依靠卷积模块提取花卉的局部特征难以实现准确的细粒度分类。针对上述问题,本文提出了1种高精度、轻量化的花卉分类方法(ConvTrans-ResMLP),通过结合Transformer模块和残差MLP(multi-layer perceptron)模块实现对花卉图像的全局特征提取,并在Transformer模块中加入卷积计算使得模型仍保留提取局部特征的能力;同时,为了进一步将花卉分类模型部署到边缘设备中,本研究基于知识蒸馏技术实现对模型的压缩与优化。实验结果表明,本文所提出的方法在Oxford 17、Oxford 102和自制的Flowers 32数据集上的准确率分别达98.62%、97.61%和98.40%;知识蒸馏后本文的轻量化模型的大小约为原来的1/18,而准确率仅下降2%左右。因此,本研究能较好地提升边缘设备下花卉细粒度分类的效率,对促进花卉培育的自动化发展具有切实意义。  相似文献   

2.
针对现有行人步态数据集样本较少、多特征融合复杂且识别精准度不高的问题,提出了一种基于残差网络和注意力机制的步态识别算法。首先对每种特征制作标签,然后将表示不同特征的标签做拼接,达到识别多特征的目的。通过迁移ResNet18的预训练模型,并在ResNet18网络第一个和最后一个卷积层后面加入注意力机制,能够加速网络的收敛,提升模型的精准率。〖JP3〗在CASIA-B数据集上进行多次实验,结果表明所提出方法能准确识别行人、状态和不同角度三种步态特征,识别的精准率为97.6%。  相似文献   

3.
通过肉眼识别鱼类疫病依赖于诊断人员的经验,疫病数据存在类间差距较小与识别效率低等细粒度问题。由于Transformer缺乏卷积神经网络(CNN)的归纳偏差,需要大量的数据进行训练;CNN对全局特征提取不足,泛化性能较差等问题限制模型的分类精度。基于特征图对所有像素的全局交互建立算法模型,提出一种基于CNN与Vision Transformer相结合的鱼类疫病识别模型(CViT-FDRM)。首先,搭建鱼类疫病的数据库FishData01;其次,利用CNN提取鱼类图像细粒度特征,采用Transformer模型自注意力机制获取图像全局信息进行并行训练;然后,采用组归一化层将样本通道分组求均值与标准差;最后,采用404张鱼类疫病图像进行测试,CViT-FDRM达到97.02%的识别准确率。在细粒度图像开源数据库Oxford Flowers上的实验结果表明,CViT-FDRM的分类精度优于主流的细粒度图像分类算法,可达95.42%,提高4.84个百分点。CViT-FDRM在细粒度图像识别方面可达到较好的效果。  相似文献   

4.
针对遥感影像场景数据空间信息丰富,冗余地理特征干扰深度神经网络模型的问题,提出在深度残差网络中引入卷积注意力机制(Convolutional Block Attention Module,CBAM)的策略.为验证深度残差网络引入CBAM的有效性,用经典深度残差网络ResNet50和融合注意力机制的深度残差网络CBAM_...  相似文献   

5.
残差神经网络及其在医学图像处理中的应用研究   总被引:2,自引:0,他引:2       下载免费PDF全文
周涛  霍兵强  陆惠玲  任海玲 《电子学报》2020,48(7):1436-1447
残差神经网络(ResNet)是近几年来深度学习研究中的热点,在计算机视觉领域取得较好成就.本文对残差神经网络从以下几个方面进行总结:第一,阐述残差神经网络的基本结构和工作原理;第二,在模型发展方面,以时间为顺序总结了残差神经网络的8种网络模型;第三,在结构优化方面,从残差神经网络的卷积层、池化层、残差单元、全连接层以及整个网络5个方面进行总结;最后,将ResNet应用到医学图像处理领域,主要从图像识别和图像分割2个方面探讨.本文对残差神经网络的原理、模型、结构进行了系统地总结,对残差神经网络的研究发展具有一定的积极意义.  相似文献   

6.
针对腺体图像在自动分割过程中由于多尺度目标和信息丢失影响导致准确率降低的问题,文中采用了一种引入注意力模块的全卷积神经网络模型。该模型遵循编码器-解码器结构,在编码网络中用空洞残差卷积层代替原有的普通卷积层,并添加空洞金字塔池;再在解码网络中加入注意力模块,使模型输出高分辨率特征图,提高对多尺度目标的分割精度。实验结果表明,提出的网络模型参数少分割精度高,对腺体图像的平均分割精度高达89.7%,具有较好的鲁棒性。  相似文献   

7.
针对指静脉提取困难和识别精度不够高等问题,提出了一种基于ResNet改进的手指静脉识别方法.首先,使用深度超参数化卷积(DO-Cony)代替网络中的传统卷积,在减少模型参数的同时提高了网络识别率.然后,将空间注意力模型(SAM)和挤压激励块(SE-Block)融合,应用于改进的残差网络(ResNet)提取图像在通道和空间域上的细节特征.最后,使用标签平滑的交叉熵(LSCE)损失函数来训练模型,实现自动校准网络防止分类出现误差.实验结果表明,改进后的模型不易受到图片质量的影响,在公开数据库FV-USM和SDUMLA上的识别精度分别达到99.4919%和99.4485%,较之前的网络在精度上有明显提高.  相似文献   

8.
张鹏飞  周婷  夏道华  张立 《红外与激光工程》2022,51(9):20210962-1-20210962-10
传统的偏最小二乘法和支持向量机回归等方法在预测光谱对应的火星车地面标样成分元素含量时往往难以获得较高的精度,并难于进一步优化。针对上述问题,在研究中对高维度光谱信息进行三通道折叠以消除其基体效应,并引入在计算机视觉领域表现不俗的ResNet残差网络结构来提取光谱特征并预测对应主成分含量值。文中将ResNet网络结构中的全连接层去除以避免模型参数快速增长,并将网络最后的Softmax分类子层改为线性整流层以便于进行预测,同时添加了指数学习率衰减和Dropout机制以使模型预测结果具备更高的精度与泛化能力。模型各主要元素含量的预测均方根误差相对于线性支持向量机LinearSVR和深度可分离卷积网络Xception分别平均下降了30%和17%。实验结果表明:采用LIBS技术对ChemCam光谱数据进行主成分元素定量分析时,基于ResNet网络建立的回归模型表现出良好的预测特性。  相似文献   

9.
该文提出了一种结合区域和深度残差网络的语义分割模型。基于区域的语义分割方法使用多尺度提取相互重叠的区域,可识别多种尺度的目标并得到精细的物体分割边界。基于全卷积网络的方法使用卷积神经网络(CNN)自主学习特征,可以针对逐像素分类任务进行端到端训练,但是这种方法通常会产生粗糙的分割边界。该文将两种方法的优点结合起来:首先使用区域生成网络在图像中生成候选区域,然后将图像通过带扩张卷积的深度残差网络进行特征提取得到特征图,结合候选区域以及特征图得到区域的特征,并将其映射到区域中每个像素上;最后使用全局平均池化层进行逐像素分类。该文还使用了多模型融合的方法,在相同的网络模型中设置不同的输入进行训练得到多个模型,然后在分类层进行特征融合,得到最终的分割结果。在SIFT FLOW和PASCAL Context数据集上的实验结果表明该文方法具有较高的平均准确率。  相似文献   

10.
合成孔径雷达(SAR)图像自动目标识别中,特征提取和目标分类是两个重要环节。残差网络(ResNet)作为一种较新的卷积神经网络,凭借其对目标特征的自适应学习能力,在SAR图像分类领域表现突出。本文在ResNet基础上,设计出了密集连接型残差网络(DCResNet),用于SAR图像目标识别。DCResNet在残差模块中增加了跳跃性连接的密度,不仅继承了ResNet的易学习的优点,还加强了特征的传播和利用率。除此之外,DCResNet采用平均池化的方式进行下采样,抑制了SAR图像中噪声对识别精度造成的影响。关于SAR图像目标识别的实验结果证明,本文提出的DCResNet与ResNet、AlexNet相比,不仅具有更快的收敛速度和推理速度,而且目标分类的准确率更高。  相似文献   

11.
卷积神经网络(convolutional neural network,CNN)是高光谱图像分类中一种常用的方法,有着较好的分类表现。然而,CNN不可避免地会提取出一些冗余特征,这对高光谱图像分类的准确率造成干扰。此外,高光谱图像分类还面临着同谱异物、同物异谱问题。为了解决以上这些问题,提出了一种基于注意力机制辅助空谱联合残差网络的高光谱图像分类方法。一方面,通过使用注意力机制辅助的3-D、2-D残差网络,同时从光谱维度和空间维度提取空谱联合特征,克服同谱异物、同物异谱问题;另一方面,引入通道注意力机制和空间注意力机制,有效降低了冗余空谱特征的干扰。在2种高光谱数据集上的实验结果表明,相比同类对比算法,所提出的方法具有更优越的分类性能。  相似文献   

12.
本文旨在利用深度学习方法通过面部图像以及抽象特征中的局部信息对吸毒成瘾者的成瘾程度和社区矫正时间进行识别。本文提出了一个基于泰勒展开式的神经网络模型,以深度残差网络作为主干网络,并嵌入泰勒特征图,使模型的训练时间减少、特征提取更加准确从而达到实时性的目标。实验过程中先对ResNet18进行预训练,再对嵌入的泰勒特征模式进行微调,网络末端通过全连接层与Softmax函数的组合进行分类,随机梯度下降的优化目标采用了交叉熵损失。此方法对于吸毒成瘾程度的识别准确度达到80.35%,对于社区矫正时间的识别准确率达到59.31%,该模型性能得到有效提升。  相似文献   

13.
针对卷积神经网络处理图像分类任务时提取特征不充分以及提取到的特征不区分贡献度的问题,提出了一种融合张量合成注意力的改进ResNet-101 (RTSA Net-101)网络模型。首先,利用ResNet-101骨干网络提取图像特征,并在残差网络卷积结构后嵌入张量合成注意力模块,对获取的特征进行三张量积计算,得到注意力特征矩阵;然后,使用Softmax函数对注意力特征矩阵进行归一化,从而为特征分配权重,以区分特征的贡献度;最后,将得到的权重和对应的键值加权求和,获取最终图像完整特征,以提升模型的图像分类精度。在自然图像数据集CIFAR-10、CIFAR-100和街牌号数据集SVHN上进行了对比实验,模型分类准确率分别为96.12%、81.60%、96.67%,图像平均测试运行时间分别为0.0258 s、0.0260 s、0.0262 s。实验结果表明:相比于其他7种先进图像分类模型,RTSA Net-101模型可以获得更高的分类准确率和更短的测试运行时间,且能够有效地增强网络的特征学习能力,具有一定的创新性、高效性。  相似文献   

14.
朱天晓  闫丰亭 《激光与红外》2023,53(8):1177-1185
现有基于深度学习的点云分类网络通常无法有效利用点云特征间的相关信息,并且存在鲁棒较低的问题。为了提高点云分类网络对有效特征的提取能力,增强模型鲁棒性,本文提出了一种结合偏移自注意力机制和残差连接的点云分类网络。首先在PointCNN基础上引入偏移自注意力模块,更好地关注于有效特征;然后引入残差网络的思想,在注意力层增加残差连接,将残差连接和注意力层的输出特征进行融合形成点云特征;最后使用多层感知机对点云特征进行分类。将本文模型与PointNet、PointCNN、DGCNN等其他点云分类模型在ModelNet40数据集上进行对比实验,结果表明本文网络的分类效果更好,获得了最高的分类准确率92.9%,相比于PointCNN提升了0.7%。在鲁棒性实验中,本文网络相比于PointCNN,在稀疏点云上的总体分类准确率提升了2.4%,在噪声点云上提升了11.6%,表明本文网络具有更好的鲁棒性。  相似文献   

15.
圆锥角膜是一种眼部疾病,较早发现并诊断圆锥角膜可控制病情,避免角膜移植,也可以为准分子激光手术进行圆锥角膜排查。然而,目前圆锥角膜的早期诊断较为困难,一种可靠的计算机辅助筛查圆锥角膜诊断方法需求迫切。基于此,首次把引入注意力机制(convolutional block attention module,CBAM)的残差网络(residual neural network,ResNet)模型(CBAM_ResNet50)应用在圆锥角膜辅助诊断中,通过对角膜地形图的原始数据集进行预处理,用其训练CBAM_ResNet50网络,并和未引入注意力机制的ResNet50网络模型进行对比。使用CBAM_ResNet50网络模型准确率达到了98%,比未引入注意力机制ResNet50网络模型准确率提升了3%。CBAM_ResNet50可以较为准确地对圆锥角膜进行分类,能有效辅助医生诊断圆锥角膜。  相似文献   

16.
为了解决皮肤病图像数据集类内差异大、类间差异小、样本数据集小而带来的过拟合问题,提出基于DSception模块和SE模块的轻量型模型.模型选择ResNet50作为基底结构,用DSception模块代替深度残差网络中的卷积池化层,有效地减少模型训练参数,降低时间复杂度,增加了网络的宽度;利用SE模块代替残差网络中的瓶颈结构,减少训练参数的同时,对图像通道维度重标定,强化特征图重要信息,抑制无用信息.实验表明所提模型准确率达到93.3%,对皮肤病的诊断分类有明显的效果.  相似文献   

17.
由于快速的卷积神经网络超分辨率重建算法(FSRCNN)卷积层数少、相邻卷积层的特征信息之间缺乏关联性,因此难以提取到图像深层信息导致图像超分辨率重建效果不佳。针对此问题,该文提出多级跳线连接的深度残差网络超分辨率重建方法。首先,该方法设计了多级跳线连接的残差块,在多级跳线连接的残差块基础上构造了多级跳线连接的深度残差网络,解决相邻卷积层的特性信息缺乏关联性的问题;然后,使用随机梯度下降法(SGD)以可调节的学习率策略对多级跳线连接的深度残差网络进行训练,得到该网络超分辨率重建模型;最后,将低分辨率图像输入到多级跳线连接的深度残差网络超分辨率重建模型中,通过多级跳线连接的残差块得到预测的残差特征值,再将残差图像和低分辨率图像组合在一起转化为高分辨率图像。该文方法与bicubic, A+, SRCNN, FSRCNN和ESPCN算法在Set5和Set14测试集上进行了对比测试,在视觉效果和评价指标数值上该方法都优于其它对比算法。  相似文献   

18.
针对深度学习中残差网络ResNet50存在的信息丢失、特征提取不充分、网络过拟合和训练困难等问题,文中提出一种基于改进ResNet50的图像分类算法。针对残差网络ResNet50在提取特征时存在丢失输入特征映射情况,造成信息丢失的问题,对主干网络中Stage4的下采样块添加平均池化层,进一步提高网络特征提取能力;针对ResNet50训练过程中存在网络过拟合以及泛化能力差的问题,使用标签平滑方法对交叉熵损失函数进行修改,有效缓解网络损失值震荡幅度;针对ResNet50计算量大、训练困难的问题,使用混合精度和余弦退火衰减方法对模型进行训练,在加快网络收敛速度的同时提高模型的分类精度。实验结果表明,与原ResNet50网络相比,文中算法在ImageNet-1k数据集上Top1和Top5的精度分别提升3.2%和1.6%,能够更好地应用于图像分类任务。  相似文献   

19.
为了提高模型在道口环境下的车辆图像的特征提取和识别能力,提出了一种基于改进残差网络的车辆分类方法。首先以残差网络为基础模型,改进了残差块中激活函数的位置,并将残差块中的一般卷积用分组卷积代替,引入注意力机制,用焦点损失函数替换交叉熵损失函数。实验部分先用公开数据集StanfordCars进行预训练,再用自建的道口车辆数据集进行迁移学习。结果表明,改进模型在两个数据集中的准确率均优于几种经典的深度学习模型。  相似文献   

20.
为了解决简单卷积神经网络(convolutional neural network, CNN)不能有效提取与充分利用高光谱图像特征信息的问题,提出了一种 基于残差网络的多层特征匹配生成对抗网络模型。提出的模型引入残差网络以挖掘高光谱图 像的深层特征,生成可分性更高的高光谱图像,并通过一个特征融合层进行特征融合,充分 利用网络的各层特征。提出的算法在Indian Pines、Pavia University和Salinas数据集 上的分类精度分别达到了97.6%,99.3%,99.1%,与径向基函数支持向量机(radial basis function-support vector machine, RBF-SVM)、堆叠自动编码器(stacked autoencoder, SAE)、深度置信网络(deep belief network, DBN)、PPF-CNN (CNN based on pixel-pair feature)、CNN和三维卷积网络 (three-dimensional convolutional neural network, 3D-CNN)方法相比较,其分类精度具有明显的提高。实验结果表明,提出的方法是一种有效 的高光谱图像分类方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号