首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对深度学习中残差网络ResNet50存在的信息丢失、特征提取不充分、网络过拟合和训练困难等问题,文中提出一种基于改进ResNet50的图像分类算法。针对残差网络ResNet50在提取特征时存在丢失输入特征映射情况,造成信息丢失的问题,对主干网络中Stage4的下采样块添加平均池化层,进一步提高网络特征提取能力;针对ResNet50训练过程中存在网络过拟合以及泛化能力差的问题,使用标签平滑方法对交叉熵损失函数进行修改,有效缓解网络损失值震荡幅度;针对ResNet50计算量大、训练困难的问题,使用混合精度和余弦退火衰减方法对模型进行训练,在加快网络收敛速度的同时提高模型的分类精度。实验结果表明,与原ResNet50网络相比,文中算法在ImageNet-1k数据集上Top1和Top5的精度分别提升3.2%和1.6%,能够更好地应用于图像分类任务。  相似文献   

2.
3.
针对遥感影像场景数据空间信息丰富,冗余地理特征干扰深度神经网络模型的问题,提出在深度残差网络中引入卷积注意力机制(Convolutional Block Attention Module,CBAM)的策略.为验证深度残差网络引入CBAM的有效性,用经典深度残差网络ResNet50和融合注意力机制的深度残差网络CBAM_...  相似文献   

4.
为实现肺癌病理图像的准确分类,提出一种基于双重注意力和动态ReLU的残差网络DrANeT,在网络模型中嵌入CBAM双重注意力机制,提高网络提取有用特种图的能力;使用动态ReLU替换网络中所使用的普通ReLU,可以根据不同特征图自动调整参数,提高模型性能。实验结果表明,该网络模型在肺良性图像、肺腺癌图像和肺鳞状细胞癌图像准确率分别达到100.00%、99.96%、99.96%,整个数据集准确率达到99.96%。因此,表明本实验所改进的网络模型可以有效地提高肺癌病理图像分类的准确率。  相似文献   

5.
传统的花卉图像分类都是基于人工手动选择单一特征或者多特征融合再分类,这种方法普遍存在精度低、成本高、泛化能力弱等缺陷,针对目前深度学习在细粒度图像分类中的应用,提出一种基于残差网络、实现端到端的花卉图像分类方法。首先以ResNet18为基础模型,其次将全卷积结构的思想应用于网络模型中,将ResNet18的全连接层替换成卷积层以优化网络模型,最后在优化后的ResNet18中融入混合域注意力机制,由Softmax层进行分类。本文选取了Oxford17flowers和Oxford102flowers两个花卉图像数据集做对比试验,与前人的花卉图像分类方法对比,本文的方法取得了理想的效果,在Oxford17和Oxford102上分别取得了99.26% 以及99.02%的正确率,提出了一种基于注意力的残差结构改进方法,相较于前人的花卉图像分类方法,该方法能够更有效地提取关键信息的特征,抑制干扰区域的信息,对花卉图像分类具有显著性效果,适用于细粒度图像分类。  相似文献   

6.
针对现有噪声图像分类效率低的问题,提出一种改进的Darknet噪声图像分类算法。去掉Darknet网络输出部分的1×1卷积层,将第19层卷积核数量改为4,在网络最后加上Softmax层,实现网络分类功能。在网络passthrough层和第6~8层后分别引入Dropout层,在卷积层中引入L2正则化来避免网络过拟合。将网络第10层和第11层,第12层和第13层,第15层和第16层,第17层和第18层改为4个残差块,解决反向传播权值更新时梯度消失问题。从CIFAR-10数据集上取20 000张图片,经128×128尺寸变换后分别添加高斯噪声、泊松噪声、盐噪声和斑点噪声,对每张图片依类别进行One-hot编码,最后将图片和标签制作成训练集、验证集和测试集。4种算法实验结果对比表明,改进的Darknet网络对彩色噪声图像分类准确率可达0.904,远高于其他3种算法分类准确率。  相似文献   

7.
袁芊芊  谢维信 《信号处理》2022,38(12):2594-2605
面向高光谱图像分类的许多深度学习算法中,由于提取的空谱特征表示鉴别性不足,其模型的分类性能有待提高。针对该问题,本文提出了一种基于空谱注意力机制及预激活残差网络的高光谱图像分类算法。首先,设计了基于空谱注意力机制的空谱特征提取模块,对空谱特征进行重校准,为空谱特征在后续联合学习时能专注于更具辨别力的通道和空间位置提供保证;其次,设计了基于预激活残差网络的空谱特征联合学习模块,其中预激活残差网络改进了原始残差构建块的网络结构,从而能在利用注意力机制重校准的空谱特征的联合学习时捕获更具鉴别性的深层空谱特征,以提高分类器的分类性能。实验结果表明,和已有的一些高光谱图像分类算法相比,所提出的算法的分类准确率更高,表明该算法能有效地获得判别能力更强的空谱特征表示。   相似文献   

8.
卷积神经网络(convolutional neural network,CNN)是高光谱图像分类中一种常用的方法,有着较好的分类表现。然而,CNN不可避免地会提取出一些冗余特征,这对高光谱图像分类的准确率造成干扰。此外,高光谱图像分类还面临着同谱异物、同物异谱问题。为了解决以上这些问题,提出了一种基于注意力机制辅助空谱联合残差网络的高光谱图像分类方法。一方面,通过使用注意力机制辅助的3-D、2-D残差网络,同时从光谱维度和空间维度提取空谱联合特征,克服同谱异物、同物异谱问题;另一方面,引入通道注意力机制和空间注意力机制,有效降低了冗余空谱特征的干扰。在2种高光谱数据集上的实验结果表明,相比同类对比算法,所提出的方法具有更优越的分类性能。  相似文献   

9.
针对弹载武器可见光图像与红外融合高层特征融合不足,目标细节表现不突出导致打击目标检测失败的问题,提出了一种基于注意力机制的残差密集网络的红外与可见光图像融合模型。受残差网络和密集网络的启发,设计了一种基于残差密集网络的图像融合算法解决融合图像细节纹理信息不足的问题。采用注意力机制有效提取目标特征区域的关键信息,通过局部残差融合和全局残差融合算法保留目标的纹理细节。此外,为了更好地保留可见光图像中的细节纹理,对目标细节特征发现时增强特征抑制。实验证明,该算法能够增强目标细节特征,同时有效保存了其轮廓信息,与不采用注意机制提高相比,融合精度提高了5%,运算量下降2%左右。  相似文献   

10.
针对SENet的通道注意力机制特征提取单一和分割的幼苗数据集图片存在部分缺失的难点问题,设计了一种基于双通道注意力机制的残差网络。该网络融合通道注意力机制和空间注意力机制模块,可同时获得通道和空间维度特征权重,提升网络的特征学习能力。提出了一种随机擦除方法,来解决分割样本数据中目标部分缺失的难点问题。在自制的穴盘幼苗Plant_seed数据集上的实验结果表明,在ResNet34残差模块和conv*_x模块之间均引入注意力机制模块的改进网络ResNet34+CBAM_basic_conv的准确率最优,达到93.8%,同时对数据集部分图片进行随机擦除后,模型分类的错误率下降,验证了所提方法的优异性能。  相似文献   

11.
为确保源图像中的显著区域在融合图像保持显著,提出了一种自注意力引导的红外与可见光图像融合方法。在特征学习层引入自注意力学习机制获取源图像的特征图和自注意力图,利用自注意力图可以捕获到图像中长距离依赖的特性,设计平均加权融合策略对源图像的特征图进行融合,最后将融合后的特征图进行重构获得融合图像。通过生成对抗网络实现了图像特征编码、自注意力学习、融合规则和融合特征解码的学习。TNO真实数据上的实验表明,学习到注意力单元体现了图像中显著的区域,能够较好地引导融合规则的生成,提出的算法在客观和主观评价上优于当前主流红外与可见光图像融合算法,较好地保留了可见光图像的细节信息和红外图像的红外目标信息。  相似文献   

12.
针对部分基于深度学习的光学遥感图像配准模型配准精度较低、用时较长的问题,提出了一种结合了注意力块和残差网络的配准方法。首先使用随机颜色抖动增强数据,然后采用改进的双注意力块过滤图像中的无关信息和干扰信息,紧接着采用改进的残差网络提取过滤后图像的高、低维特征信息并进行融合。最后利用双向相关特征匹配得到两个匹配关系,并计算合成图像的匹配参数,再通过仿射变换完成图像配准。在四个数据集上的实验结果表明,平均配准精度提升了6.87%,而平均配准时间仅为1.23秒,提高了光学遥感图像配准的精度与效率。  相似文献   

13.
近年来,图卷积网络因其特征聚合的机制,能够同时对单个节点以及近邻节点的特征进行表示,被广泛应用于高光谱图像的分类任务。然而,高光谱图像(HSI)中常存在波段冗余、同物异谱等问题,使得直接利用原始光谱特征构建的初始图可靠性不足,从而导致高光谱图像的分类精度低。为此,该文提出一种基于光谱注意力图卷积网络(SAGCN)的高光谱图像半监督分类方法。首先,利用注意力模块对光谱的局部与全局信息进行交互,以增加重要光谱的权重、减小冗余波段以及噪声波段的权重,从而实现光谱的自适应加权;然后,针对光谱加权处理后的高光谱图像,通过空间-光谱相似性度量构建更为准确的近邻矩阵;最后,通过图卷积对标记和无标记样本进行有效的特征聚合,并使用标记样本的聚合特征训练网络。在Indian Pines, Kennedy Space Center和Botswana 3个真实高光谱图像数据集上的实验结果验证了所提方法的有效性。  相似文献   

14.
为识别表格中单元格的类别,提出了多特征融合的表格单元格分类模型.首先分别基于词向量和字向量从不同粒度对单元格文本进行表示,并通过拼接的方式实现字词向量的融合,然后通过TextCNN进行单个单元格文本特征提取;其次,构建表格空间坐标系,获取每个单元格的空间特征,并在此基础上融合单元格的文本特征与空间位置特征,采用自注意力...  相似文献   

15.
针对ML-GCN中全局最大池化所获得的图像特征对特定类别在不同图像区域上缺乏针对性和丢失图像局部特征信息的问题,提出了类特定残差注意力(CSRA)模块.该模块可以有效捕获不同类别对象所占据的不同空间区域.此外,将提出的类特定残差注意力与图卷积神经网络相结合,提出了基于多头类特定残差注意力与图卷积的多标签图像分类算法(ML-CSRA).首先利用卷积神经网络提取通用的图像特征图,之后将提出的类特定残差注意力扩展为多头形式,并将其应用于通过卷积神经网络提取到的通用图像特征图,提取各个区域对应不同类别的特征.最后将图卷积神经网络提取的标签相关特征与多头类特定残差注意力提取的图像特征结合,得到最后的多标签图像分类结果.在MS-COCO 2014和VOC-2007数据集上的实验结果表明提出算法在所有评估指标上都优于目前已有算法.  相似文献   

16.
图像去雾工作目前还存在真实数据集过少、局部对比度失衡和去雾图像失真等问题。针对去雾图像失真这一问题,提出一种新型去雾网络模型(Densely Resnet with SKattention-Dehaze Net,DRS-Dehaze Net)。首先带雾图像经预处理模块转换为多角度特征输入图,然后设计密集残差架构并引入注意力机制完成特征信息的提取与再分配,最后将特征融合,输出无雾图像。实验结果表明,所提算法相比于其他对比算法有着较好的去雾效果,有效改善了去雾图像失真问题,且在一定程度上对图像的清晰度进行了提升。  相似文献   

17.
针对以往的图像分类方法利用手工提取的特征(或通过神经网络提取的特征)、空间信息关注不足等问题,文章提出一种基于空间注意力的图像分类网络。该网络利用空间注意力模块,对深度网络提取的视觉特征进行空间约束。利用特征的空间信息,使得网络能够对特征在空间上的重要性加以区分,从而使其更具判别性。采用CIFAR-10和CIFAR-100测试集分别进行测试,测试结果表明,该文提出的图像分类网络的图像分类效果明显优于其他深度学习方法。  相似文献   

18.
多标签文本分类的结果很大程度上受到标签相关性的影响.为了更加细致地处理标签相关性问题,提出一种融合注意力机制的多标签文本分类方法.首先,将文本和标签预处理后,对标签输入采用两种不同的嵌入方式提取特征;其次,运用注意力机制处理信息,针对文本和标签信息,自注意力机制进行特征处理,标签注意力机制和交互注意力机制进行依赖关系处理,进而得到两种不同状态下的表示方式;最后,通过两次融合,充分表示文本标签信息,得到较好的标签分类结果.实验结果显示,较之于基线方法,在精度和归一化折损累计增益上,该方法数据总体有所提高.由此,该方法可以有效地融合文本和标签信息,缓解标签相关性问题,有利于提升多标签文本分类任务性能.  相似文献   

19.
细粒度图像具有不同子类间差异小、相同子类内差异大的特点。现有网络模型在处理过程中存在特征提取能力不足、特征表示冗余和归纳偏置能力弱等问题,因此提出一种改进的Transformer图像分类模型。首先,利用外部注意力取代原Transformer模型中的自注意力,通过捕获样本间相关性提升模型的特征提取能力;其次,引入特征选择模块筛选区分性特征,去除冗余信息,加强特征表示能力;最后,引入融合的多元损失,增强模型归纳偏置和区分不同子类、归并相同子类的能力。实验结果表明,所提方法在CUB-200-2011、Stanford Dogs和Stanford Cars三个细粒度图像数据集上的分类精度分别达89.8%、90.2%和94.7%,优于多个主流的细粒度图像分类方法,分类结果较好。  相似文献   

20.
陈志远  金炜  李纲 《光电子.激光》2020,31(10):1044-1053
硬性渗出物(Hard Exudate,HE)对糖尿病视网膜病 变(Diabetic Retinopathy,DR)的早期诊断具有重要意义,从彩色眼底图像中准确检测出HE 是诊断和筛查DR的重要步骤。针对以往自动检测方法中存在的分割效果不佳和对小目标误检 率高的问题,本文在经典U-Net生成网络的基础上,引入注意力残差链式融合机制,构造出 一种适用于视网膜HE检测的注意力残差链式融合生成对抗网络(Chain fusion of attention residuals GAN,CFAR-GAN)。该网络在生成网络编码过程的每个子模块后添加一个残差网 络(Residual Network,ResNet)结构,并采用带有残差连接的卷积层链(Residual convolut ional layer path,Res path)建立不同层间的跳跃连接,同时将全局最大池化注意力机制 用于刻画不同深度特征的权重,以防止训练过程的过拟合从而提高网络的泛化能力。将CFAR -GAN用e-ophtha EX数据库的训练集进行训练,在其测试集上,检测敏感性、PPV和F-sco re分别为92.5%、88.7%和90.6%;将训练好的网络在另一个独立的DIARETDB1数据库上进行测试,敏感性、特异性和 准确性分别为100%、98.5%和99.1%,表明本文所提出的方法具有 理想的泛化能力,这对于准确高效地检测眼底图 像中的HE,实现DR早期的自动诊断具有积极 意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号