首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
针对细粒度车型中子车系间识别率低的问题,同时为了增强卷积神经网络的表征能力,提出融合独立组件的残差网络(IC-ResNet)模型。优化ResNet网络,通过改进下采样层,减少特征信息损失,接着使用中心损失函数和Softmax损失函数联合学习策略,增强模型的类内聚性。在卷积层前引入独立组件(IC)层,获得相对独立的神经元,增强网络独立性,提高模型的特征表示能力,从而对细粒度车型实现更准确的分类。仿真实验表明,该模型在Stanford cars-196数据集上的识别准确率达到94.7%,与其他模型相比,实现了最优效果,从而验证了该车型识别模型的有效性。  相似文献   

2.
针对地理空间遥感图像中检测目标存在多尺度特性、形态多变以及小目标判别特征过少等造成检测识别精度不高的问题,提出了基于多尺度下遥感小目标多头注意力检测算法YOLO-StrVB。对网络结构进行重构,搭建多尺度网络模型,增加目标检测层,提高特征提取网络下遥感小目标模型不同尺度下的检测能力;加入双向特征金字塔网络(Bi-FPN)进行多尺度特征融合,提高双向跨尺度连接和加权特征融合;在YOLOv5网络末端融合Swin Transformer多头注意力机制块,提升感受野适应目标识别任务的多尺度融合关系,优化主干网络;使用Varifocal loss对网络进行训练,提升遥感密集检测小目标的存在置信度和定位精度,并选用CIoU作为边界框回归的损失函数,提高感知分类得分(IACS)的边框回归精度。通过在遥感目标数据集NWPU VHR-10上的实验验证,对比YOLOv5原模型的mAP提高了3.05个百分点,能有效提高小目标的检测精度,达到了对地理空间遥感图像中小目标检测的鲁棒性。  相似文献   

3.
目的 食物图片具有结构多变、背景干扰大、类间差异小、类内差异大等特点,比普通细粒度图片的识别难度更大。目前在食物图片识别领域,食物图片的识别与分类仍存在精度低、泛化性差等问题。为了提高食物图片的识别与分类精度,充分利用食物图片的全局与局部细节信息,本文提出了一个多级卷积特征金字塔的细粒度食物图片识别模型。方法 本文模型从整体到局部逐级提取特征,将干扰较大的背景信息丢弃,仅针对食物目标区域提取特征。模型主要由食物特征提取网络、注意力区域定位网络和特征融合网格3部分组成,并采用3级食物特征提取网络的级联结构来实现特征由全局到局部的转移。此外,针对食物图片尺度变化大的特点,本文模型在每级食物特征提取网络中加入了特征金字塔结构,提高了模型对目标大小的鲁棒性。结果 本文模型在目前主流公开的食物图片数据集Food-101、ChineseFoodNet和Food-172上进行实验,分别获得了91.4%、82.8%、90.3%的Top-1正确率,与现有方法相比提高了1%~8%。结论 本文提出了一种多级卷积神经网络食物图片识别模型,可以自动定位食物图片区分度较大的区域,融合食物图片的全局与局部特征,实现了食物图片的细粒度识别,有效提高了食物图片的识别精度。实验结果表明,该模型在目前主流食物图片数据集上取得了最好的结果。  相似文献   

4.
针对细粒度图像分类任务中难以对图中具有鉴别性对象进行有效学习的问题,本文提出了一种基于注意力机制的弱监督细粒度图像分类算法.该算法能有效定位和识别细粒度图像中语义敏感特征.首先在经典卷积神经网络的基础上通过线性融合特征得到对象整体信息的表达,然后通过视觉注意力机制进一步提取特征中具有鉴别性的细节部分,获得更完善的细粒度特征表达.所提算法实现了线性融合和注意力机制的结合,可看作是多网络分支合作训练共同优化的网络模型,从而让网络模型对整体信息和局部信息都有更好的表达能力.在3个公开可用的细粒度识别数据集上进行了验证,实验结果表明,所提方法有效性均优于基线方法,且达到了目前先进的分类水平.  相似文献   

5.
针对现有行人属性识别方法模型复杂,识别性能较低的问题,提出一种端到端的行人属性识别方法。构建注意力机制修正网络,在主干网络的不同卷积层后添加注意力分支,以提取注意力特征关注属性相关空域;提出一种注意力机制辅助训练方法,将注意力分支与主网络在预测级进行损失融合,通过梯度反向传播修正主网络权重,实现主网络的有效训练;在预测阶段,利用权重修正后的主网络实现属性识别。在RAP数据集上的实验结果表明,提出方法在没有额外辅助信息、不增加主网络体积和计算量的情况下,提升了行人属性识别性能。  相似文献   

6.
本文研究医疗简历筛选,提出了基于多级特征表征与级联模型的方法.首先,面向医疗简历教育与工作背景、科研能力、业务能力等多组与多层特征表征问题,提出基于注意力网络的多级特征表征方法,实现特征级、特征组级与特征组组合等多级表征的融合.其次,提出了级联分类模型建模细粒度筛选过程,将现有简单的"通过与不通过"粗略筛选改进为"优秀...  相似文献   

7.
张再腾  张荣芬  刘宇红 《控制与决策》2022,37(10):2487-2496
近年来,随着深度学习的蓬勃发展,行人属性识别得到了广泛的研究.但是,由于属性复杂且多样化、图像质量差、视角遮挡等困扰,难以捕获图像中的细粒度属性特征,具有很大的挑战性.对此,基于深度学习,提出多尺度残差注意网络(MRAN)用于行人属性识别,以Resnet50为主体架构,使用轻量级的金字塔卷积提供不同内核大小的并行卷积以完成多尺度信息的提取,嵌入注意力模块以关注属性存在的关键区域并挖掘属性内部联系;其次,使用特征金字塔融合策略,更充分地提取和融合多尺度特征.网络结合了多尺度学习、注意力机制和残差学习的思想,使网络提取出更丰富、更细腻的特征.最后,在PETA和PA100K两个数据集上进行实验研究,结果表明,所提出方法优于现有的研究方法.通过消融研究验证整个网络体系结构的3个组成部分的有效性和先进性,且所提出网络具有高准确性和低复杂度的双向优化.  相似文献   

8.
针对深度学习模型在工业轴承表面缺陷检测中多目标情形下的小目标漏检率高、模型特征融合不充分的问题,基于YOLOX提出一种多注意力特征加权融合的小目标缺陷检测算法。在骨干网络引入特征提取更加细粒度的Res2Block模块,同时嵌入自注意力机制,增加隐性小目标的区域特征,减少漏检率;设计内嵌坐标注意力并作为加权条件的双路金字塔特征融合网络,提升浅层细节特征和深层高级语义特征的交互融合能力;后处理阶段引入Focal Loss损失函数,增加模型对正样本目标的学习,进一步减少漏检率。实验结果表明,与原YOLOX算法相比,改进算法在自制小型列车轴承表面缺陷数据集上mAP提高了4.04个百分点,对小目标的识别率明显提升。  相似文献   

9.
基于多尺度注意力机制的高分辨率网络人体姿态估计   总被引:1,自引:0,他引:1  
针对人体姿态估计中面对特征图尺度变化的挑战时难以预测人体的正确姿势,提出了一种基于多尺度注意力机制的高分辨率网络MSANet(multiscale-attention net)以提高人体姿态估计的检测精度。引入轻量级的金字塔卷积和注意力特征融合以更高效地完成多尺度信息的提取;在并行子网的融合中引用自转换器模块进行特征增强,获取全局特征;在输出阶段中将各层的特征使用自适应空间特征融合策略进行融合后作为最后的输出,更充分地获取高层特征的语义信息和底层特征的细粒度特征,以推断不可见点和被遮挡的关键点。在公开数据集 COCO2017上进行测试,实验结果表明,该方法比基础网络HRNet的估计精度提升了4.2%。  相似文献   

10.
针对植物叶片病害存在的种类驳杂以及如何提取有效特征的问题,提出一种融合通道信息注意力网络模型对多种植物叶片病害进行识别。构建残差结构为主的基础网络用于特征提取,再将特征通过注意力网络融合多个通道信息对病害特征进行重标定;在交叉熵函数中添加约束信息以加快模型收敛速度;在4种不同植物16类病害的数据集上对该模型进行实验,结果表明,基础网络模型识别准确率为83.13%,而融合通道信息网络后准确率提高4.64个百分点;融合后的模型与其他模型相比在识别准确率方面提高9.72个百分点且模型复杂度约为对比实验中最优模型复杂度的1/2。  相似文献   

11.
吴荣贵  蒋平 《计算机应用研究》2020,37(12):3788-3791
为解决现有基于深度学习的超分辨算法模型没有充分利用各个层次的特征信息导致重建精度不高、参数量大的问题,提出了一个内外双重密集连接结构——密集跳跃注意连接网络。内层结构中,对原始密集级联结构进行改进,提出了通道可分密集级联块;外层结构采用密集残差连接结合注意力机制将由密集块提取的特征进行融合,从而达到更少卷积层、更高精度的效果。在多个基准数据集上测试,提出的网络较其他网络层数体量相近的算法精度更高、参数量更少。  相似文献   

12.
针对中间层通道特征相关性利用率低、低分辨率图像和高分辨率图像函数映射空间非线性的问题,提出了一种基于高效二阶注意力机制的对偶回归网络(ESADRNet)。该网络将重建任务分为两个回归网络:原始回归网络和对偶回归网络。原始回归网络采用FReLU为激活函数的下采样层对图像进行更高效的空间上下文特征提取;基于多级跳跃连接残差块(MLSCR)和高效二阶通道注意力模块(ESOCA)构成的多级跳跃连接残差注意力模块(MLSCRAG)、共享源跳跃连接(SSC)和亚像素卷积构建渐进式上采样网络,使网络专注于更具辨别性的特征表示,具有更强大的特征表达和特征相关学习能力;利用对偶回归网络约束映射空间,寻找最优重建函数。在Set5、Set14、BSD100和Urban109数据集上经过对比实验证明,该网络在客观定量指标和主观视觉方面均优于其他对比方法。  相似文献   

13.
针对现有基于深度学习的三维模型识别方法缺乏结合三维模型的上下文细粒度局部特征,可能造成几何形状极其相似,局部细节信息略有不同的类识别混淆的问题,提出一种基于深度图注意力卷积神经网络的三维模型识别方法。首先,通过引入邻域选择机制挖掘三维模型的细粒度局部特征。其次,通过空间上下文编码机制捕捉多尺度空间上下文信息,且与细粒度局部特征相互补偿以增强特征的完备性。最后,采用一种多头部机制,使图注意力卷积层聚合多个单头部的特征以增强特征的丰富性。此外,设计选择性丢弃算法,根据度量权重值对神经元重要性进行排序,智能地丢弃重要性较低的神经元来防止网络过拟合。算法在ModelNet40数据集上的三维模型识别准确率达到了92.6%,且网络复杂度较低,在三维模型识别准确率和网络复杂度之间达到最佳平衡,优于当前主流方法。  相似文献   

14.
为降低云雾等类烟雾目标引起的烟雾检测虚警现象,提出一种多网络模型融合的烟雾检测方法。在采用VGG16网络提取烟雾细节特征的基础上,与ResNet50网络特征提取层进行融合,提取到更多细微特征,采用跳跃连接机制将图像信息传递到神经网络的更深层,避免烟雾图像重要特征的丢失,并解决因梯度消失导致的欠拟合问题。训练过程采用基于同构空间下的特征迁移学习方法,解决小样本训练难题,在新的目标检测领域进行重新训练,更有利于将网络模型融合,重新搭建全连接层输出检测结构,采用随机失活的方法,提高模型泛化能力。实验结果表明,与目前流行的深度卷积网络相比,该方法虚警率低,准确率和召回率高。  相似文献   

15.
为解决单一特征细粒度船舶图像识别率低的问题,提出一种循环注意卷积神经网络(recurrent attention convolutional neural network,RA-CNN)与多特征区域融合的船舶目标识别方法。该方法通过在VGG-19网络中引入尺度依赖池化(scale-dependent pooling,SDP)算法解决小目标过度池化的问题,提升了小型船舶的识别性能;注意建议网络(attention proposal network,APN)加入联合聚类(joint clustering)算法,生成多个独立的特征区域,使整个模型充分利用全局信息,提高了船舶识别精度;同时设计特征区域优化方法降低多个特征区域的重叠率,解决了过拟合问题;通过定义新的损失函数来交叉训练VGG-19和APN,加快了收敛速度。利用公开的光电船舶数据集对该方法进行测试实验,识别准确率最高可达90.2%,无论是识别率还是模型的鲁棒性较单特征都有了很大的提升。  相似文献   

16.
针对现有色环电阻识别方法中鲁棒性差、准确率低和运行速度慢等问题,在MobileNetV3网络的基础上提出了一种轻量级的色环电阻图像识别算法.首先在自建的色环电阻数据集上进行数据增强以增加样本数量,提高模型鲁棒性.然后在瓶颈结构中使用CBAM注意力模块,增加模型在空间和通道上对特征的细化能力以提高模型准确率.接着优化分类层,删掉冗余的升维操作,在提高准确率的同时减少参数量,提高模型运算速度.最后分别针对特征图大小和通道数不相等时添加跳跃连接,提高模型在深层网络中的特征提取能力,进一步提高模型准确率.实验结果表明,该模型在自建数据集上的识别准确率达到了98%,可快速准确的对色环电阻进行识别.该模型能够为电阻自动化识别提供新的技术参考.  相似文献   

17.
针对现有面部表情识别算法耗时长、收敛速度慢、分类精度低等问题,对LeNet-5网络的框架和内部结构进行双重优化和改进,并提出一种基于改进LeNet-5的面部表情识别方法。为了能够提取更加多样化的特征,同时提升特征表达能力,首先增加卷积层和池化层的个数,调整网络内部参数;其次,通过对卷积层、全连接层进行批规范化处理,提高网络模型的泛化能力;最后,3个池化层以maxpool_avgpool_avgpool的组合方式进行重叠池化。在FER2013人脸表情数据库进行实验,结果表明改进后的模型相较于目前的算法具有更高的识别精度。  相似文献   

18.
目的 车型识别在智能交通、智慧安防、自动驾驶等领域具有十分重要的应用前景。而车型识别中,带标签车型数据的数量是影响车型识别的重要因素。本文以"增强数据"为核心,结合PGGAN(progressive growing of GANs)和Attention机制,提出一种基于对抗网络生成数据再分类的网络模型AT-PGGAN(attention-progressive growing of GANs),采用模型生成带标签车型图像的数量,从而提高车型识别准确率。方法 该模型由生成网络和分类网络组成,利用生成网络对训练数据进行增强扩充,利用注意力机制和标签重嵌入方法对生成网络进行优化使其生成图像细节更加完善,提出标签重标定的方法重新确定生成图像的标签数据,并对生成图像进行相应的筛选。使用扩充的图像加上原有数据集的图像作为输入训练分类网络。结果 本文模型能够很好地扩充已有的车辆图像,在公开数据集StanfordCars上,其识别准确率相比未使用AT-PGGAN模型进行数据扩充的分类网络均有1%以上的提升,在CompCars上与其他网络进行对比,本文方法在同等条件下最高准确率达到96.6%,高于对比方法。实验结果表明该方法能有效提高车辆精细识别的准确率。结论 将生成对抗网络用于对数据的扩充增强,生成图像能够很好地模拟原图像数据,对原图像数据具有正则的作用,图像数据可以使图像的细粒度识别准确率获得一定的提升,具有较大的应用前景。  相似文献   

19.
卷积神经网络(Convolutional Neural Networks,CNN)在图像分类任务中的卓越表现,使得其被广泛应用于计算机视觉的各个领域。图像分类模型精度与效率的提升,除了归功于网络结构的改变外,还有很大一部分原因来自于归一化技术以及分类损失函数的改进。在人脸识别任务中,随着精度的不断提升,分类损失函数从Softmax Loss到Triplet Loss,又从L-Softmax Loss到Arcface Loss,度量方式从几何度量发展到角度度量。度量方式的改变实际上是特征形式的变化,即特征形式从一般特征转变为角度特征。在Mnist数据集上,使用角度度量损失函数训练得到的特征点呈角度分布,同时准确率比几何度量高;将角度度量方式用更直接的角度特征来表示,训练得到的同类特征点呈直线分布,准确度也比一般角度度量更高。这不禁令人思考,在CNN分类模型中是否可以使用角度特征来代替一般特征。在CNN分类模型中,其主要架构往往由多个卷积层和一个或多个全连接层组成,通过统一卷积层与全连接层的归一化操作,得到角度卷积层与角度全连接层。在普通分类网络的基础上,用角度卷积层替换卷积层,用角度全连接层替换全连接层,可以得到一个由角度特征组成的角度分类网络。在Cifar-100数据集上,基于ResNet-32构造的角度分类网络相比原分类网络,分类准确率提高了2%,从而论证了角度特征在分类网络中的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号