首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
为了提高行人属性识别的准确率,提出了一种基于多尺度注意力网络的行人属性识别算法。为了提高算法的特征表达能力和属性判别能力,首先,在残差网络ResNet50的基础上,增加了自顶向下的特征金字塔和注意力模块,自顶向下的特征金字塔由自底向上提取的视觉特征构建;然后,融合特征金字塔中不同尺度的特征,为每层特征的通道注意力赋予不同的权重。最后,改进了模型损失函数以减弱数据不平衡对属性识别率的影响。在RAP和PA-100K数据集上的实验结果表明,与现有算法相比,本算法对行人属性识别的平均精度、准确度、F1性能更好。  相似文献   

2.
针对小麦锈病识别率不高和病症难以判断问题,提出一种基于注意力机制(Attention Mechanism, AT)的残差网络模型(Residual Network, ResNet)。该模型利用ResNet网络能够抑制梯度弥散的优势,并引入注意力机制对小麦锈病特征因子赋予权重。对输入的小麦锈病图像进行通道注意力权重赋值,并提取图像空间细粒度特征完成小麦锈病检测。研究结果表明:该网络模型在Wheat-data数据集上平均识别精确率为95.20%,F1-score为96.35%;与非注意力ResNet网络模型相比其平均识别精确率和F1-score平均提高0.63%和1.03%。通过对网络模型参数和识别准确率分析,表明AT-ResNet100网络模型具有较好的性能。  相似文献   

3.
针对杂乱场景下难以有效地提取行人关键信息和局部遮挡时全局特征方法失效的问题,提出了一种双金字塔结构引导的多粒度行人重识别(person re-identification,ReID)方法。首先在ResNet50中嵌入注意力金字塔,引导网络由粗到细依次挖掘不同粒度的特征,使网络更倾向于关注复杂环境中行人的显著区域;其次通过结构不对称的双重注意力特征金字塔分支(double attention feature pyramid branch,DFP branch)提取多尺度的行人特征,丰富特征的多样性,同时双重注意力机制可使分支从浅层信息中捕获高细粒度的局部特征;最后将粒度较粗的全局特征与多层级细粒度的局部特征融合,两种金字塔相互作用,以此获得更多具有鉴别性的多粒度特征,改善行人遮挡问题。在多个数据集上进行了实验,结果表明,各项评价指标均高于目前大多数主流模型,其中在DukeMTMC-reID数据集上,Rank-1、mAP和平均逆负处罚(mean inverse negative penalty,mINP)分别达到了91.6%、81.9%、48.1%。  相似文献   

4.
为了让网络捕捉到更有效的内容来进行行人的判别,该文提出一种基于阶梯型特征空间分割与局部分支注意力网络(SLANet)机制的多分支网络来关注局部图像的显著信息。首先,在网络中引入阶梯型分支注意力模块,该模块以阶梯型对特征图进行水平分块,并且使用了分支注意力给每个分支分配不同的权重。其次,在网络中引入多尺度自适应注意力模块,该模块对局部特征进行处理,自适应调整感受野尺寸来适应不同尺度图像,同时融合了通道注意力和空间注意力筛选出图像重要特征。在网络的设计上,使用多粒度网络将全局特征和局部特征进行结合。最后,该方法在3个被广泛使用的行人重识别数据集Market-1501,DukeMTMC-reID和CUHK03上进行验证。其中在Market-1501数据集上的mAP和Rank-1分别达到了88.1%和95.6%。实验结果表明,该文所提出的网络模型能够提高行人重识别准确率。  相似文献   

5.
针对现有的雷达辐射源识别方法具有低信噪比情形下识别精度低、无法识辩多个辐射源等缺点,文中提出融入注意力机制的残差网络用于雷达辐射源多标签识别。首先,利用残差网络学习过程数据的时序特征并提取相应的深层特征;然后,引入注意力机制对提取的特征进一步地分类和识别;最后,在雷达辐射源数据集上进行仿真实验。结果表明所提的Atten-Resnet模型不但可以在多标签条件下进行雷达辐射源的准备识别,而且在信噪比为6 dB时仍然可以保持95%以上的准确率。Atten-Resnet模型具有较高的实用性和较强的鲁棒性。  相似文献   

6.
为了提高行人再识别算法的识别效果,该文提出一种基于注意力模型的行人属性分级识别神经网络模型,相对于现有算法,该模型有以下3大优点:一是在网络的特征提取部分,设计用于识别行人属性的注意力模型,提取行人属性信息和显著性程度;二是在网络的特征识别部分,针对行人属性的显著性程度和包含的信息量大小,利用注意力模型对属性进行分级识别;三是分析属性之间的相关性,根据上一级的识别结果,调整下一级的识别策略,从而提高小目标属性的识别准确率,进而提高行人再识别的准确率。实验结果表明,该文提出的模型相较于现有方法,有效提高了行人再识别的首位准确率,其中,Market1501数据集上,首位准确率达到了93.1%,在DukeMTMC数据集上,首位准确率达到了81.7%。  相似文献   

7.
恶意域名只有攻击后才被加入到域名黑名单数据库中,这使得传统模型对新变种或新出现的家族域名检测精度不高,极易导致新出现或新变种家族恶意域名的漏报。为此,提出一种基于多原型指导的小样本家族恶意域名入侵检测算法,该算法首先利用一组共享权重的Transformer网络将输入的支持与查询域名对映射到深度特征空间;其次,设计了一种任务关联注意力模块挖掘支持分支和查询分支输入域名对的共有语义;再次,在共有语义特征图上利用平均池化策略生成多个代表家族团聚特征的原型集;最后,利用原型集细粒度地指导未知家族域名和已知支持域名的标签,并根据真实标签与预测标签之间的损失端到端优化原型集,强化原型的表达能力。通过在多个恶意域名家族数据集上测试,所提出模型在传统二分类任务上可以实现0.983 9和0.987 6的识别准确率和识别精度,在细粒度的多分类任务上可以实现5个家族0.980 0以上的识别精准率,11个家族0.970 0以上的识别精准率,30个家族0.940 0以上的识别精准率。  相似文献   

8.
尹梓睿  张索非  张磊  吴晓富 《信号处理》2020,36(9):1481-1488
鉴于ResNet的强大表达能力,其在行人重识别领域获得了广泛的应用。虽然基于ResNet50构建的行人重识别网络取得了优异的性能,但流行的ResNet50仍存在模型体积大、效率低等局限性。与之相比,EfficientNet作为一种新兴的深度模型,具有设计合理、运行高效等特点,并在ImageNet数据集上有着更出色的性能表现。为此,本文尝试将EfficientNet系列网络引入到行人重识别领域,替代比较流行的ResNet50主干网络,提供了一个全新的骨干网基线。本文重点根据EfficientNet系列网络给出一种二分支行人重识别网络构造。相比于ResNet50,基于EfficientNet构造的二分支行人重识别网络具有网络参数规模小、性能提升明显的特点。实验结果表明:所构造的网络在行人重识别流行数据集上均有良好的表现。   相似文献   

9.
行人重识别是跨摄像头追踪的关键环节之一,主流方法多采用ImageNet进行预训练,忽视了数据集的域间差异,且以结构庞大的多分支模型居多,模型复杂度较高。本文设计一种行人重识别方法,采用基于原始视频带噪声标签参与监督的方式进行预训练,减少域间差异以提升特征表达能力;以基于注意力的特征融合方式取代残差网络的跳接映射,增强网络的特征提取能力;在网络中嵌入坐标注意力机制,在低复杂度的情况下强化关键特征,抑制低贡献特征;采用随机擦除对输入数据做数据增强以提高泛化能力,联合分类损失、三元组损失和中心损失函数对网络进行监督训练。在公开数据集Market-1501和Duke-MTMC上完成了消融实验,与主流方法对比实验表明本方法在不需要复杂多分支逻辑结构的前提下,仍可达到较高的精度。  相似文献   

10.
行人轨迹预测在各种应用中具有关键性作用,为提高互中轨迹预测精度与模型可解释性,提出了一种基于时空信息和社交注意力的模型(SAGAT),模型整体采用编码-码的框架。首先,针对行人之间时间交互的连续性,构建额外的LSTM网络来捕获时间的相关性信息。然后,提出社交注意力机制,设置3种社交特征丰富行人交互信息,对同一场景中的不同行人进行权重分配。最后,在UCY和ETH公开数据集进行训练。多个实验结果表明,模型的预测精度优于现有方法,且平均精度提高13.7%。首先,针对行人之间时间交互的连续性,构建额外的LSTM网络来捕获时间的相关性信息。然后,提出社交注意力机制,设置3种社交特征丰富行人交互信息,对同一场景中的不同行人进行权重分配。  相似文献   

11.
在基于视频图像的动作识别中,由于固定视角相机所获取的不同动作视频存在视角差异,会造成识别准确率降低等问题。使用多视角视频图像是提高识别准确率的方法之一,提出基于三维残差网络(3D Residual Network,3D ResNet)和长短时记忆(Long Short-term Memory,LSTM)网络的多视角人体动作识别算法,通过3D ResNet学习各视角动作序列的融合时空特征,利用多层LSTM网络继续学习视频流中的长期活动序列表示并深度挖掘视频帧序列之间的时序信息。在NTU RGB+D 120数据集上的实验结果表明,该模型对多视角视频序列动作识别的准确率可达83.2%。  相似文献   

12.
针对无法对面部表情进行精确识别的问题,提出了基于ResNet50网络融合双线性混合注意力机制的网络模型。针对传统池化算法造成图像特征提取残缺、模糊等问题,提出了一种基于Average-Pooling算法的自适应池化权重算法,同时基于粒子群算法对卷积神经网络模型超参数进行自适应调节,从而进一步提升模型识别精度。基于改进的网络模型,设计了一款实时面部表情识别系统。经验证,在Fer2013数据集和CK+数据集上,改进的模型在测试集中的识别精度分别为73.51%和99.86%。  相似文献   

13.
陈昊  郭文普  康凯 《电讯技术》2023,63(12):1869-1875
针对低信噪比条件下自动调制识别准确率不高的问题,提出了通道门控Res2Net卷积神经网络自动调制识别模型。该模型主要由二维卷积神经(Two-dimensional Convolutional Neural Network, 2D-CNN)网络、多尺度残差网络(Residual 2-network, Res2Net)、压缩与激励网络(Squeeze-and-Excitation Network, SENet)和长短期记忆(Long Short-Term Memory, LSTM)网络组成,通过卷积从原始I/Q数据中提取多尺度特征,结合门控机制对特征通道进行权重调整,并利用LSTM对卷积所得特征进行序列建模,确保数据特征被有效挖掘,从而提升自动调制识别的准确率。在基准数据集RML2016.10a下的调制识别实验表明,所提模型在信噪比为12 dB时识别精度为92.68%,在信噪比2 dB以上时平均识别精度大于91%,较经典CLDNN模型、LSTM模型和同类型PET-CGDNN模型、CGDNet模型能取得更高的调制类型识别准确率。  相似文献   

14.
合成孔径雷达(SAR)图像自动目标识别中,特征提取和目标分类是两个重要环节。残差网络(ResNet)作为一种较新的卷积神经网络,凭借其对目标特征的自适应学习能力,在SAR图像分类领域表现突出。本文在ResNet基础上,设计出了密集连接型残差网络(DCResNet),用于SAR图像目标识别。DCResNet在残差模块中增加了跳跃性连接的密度,不仅继承了ResNet的易学习的优点,还加强了特征的传播和利用率。除此之外,DCResNet采用平均池化的方式进行下采样,抑制了SAR图像中噪声对识别精度造成的影响。关于SAR图像目标识别的实验结果证明,本文提出的DCResNet与ResNet、AlexNet相比,不仅具有更快的收敛速度和推理速度,而且目标分类的准确率更高。  相似文献   

15.
葛斌  彭曦晨  孙倩倩  袁政 《光电子.激光》2023,34(10):1111-1090
新型冠状病毒肺炎(corona virus disease 2019,COVID-19)严重影响人类社会和经济的发展,威胁人类的健康。如何更准确、快速地排查感染病毒的患者,使用卷积神经网络(convolutional neural network, CNN)的方法识别COVID-19胸部X射线影像,完成计算机自动辅助诊断。但是,由于识别精度不高,难以准确判断是否感染了COVID-19。为了提高网络模型对COVID-19胸部X射线影像的识别性能,首先提出注意力引导梯形金字塔融合网络(attention steered trapezoid pyramid fusion network, ASTPNet),该网络可以附加在不同的CNN上,有效地利用模型中深层与浅层网络的特点;其次提出注意力引导块(attention steered block, AS Block),通过通道和空间注意力,强调通道和空间中的有效语义信息,弱化无效的干扰信息,高效地聚合加权信息。最终实验结果表明:将ASTPNet附加在VGG16/19、ResNet34/50和ResNeXt上,识别精度有了显著提升;应用于自建的C...  相似文献   

16.
针对通信信号调制识别的特征提取问题,为进一步提高识别准确率,提出了一种基于嵌套式跳跃连接结构的残差网络(ResNet of Nested Shortcut Connection Structure,ResNet_NSCS)调制识别算法。该算法在残差神经网络(Residual Neural Network,ResNet)基础上,通过借鉴ResNet多通路选择思路,引入嵌套式恒等跳跃连接结构,利用提取的特征实现不同调制方式的分类。仿真结果表明,面向RadioML2016.10a数据集,较卷积神经网络(Convolutional Neural Network,CNN)算法和卷积神经网络_长短时记忆网络(Convolutional Neural Network_Long Short Term Memory Network,CNN_LSTM)算法,以增加网络复杂度为代价,ResNet_NSCS算法收敛速度快,识别准确率高。  相似文献   

17.
针对原棉杂质检测准确率不高的问题,以新疆棉花为研究对象,提出基于残差与注意力机制的原棉杂质检测算法。该算法为2阶段算法,准确率较高。首先,采集原棉杂质图象后对图像进行标注,再进行数据增广,可以避免训练过程中的过拟合现象,接着在原框架引入视觉注意力机制,通过改进算法结构来提高原棉杂质检测的准确率。其次,通过分析对比几种不同网络对原棉杂质检测的准确度,选取ResNet50为特征提取网络,该网络提高了算法的复杂特征提取能力。最后,采用RoI Align来减少量化误差,从而提高检测原棉杂质的准确性。实验结果表明,改进的算法虽然略微增多检测时间,但其整体检测准确率明显优于原算法,整体识别的准确率可达到94.84%,较改进前Faster R-CNN(faster region-based convolutional neural network)的识别率提高了5.58%。同时通过对比不同网络模型,结果显示改进后的Faster R-CNN对原棉杂质检测的效果更好。  相似文献   

18.
针对胶囊网络(capsule network,CapsNet)特 征提取结构单一和数据处理中参数量过大的问题,提出 多尺度混合注意力胶囊网络 模型。首先,在网络初始端添加不同尺度的卷积核来多角度提取 特征,并引 入混合注意力机制,通过聚焦更具分辨性的特征区域来降低复杂背景干扰。其次,采用局部 剪枝算法优 化动态路由,减少参数量,缩短模型训练时间。最后,在海洋鱼类数据集F4K(Fish4Knowled ge)上验证, 结果表明,与传统残差网络(residual network50,ResNet-50)、双线性网络(bilinear convo l utional neural network,B-CNN)、分层精简双线性注意力网络(spatial transformation netw ork and hierarchical compact bilinear pooling,STN-H-CBP)以及CapsNet模型相比,该算法 识别精度为98.65%,比ResNet-50模型提升 了5.92%;训练时间为2.2 h,相比于CapsNet 缩短了近40 min,验证了该算法的可行性。  相似文献   

19.
针对静态图像中人体分割不能够聚焦所要分割区域,造成分割效果不佳的问题.通过对残差网络进行改进,使之能够适应人体分割这一任务,并在改进的残差网络中引入一种聚焦机制进行静态图像人体分割.根据静态图像人体分割问题,设计了具有聚焦机制的损失函数、辅助分割损失函数以及分割损失函数.另外,为了得到数据集的辅助分割类标、分割类标以及注意力聚焦图,提出了数据预处理算法.在Pascal-Person-Part数据集和LIP数据集上进行训练和测试,并将测试结果与SegNet,FCN-8s,DeepLabV2,Attention,LG-LSTM以及Attention+ SSL方法进行比较.通过比较像素精度、平均像素精度和IoU(Intersection over Union)指标,表明所提方法能够提高静态图像中人体分割的效果,验证了所提方法的可靠性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号