首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
刘艺  赵明富  宋涛  司良群  雷雨 《激光杂志》2023,(12):184-189
针对因行人重识别中行人图像的背景、姿势等差异和行人图像的属性相似导致的行人重识别准确率低的问题,提出了一种基于特征相关性学习的行人重识别方法,加强了局部特征提取的准确性和相关性,充分考虑了行人身体部位和其他部位之间的相关性。首先使用Resnet-50网络和人体关键点估计模型来提取局部特征和全局特征,然后对局部特征和全局特征进行分支操作,对局部特征进行相关性学习,加强各个局部特征与其他局部特征之间的联系,提高相似属性行人图像之间的鉴别性;对全局特征通过池化操作提取更为精确的全局特征,最后将相关性学习后的局部特征和池化后的全局特征进行拼接作为预测行人身份的对比特征。此模型在Market-1501数据集及DukeMTMC-ReID数据集上的mAP指标分别达到了85.6%和76.1%,验证了所提网络模型的有效性。  相似文献   

2.
针对无人机航拍图像下行人属性识别任务特征提取效率低问题,提出一种联合全局与局部外观特征学习的行人属性识别算法。首先为了提升算法的局部区域定位能力,提出一种新颖的基于注意力的属性定位模块,模块通过矩阵乘法来建模不同通道间的空间依赖关系,并利用全局平均池化产生的特征进一步增强提取到的局部区域信息,实现了更好的局部特征表达能力;其次,为了防止生成的局部区域信息出现冗余,设计一种注意力多样性损失,通过最小化特征通道的相似性来约束各个局部区域互不重叠;最后,在两个公开的行人属性识别数据集上的实验结果表明,上述设计可以有效提高属性识别准确率并且参数量仅轻微增加。  相似文献   

3.
为了更好地对人体动作的长时时域信息进行建模,提出了一种结合时序动态图和双流卷积网络的人体行为识别算法.首先,利用双向顺序池化算法来构建时序动态图,实现视频从三维空间到二维空间的映射,用来提取动作的表观和长时时序信息;然后提出了基于inceptionV3的双流卷积网络,包含表观及长时运动流和短时运动流,分别以时序动态图和...  相似文献   

4.
针对大面积不规则破损的人脸图像修复过程中出现的伪影和不连贯问题,提出一种基于特征融合和多尺度注意力机制的二阶段人脸图像修复算法。在粗修复网络增加全局和局部特征分支来处理编码器的输出。其中,局部特征分支使用多尺度空洞卷积和门控残差连接来聚合上下文信息,并与全局特征分支的输出进行正交融合,提高局部特征与全局特征的相关性,减少特征冗余。在精修复网络增加平均和最大金字塔池化模块,其中,平均池化用于捕捉整体统计信息,最大池化用于提取空间上显著的特征并保留关键信息,并利用通道-空间注意力机制进行图像特征结构调整和纹理生成。最后,构建了一个包括多尺度结构相似性损失的复合函数对网络进行训练。实验结果表明,所提算法在主观和客观评价指标上均优于现有算法。  相似文献   

5.
针对行人遮挡、姿态变化等现象造成当前行人重 识别算法精度不高的问题,提出一 种基于多层级特征融合的行人重识别算法。首先通过自注意力机制骨干网络ResNeSt提取图 像特征中的短距离信息;其次通过多尺度 金字塔卷积(pyramid convolution,Pyconv) 分支网络提取图像中长像素关 联特征信息,提高模型表达能力;最后使用一种统一形式且可学习的广义均值池化 (generalized mean pooling,GEM) 替代传统平均池化层,达到关注不同区域特征差异性目的。测试阶段添加平均逆消极惩罚 (mINP)作为新评价指标。实验结果表明,本文所提算法在多个数据集上均展现出优势,在 DukeMTMC-ReID数据集上Rank-1达到了90.9%,mAP达到了89.8%。  相似文献   

6.
针对多输入多输出(Multiple Input Multiple Output, MIMO)系统中的空时分组码识别(Space-Time Block Code, STBC)问题,本文提出了一种利用卷积-循环神经网络的串行序列空时分组码识别方法。将一维接收信号的实部和虚部分离后输入网络,利用卷积神经网络(CNN)提取其空间特征,结合循环神经网络(RNN)提取其深层时序特征,提高网络的特征表达能力;网络训练过程采用反向传播方法,通过计算输出与目标值的误差,将误差反向传回网络中并更新权值,完成网络的训练过程;将测试集数据输入训练好的网络中,实现对空时分组码的识别和区分。该方法将深度学习算法运用到串行序列空时分组码识别当中,训练完的网络可直接对单接收天线下的空时分组码进行识别,不需要重复计算信号的统计特征,避免了人为设计特征参数和检测阈值。该方法不需要知道信道和噪声的先验信息,适用于电子侦查等非协作通信情况。仿真实验表明,该算法能够有效地对串行序列空时分组码进行识别,并且在低信噪比下有较好的识别性能。   相似文献   

7.
蒋一  侯丽萍  张强 《红外技术》2021,43(9):852-860
为了提升复杂背景下红外序列的行人动作识别精度,本文提出了一种改进的空时双流网络,该网络首先采用深度差分网络代替时间信息网络,提高时空特征的表征能力与提取效率;然后,采用基于决策级特征融合机制的代价函数对模型进行训练,可以更大限度地保留不同网络帧间图像的时空特征,更加真实地反映行人的动作类别.仿真结果表明,本文提出的改进...  相似文献   

8.
胡正平  邱悦  翟丰鋆  赵梦瑶  毕帅 《信号处理》2021,37(8):1470-1478
视频行为识别算法在特征提取过程中,存在未聚焦视频图像显著区域信息的问题,使模型分类效果不理想.为了提高网络区别关注的能力,提出融入注意力机制的视频多尺度时序行为识别算法模型.在视频长-短时序网络中分别融入通道-空间注意力和通道注意力模块,引入注意力机制使网络在训练过程中重新分配权重,捕捉视频内容与位置兴趣点,提高网络的...  相似文献   

9.
陈莹  陈巧媛 《电子与信息学报》2020,42(12):3037-3044
为减轻行人图片中的背景干扰,使网络着重于行人前景并且提高前景中人体部位的利用率,该文提出引入语义部位约束(SPC)的行人再识别网络。在训练阶段,首先将行人图片同时输入主干网络和语义部位分割网络,分别得到行人特征图和部位分割图;然后,将部位分割图与行人特征图融合,得到语义部位特征;接着,对行人特征图进行池化得到全局特征;最后,同时使用身份约束和语义部位约束训练网络。在测试阶段,由于语义部位约束使得全局特征拥有部位信息,因此测试时仅使用主干网络提取行人的全局信息即可。在大规模公开数据集上的实验结果表明,语义部位约束能有效使得网络提高辨别行人身份的能力并且缩减推断网络的计算花费。与现有方法比较,该文网络能更好地抵抗背景干扰,提高行人再识别性能。  相似文献   

10.
相较于图像分析,如何分析时序信息是动作识别中的一个主要问题.大多数先前的方法,如3D卷积网络、双流卷积网络,仅使用包含全局时域信息的特征作为视频的表征,忽略了局部时序特征的重要性.考虑到这样的问题,本文提出一种基于时序交互感知模块的长短时序关注网络——Long and Short Sequence Concerned Networks(LSCN),融合不同的时序信息,利用不同卷积层时序特征的交互加强对不同时序长度的动作实例的表示,兼顾长短动作实例对时序信息的需求.实验结果表明,基于3D ResNext101的LSCN在两个公共数据集(UCF101和HMDB51)上,相较于基础的网络分别有0.4%和2.9%的准确率提升.  相似文献   

11.
为了提高行人属性识别的准确率,提出了一种基于多尺度注意力网络的行人属性识别算法。为了提高算法的特征表达能力和属性判别能力,首先,在残差网络ResNet50的基础上,增加了自顶向下的特征金字塔和注意力模块,自顶向下的特征金字塔由自底向上提取的视觉特征构建;然后,融合特征金字塔中不同尺度的特征,为每层特征的通道注意力赋予不同的权重。最后,改进了模型损失函数以减弱数据不平衡对属性识别率的影响。在RAP和PA-100K数据集上的实验结果表明,与现有算法相比,本算法对行人属性识别的平均精度、准确度、F1性能更好。  相似文献   

12.
Pedestrian attribute recognition is often considered as a multi-label image classification task. In order to make full use of attribute-related location information, a saliency guided sel-attention network ( SGSA-Net) was proposed to weakly supervise attribute localization, without annotations of attribute-related regions. Saliency priors were integrated into the spatial attention module ( SAM ). Meanwhile,channel-wise attention and spatial attention were introduced into the network. Moreover, a weighted binary cross-entropy loss ( WCEL) function was employed to handle the imbalance of training data. Extensive experiments on richly annotated pedestrian ( RAP) and pedestrian attribute ( PETA) datasets demonstrated that SGSA-Net outperformed other state-of-the-art methods.  相似文献   

13.
传统LBP特征进行目标识别主要依靠局部图像LBP特征直方图来实现,通常只能满足小邻域内小量采样点计算LBP特征的情况。当需要计算像素在更大空间邻域更多采样点的对比纹理特征时,直方图特征的维度将会造成维数灾难。本文提出应用空间金字塔池化方式对LBP特征进行池化,并在LBP特征计算过程中采用多种邻域尺度和不同采样点数量,充分挖掘不同尺度下图像的纹理特征,从而建立完备的图像描述特征。在利用支持向量机或其他训练网络进行识别模板训练时,需要输入特征集具有相同的维度,传统LBP算法首先对图像按一定尺寸重构/裁切,时常会发生畸变而与现实出现偏离和信息丢失,对识别正确率存在影响。本文通过空间金字塔尺度对任意大小图像的LBP特征进行池化,输出特征维度为固定长度,有效避免了图像畸变与信息丢失的情况。实验证明,本文方法不仅避免了维度灾难的发生,同时能够更高效地提高目标检测率和识别正确率。  相似文献   

14.
孙鹏  于跃  陈嘉欣  秦翰林 《红外与激光工程》2022,51(4):20220167-1-20220167-8
针对复杂背景下,依靠高超声速飞行器搭载的红外探测器对高动态空中目标的可靠探测和精确识别问题,提出了一种基于深度空时域特征融合的空中多形态目标检测方法。设计了加权双向循环特征金字塔结构提取多形态目标静态特征,并引入可切换空洞卷积,增大感受野的同时减少空域信息损失。对于时序运动特征的提取,为了抑制复杂背景噪声的同时将角点信息集中到运动区域中,通过特征点匹配法生成掩膜图,之后进行光流计算,根据计算结果设计稀疏光流特征图,利用3D卷积提取多个连续帧图像中包含的时序特征,生成三维时序运动特征图。最后,通过对图像静态特征与时序运动特征进行通道维度的拼接,实现深度空时域特征融合。大量的对比实验表明,文中方法可明显减少复杂背景下的虚假识别概率,具备高实时性的同时目标识别准确率达89.87%,满足高动态下的红外目标智能检测识别需求。  相似文献   

15.
在目前跨模态行人重识别技术的研究中,大部分现有的方法会通过单模态原始可见光图像或者对抗生成图像的局部共享特征来降低跨模态差异,导致在红外图像判别中由于底层特征信息丢失而缺乏稳定的识别准确率。为了解决该问题,该文提出一种结构化双注意力可交换混合随机通道增强的特征融合跨模态行人重识别方法,利用通道增强后的可视图像作为第三模态,通过图像通道可交换随机混合增强(I-CSA)模块对可见光图像进行单通道和三通道随机混合增强抽取,从而突出行人的姿态结构细节,在学习中减少模态间差异。结构化联合注意力特征融合 (SAFF)模块在注重模态间行人姿态结构关系的前提下,为跨模态表征学习提供更丰富的监督,增强了模态变化中共享特征的鲁棒性。在SYSU-MM01数据集全搜索模式单摄设置下Rank-1和mAP分别达到71.2%和68.1%,优于同类前沿方法。  相似文献   

16.
遥感图像内容丰富,一般的深度模型提取遥感图像特征时容易受复杂背景干扰,对关键特征的提取效果不佳,并且难以表达图像的空间信息,该文提出一种基于多尺度池化和范数注意力机制的深度卷积神经网络,在通道层面与空间层面自适应地给显著特征加权。首先,在多尺度池化通道注意力模块中,结合空间金字塔池化的思想,对每个通道上的特征图进行不同尺度的最大池化。接着,采用自适应均值池化将尺寸不同的特征图转换为统一尺寸,以便通过逐像素相加的方式来关注不同尺度的显著特征。然后,在范数空间注意力模块中,将各通道对应同一空间位置的像素构成向量,通过计算向量组的L1范数和L2范数,获得具有空间信息的特征图。最后,采用级联池化的方法优化高层特征,并将该高层特征用于遥感图像检索。在UC Merced, AID与NWPU-RESISC45 3个数据集上进行实验,结果表明该文所提注意力模型,关注了不同尺度的显著特征,结合了空间信息,提高了检索性能。  相似文献   

17.
Deep network has become a new favorite for person re-identification (Re-ID), whose research focus is how to effectively extract the discriminative feature representation for pedestrians. In the paper, we propose a novel Re-ID network named as improved ReIDNet (iReIDNet), which can effectively extract the local and global multi-granular feature representations of pedestrians by a well-designed spatial feature transform and coordinate attention (SFTCA) mechanism together with improved global pooling (IGP) method. SFTCA utilizes channel adaptability and spatial location to infer a 2D attention map and can help iReIDNet to focus on the salient information contained in pedestrian images. IGP makes iReIDNet capture more effectively the global information of the whole human body. Besides, to boost the recognition accuracy, we develop a weighted joint loss to guide the training of iReIDNet. Comprehensive experiments demonstrate the availability and superiority of iReIDNet over other Re-ID methods. The code is available at https://github.com/XuRuyu66/ iReIDNet.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号