首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 60 毫秒
1.
行人属性识别是计算机视觉领域中的研究热点,在人工智能、安防监控等方面有着极其广泛的应用.传统的行人属性识别方法主要基于底层特征提取,如局部描述符、颜色直方图和人体关键点检测等,但难以解决图像分辨率低和行人被遮挡等原因造成的识别率低下的问题.近年来,随着深度学习在行人属性识别算法中的应用,基于常规网络、部件识别、注意力机...  相似文献   

2.
为了在复杂环境下对V-SLAM闭环检测的准确率-召回率有更好的鲁棒性,提出一种在图神经网络中结合多重注意力机制的局部特征匹配算法,并在闭环检测上进行应用。首先,采用SuperPoint检测器获取图像序列中的关键点,再将提取出来的特征点输入关键点编码器内,通过多层感知器将其升维到与局部描述子维度一样;然后,同时经过多重注意力机制网络中重复9次,得到更具有代表信息的局部描述子;其次,在最优匹配层中采用SinkHorn算法求解出最优匹配矩阵,通过对阈值的合理设定,得到闭环检测结果;最后,在New College和City Centre两个公共数据集上与5种其他闭环检测基准算法进行实验,结果表明该算法在召回率一定的情况下,其准确率比其他实验算法的要高,有更强的鲁棒性,满足闭环检测要求。  相似文献   

3.
针对传统的行人重识别算法需要依赖大量带标签的行人图像数据,以及系统难以部署等问题,提出使用ResNet50作为模型的骨干网络.通过增加CBAM注意力机制,分组卷积,层次聚类和实例学习等方法实现无监督行人重识别.同时,使用欧式距离来进行相似性度量,对最终识别结果加以验证.实验结果表明:所提出的基于分组卷积的无监督注意机制行人重识别方法能够提高网络模型在未知数据域的泛化能力,减少了模型的训练参数.  相似文献   

4.
进入新世纪,科技的发展造就了大数据的爆发式增长,这为基于深度学习方法来研究地质学问题奠定了基础。卷积神经网络已被用于地质填图,但卷积操作关注的是数据空间维度的特征信息,无法建模不同通道维度之间的依赖关系。为了发掘不同通道的输入数据和特征图之间的关联性,提升智能地质填图的效果,本文在全卷积神经网络Unet中引入通道注意力模块——挤压—激励模块(Squeeze and Excitation Block, SE Block),提出了一种新网络SE—Unet,并将该网络应用于湖南省鲤鱼塘地区的1∶5万智能地质填图。实验结果表明,相比于Unet, SE—Unet智能地质填图的总体精确度由81.58%提高到了83.72%,可视化结果显示,两种原来难以识别的地质单元被大致识别出来。这验证了通道注意力机制能够提升网络的学习和表征能力,也说明了本方法对于提升智能地质填图效果的可行性与有效性。  相似文献   

5.
针对复杂工程场景常用的行人检测方法(尤其在小目标检测方面)精度低、复杂度高的问题,提出一种基于YOLOv5网络的改进识别方法。在骨干网络与颈部网络引入ECA注意力机制,提升模型对通道特征的关注度以抑制背景噪声;使用加权双向特征金字塔结构BIFPN对颈部网络进行修改,加强模型对不同尺度特征融合;使用Ghost模块替换骨干网络与颈部网络的部分卷积,减少模型参数、缩小体积。结果表明:提出的改进模型检测精度达到了88.4%,同时,模型的复杂度(参数量与模型大小)仅为13.5×106与6.67 MB;与目前主流的深度学习方法相比,该算法在检测精度与复杂度上具有更好的性能,在复杂的场景下具有较好的识别效果。  相似文献   

6.
7.
针对现有的视觉位置识别方法在图像外观变化和视角变化时准确性和鲁棒性表现不佳的问题,提出了一个与注意力机制结合的视觉位置识别方法。首先,采用在大型位置数据集上预训练的卷积神经网络HybridNet提取特征。然后,运用上下文注意力机制对图像不同区域分配权重值,构建基于多层卷积特征的注意力掩码。最后,将掩码与卷积特征结合,构建融合注意力机制的图像特征描述符,从而提高特征的鲁棒性。在两个典型位置识别数据集上做测试实验,结果表明结合注意力机制的方法可以有效区分图像中与位置识别有关的区域和无关的区域,提高在外观变化和视角变化场景中识别的准确性和鲁棒性。  相似文献   

8.
相比于传统机器学习算法,卷积神经网络"端到端"的黑盒特性使其内部工作机制缺乏透明性和可解释性,导致其在某些安全性要求较高的领域受到一定限制.为此,提出一种基于注意力机制的卷积神经网络可视化方法,用于可视化解释卷积神经网络中间层所学特征.该方法首先将注意力机制添加到网络结构中,跟随网络一起训练;然后,获取训练后模型的最高...  相似文献   

9.
在解决行人再识别技术中的姿态变化、遮挡、背景等问题时,为了提高遮挡下的行人再识别性能,提出一种基于注意力机制和姿态识别的行人再识别方法。采用全局注意网络和姿态识别网络分别提取行人图像的全局特征、关节点位置热力图和对应的置信度,通过计算得到行人13个关节点和融合所有关节点的局部特征,对全局特征和14个局部特征分别进行行人分类训练,利用多任务学习多个损失共同监督网络的优化。测试时,将关键点特征和全局特征融合后,计算行人的距离排序。在Market1501和DukeMTMC-reID数据集上测试的Rank-1/mAP指标分别达到了85.1%/75.6%和64.3%/55.3%。结果表明,所设计方法具备抗姿态变化、遮挡和背景的能力,同时具有较高的识别能力和识别精度。  相似文献   

10.
卷积神经网络(Convolutional Neural Networks,CNN)无法判别输入文本中特征词与情感的相关性.因此提出一种双注意力机制的卷积神经网络模型(Double Attention Convolutional Neural Networks,DACNN),将词特征与词性特征有效融合后得到本文的特征表示,确定情感倾向.本文提出局部注意力的卷积神经网络模型,改进卷积神经网络的特征提取能力,采用双通道的局部注意力卷积神经网络提取文本的词特征和词性特征.然后使用全局注意力为特征分配不同的权重,有选择地进行特征融合,最后得到文本的特征表示.将该模型在MR和SST-1数据集上进行验证,较普通卷积神经网络和传统机器学习方法,在准确率上分别取得0.7%和1%的提升.  相似文献   

11.
针对现有的协同显著性检测算法在多显著目标复杂场景下表现不佳的问题,提出了一种基于高效通道注意力和特征融合的协同显著性检测算法。首先,检测算法利用预训练的深度卷积神经网络对场景进行多尺度特征的提取,结合边缘显著信息设计了显著性语义特征提取模块,以避免全卷积神经网络导致边缘信息的缺失;其次,通过内积基本原理得到组内图片间的关联性信息并根据其关联程度进行自适应加权,结合高效通道注意力层设计了协同特征提取算法;最后,为了将各级高层语义特征经过协同显著性特征提取之后的结果与浅层次的特征进行融合,并实现对预测结果进行多分支同步监督,设计了基于高效通道注意力的特征融合模块。通过对3个经典的数据集进行测试,并与6种现有的协同显著检测算法进行对比,结果表明本文所提算法提高了复杂场景中图像的协同显著性检测的精度以及边缘信息的丰富程度,并具有更优的协同显著性信息检测性能;通过消融实验进一步验证了所提设计算法各个模块的有效性和必要性。  相似文献   

12.
针对现有基于注意机制的图像描述方法全局信息缺失问题,提出了一种改进的全局注意机制图像描述方法。该方法在注意机制的基础上,通过设计全局特征网络来模拟人类感知机制的全过程,对图像全局特征进行增强。将所提方法在相同数据集和网络超参数的情况下与目前最优网络进行实验对比,分析了全局信息对生成文本的影响。实验结果显示,文中提出的方法在更具挑战性的中文文本描述任务上客观评价指标优于目前最优的模型。同时,在主观评价中能够生成更准确的文本内容,也更具丰富性与多样性,接近自然语言描述。  相似文献   

13.
因受成像设备限制,得到的人脸图像分辨率通常较低,针对此问题提出了一种将生成对抗网络和注意力机制相结合的方法,来对人脸图像进行多尺度超分辨率重建。将深度残差网络和深度神经网络分别作为生成器和判别器,并将注意力模块与深度残差网络中的残差块相结合,重建出与高分辨率图像高度相似且难以被判别器区分的超分辨率人脸图像。实验结果证明,所提出的方法能够有效地提升人脸图像的分辨率,同时也证明了注意力机制在图像细节信息重建中的重要作用。  相似文献   

14.
基于视觉注意机制的红外图像小目标检测方法   总被引:1,自引:0,他引:1  
提出了适用于红外序列图像小目标检测的二步骤计算模型和算法.该算法处理的第一阶段通过对象的显著性计算,快速提取潜在目标的集合,在第二阶段对这个集合进行更为细致的识别,剔除伪目标,检测出真实目标.这种方法在没有牺牲其他性能指标的前提下,大幅度地改善了运算复杂度,为实现有限条件下系统的实时处理提供了基础.  相似文献   

15.
基于软注意力机制的图像描述算法,提出类激活映射-注意力机制的图像描述方法。利用类激活映射算法得到卷积特征包含定位以及更丰富的语义信息,使得卷积特征与图像描述具有更好的对应关系,解决卷积特征与图像描述的对齐问题,生成的自然语言描述能够尽可能完整的描述图像内容。选择双层长短时记忆网络改进注意力机制结构,使得新的注意力机制适合当前全局和局部信息的特征表示,能够选取合适的特征表示生成图像描述。试验结果表明,改进模型在诸多评价指标上优于软注意力机制等模型,其中在MSCOCO数据集上Bleu-4的评价指标相较于软注意力模型提高了16.8%。类激活映射机制可以解决图像空间信息与描述语义对齐的问题,使得生成的自然语言减少丢失关键信息,提高图像描述的准确性。  相似文献   

16.
为了提高高光谱图像在有限训练样本下的分类性能,提出了一种基于双池化注意力机制的高光谱图像分类网络(DPAMN).首先,采用三维卷积提取高光谱图像的空间和光谱浅层信息.其次,为了增强网络的特征提取能力,在DPAMN中引入了一种双池化注意力机制.最后,在网络的深层引入三维卷积密集连接模块,该模块不仅能够充分提取高光谱图像的空间和光谱特征,同时还能提高特征的判别能力.实验结果表明,在Indian Pines、University of Pavia、Salinas以及Houston 2013数据集上分别取得95.45%、97.11%、95.30%以及93.71%的整体平均精度,与目前主流的已有先进方法相比,所提出的方法在4个数据集上均有较大提升,表明所提方法具有较强的泛化能力.  相似文献   

17.
基于视觉图像的船舶目标检测中由于图像背景复杂,无关干扰较多,导致船舶目标检测的难度增大。并且多类别船舶检测数据集现有数量较少且存在样本不均衡的问题使得船舶目标检测性能较低。针对复杂背景干扰检测,本文通过引入SimAM注意力机制对YOLOv3模型进行改进,利用该机制加强船舶目标在提取特征中的权重并抑制背景干扰权重,从而提升模型检测性能;同时,采用强实时数据增强以改善样本尺度分布不均衡的问题,结合迁移学习提升在样本数量受限情况下的船舶检测精度。提取特征的可视化结果显示改进模型对无关背景特征干扰进行了抑制,增强了模型对于船舶特征的提取能力。在SeaShips数据集上,提出的改进模型在不引入额外可学习参数的情况下mAP.5、mAP.75分别达到了96.93%、71.49%,检测速度达到了66 frame/s,在检测精度与运行效率方面保持了均衡。与Saliency-aware CNN、eYOLOv3相比更有效地优化了目标特征,使得mAP.5分别提高了9.53%、9.19%。改进模型在新加坡海事数据集上在船舶类型目标检测的mAP.5达到了81.81%,验证了模型具有较好的泛化能力。  相似文献   

18.
针对以往剩余使用寿命(RUL)预测方法对轴承退化信息挖掘不充分、忽视不同特征贡献度差异,影响预测准确性的问题,提出基于多尺度特征与注意力机制的轴承RUL预测方法. 在多个尺度下计算轴承原始振动信号的若干时域和频域特征,作为输入特征集. 将多尺度特征集输入到网络中,以注意力模块为不同特征自适应地分配最佳权重,以卷积神经网络(CNN)模块进行深层特征提取与多尺度特征融合,通过前馈神经网络(FNN)模块映射得到RUL预测值. 通过公开的轴承数据集进行实验验证,与其他RUL预测方法相比,所提方法的预测性能更优越.  相似文献   

19.
针对传统目标检测算法(SSD)检测小目标精度低的问题,提出基于注意力机制与多尺度信息融合方法并将其运用于车辆检测任务.结合浅层特征图与深层特征图的优势,小目标检测分支和大中型目标检测分支的特征图采用5支路和2支路融合.在基础网络层之间加入注意力机制模块,模型会关注包含更多信息量的通道.实验结果表明,在自建车辆数据集上的均值平均精度(m AP)达到90.2%,比传统SSD算法提高了10.0%,其中小目标检测精度提高了17.9%;在PASCAL VOC 2012数据集上的类别平均精度mAP为83.1%,比主流的YOLOv5算法提高了6.4%.此外,提出算法在GTX1 660 Ti PC端的检测速度可以达到25帧/s,能够满足实时性的需求.  相似文献   

20.
在SAR图像车辆目标检测过程中,车辆轮廓定位不仅能够提供车辆位置信息,而且还能够为车辆状态分析提供依据,是SAR图像理解的关键步骤。但SAR图像中乘性斑点噪声会对轮廓定位造成干扰,增加车辆目标检测的难度。针对这一问题,提出了一种注意力机制的SAR图像像素级车辆目标检测网络。该网络由目标筛选、目标定位和轮廓细化三个模块构成。目标筛选在一个轻量级的特征提取网络中采用通道注意力和自注意力机制,在抑制噪声影响的同时对包含目标图像进行快速筛选,并提供稳定的定位热力图;目标定位利用掩码交叉注意力机制根据定位热力图优化粗尺度特征细化目标定位,并融入细尺度信息改善目标轮廓细节;轮廓细化通过轮廓点筛选消除上采样及噪声带来的轮廓不确定点获取准确的轮廓像素点置信度。对MSTAR数据集进行车辆像素级标注,建立SAR图像车辆数据集及大场景图像数据集用于网络测试。实验结果表明,该网络具有良好的像素级检测性能,可实现大场景SAR图像中车辆目标的快速精确检测。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号