首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
针对SSD(single shot multibox detector)算法在复杂交通场景下对交通标志小目标识别效果不佳的问题,提出一种基于多尺度特征互补和重点特征信息挖掘(multi-scale feature complementary fusion and key feature information mining SSD,MK-SSD)的目标检测改进算法。利用跨阶段局部网络设计多尺度特征互补模块,同时构建多路径特征融合网络,有效提升浅层网络对小目标的特征提取能力。设计联合权重分配模块,将感知域与重点信息挖掘相结合,更高效地利用重点特征信息并抑制对非重点信息的关注度。利用轻量化残差块对预测网络进行改进,提升目标检测能力。经实验分析,改进后的算法在自制交通标志数据集上平均准确率达到89.64%,在保证实时性的同时,相较于YOLO系列和SSD系列算法拥有更高的检测精度,能检测出大部分SSD网络漏检的小目标。  相似文献   

2.
针对现阶段很多实时语义分割算法分割精度低,尤其对边界像素分割模糊的问题,提出一种基于跨级注意力机制和多标签分类的高精度实时语义分割算法.首先基于DeepLabv3进行优化,使其达到实时运算速度.然后在此网络基础上增加跨级注意力模块,使深层特征为浅层特征提供像素级注意力,以抑制浅层特征中不准确语义信息的输出;并在训练阶段引入多标签分类损失函数辅助监督训练.在Cityscapes数据集和CamVid数据集上的实验结果表明,该算法的分割精度分别为68.1%和74.1%,分割速度分别为42帧/s和89帧/s,在实时性与准确性之间达到较好的平衡,能够优化边缘分割,在复杂场景分割中具有较好的鲁棒性.  相似文献   

3.
车辆检测是智能交通系统重要的一个研究方向.针对监控视角下的车辆检测问题,提出了一种改进YOLOX算法的车辆检测方法.使用网络深度更小的YOLOX_S模型,对网络结构改进.使用GHOST深度可分离卷积模块代替部分传统卷积,在保证模型检测精度的同时减少模型参数;将CBAM注意力模块融合到特征提取网络中,并添加特征增强结构,加强特征提取网络获得的特征图语义信息,增强提取网络对目标的检测能力;通过使用CIoU_loss优化损失函数,提高模型边界框的定位精度.测试实验结果表明,改进后的网络识别准确率提升了2.01%,达到95.45%,证明了改进方法的可行性.  相似文献   

4.
经典孪生网络弱特征目标跟踪存在鲁棒性差的问题。为此,设计了一种融合目标二维位置信息注意力机制的孪生网络算法。该算法以区域候选孪生网络(siamese region proposal network,SiamRPN)为基础,包括特征提取网络部分和相似度计量部分。在特征提取网络部分,引入了位置信息注意力模块来提取目标特征二维位置信息以提升网络对弱目标的特征提取能力。采用了轻量深度特征提取网络MobileNetV2来减少特征提取网络部分模型参数和计算量;在相似度计量部分,基于多层特征融合的相似度计量方法深入挖掘特征提取网络浅层特征的定位信息和深层特征的语义信息,加强了算法的跟踪准确性和定位精度。实验结果表明,所提出的算法在UAV123数据集上成功率相较于SiamRPN基础算法提升了12.6%,跟踪精度提升了8.4%,且跟踪速度每秒74帧,在提升成功率的同时满足了实时性的要求。  相似文献   

5.
针对当前遥感影像背景复杂、目标尺度小等情况导致的检测精度偏低的问题,基于FCOS网络提出了一种结合位置注意力和感受野增强的遥感影像目标检测算法PARF-FCOS;该算法构造了一种位置注意力模块,并利用该模块对特征提取网络进行改进,增强网络对目标信息的提取能力;在特征融合阶段使用感受野模块(RFB, receptive field block)增强浅层特征图,利用目标上下文信息进行辅助判断,提升网络对小尺度目标的检测能力;在训练过程中,引入距离交并比损失(DIoU loss,distance intersection over union loss)进行边界框回归,通过优化目标框与预测框中心点之间的距离,使回归过程更加平稳和准确;在公开数据集DIOR上评估了PARF-FCOS目标检测算法,实验结果表明,相较于原始FCOS,算法的平均精确度均值提高了4.3%,达到70.4%,检测速度达到23.2FPS。  相似文献   

6.
针对浅层特征缺乏语义信息和小目标特征不显著的问题,提出了一种基于多尺度特征融合和注意力的低空无人机(unmanned aerial vehicle,UAV)检测方法。首先提出一种多尺度特征融合模块,将不同尺度的特征图进行有效融合,使浅层特征图的细节纹理信息和深层特征图的语义信息得到充分的利用,改善浅层特征语义信息不足的问题。然后在网络特征图输出处引入一种不降维局部跨信道交互策略和核大小自适应选择的通道注意力机制,以极其轻量级的方式获取跨通道的交互信息。为使先验框和有效感受野匹配,优化默认框设置方法,更好地检测小目标。使用自制无人机数据集进行验证,结果表明改进后算法平均准确率为84.07%,比原始SSD(single shot multibox detector)算法提高了7.81个百分点,检测速度达到31.3?frame/s。  相似文献   

7.
王拓然  程娜  丁士佳  王洪玉 《计算机应用研究》2023,40(11):3472-3477+3508
为了应对当前大型图像超分辨率模型参数过多难以部署,以及现有的轻量级图像超分辨率模型性能表现不佳的问题,提出了一种基于自适应注意力融合特征提取网络的图像超分辨率模型。该模型主要由一个大核注意力模块和多个高效注意力融合特征提取模块组成。首先,利用大核注意力模块进行浅层特征提取,然后将提取到的浅层特征信息输入级联的高效注意力融合特征提取模块进行深层特征提取、增强、细化和再分配的聚合操作。高效注意力融合特征提取模块由三个部分组成,分别是渐进式残差特征提取模块、通道对比度感知注意力模块和通道—空间联合注意力模块。该网络可以在利用少量参数的情况下实现更好的图像超分辨率性能,是一种表现优异的轻量级图像超分辨率模型。通过在流行的基准数据集上评估提出的方法,并与现有的一些方法进行对比,结果表明该方法的表现更优异。  相似文献   

8.
为提升车辆重识别算法的性能,提出一种基于车辆组件特征与多注意力融合的特征学习方法.首先,修改深度残差网络以获取具有丰富语义信息的特征图,同时应用语义分割网络将车辆图像划分为车辆正面、背面、顶面、侧面及背景区域,以实现组件特征提取并消除视角变化的影响.然后,设计多注意力融合模块,基于面积注意力与特征注意力实现组件特征的自适应融合.最后,在多任务学习框架下,优化车辆重识别的三元组损失与辅助分类任务的交叉熵与焦点损失,对网络参数进行训练.在多个数据集上的实验结果表明,提出的方法在大多数性能指标上均超越了现有方法.进一步的消融实验证明了多注意力融合模块与多任务损失函数在特征提取上的有效性.  相似文献   

9.
针对遥感图像背景复杂、小目标多、特征提取难等问题,提出了一种注意力特征融合的快速遥感图像目标检测算法——YOLO-Aff。该算法设计了一种带通道注意力的主干网络模块(ECALAN)以及模糊池(BP)模块来减小下采样带来的损失。此外,采用了一种无跨步卷积的特征金字塔网络(SPD-FPN)结合SimAM注意力特征融合模块(CBSA)来增强特征的跨尺度融合能力。最后,通过使用Wise-IoU作为网络的坐标损失来优化样本不均衡问题。实验结果表明,改进的YOLO-Aff算法在NWPU VHR-10数据集上的mAP值达到96%,较原算法mAP提高了2.9个百分点,为遥感图像的快速、高精度目标检测提供了新的解决方案。  相似文献   

10.
行人重识别是指从一堆候选图片中找到与目标最相似的行人图片,本质上是一个图像检索的子问题。为了进一步增强网络提取关键特征的能力以及抑制噪声的干扰,通过对基于注意力机制和局部特征的行人重识别算法的研究,提出了结合注意力与局部特征融合的行人重识别算法。该算法将ResNeSt-50作为骨干网络,联合软注意力与非局部注意力机制,采用双流结构分别提取行人细粒度全局特征和细粒度局部特征,通过关注不同特征之间共享的空间域信息以及同一特征不同水平区域的潜在语义相关性,创建了空间感知特征融合模块(spatial-aware feature fusion module)以及跨区域特征融合模块(cross-region feature fusion module)。在Market-1501、DukeMTMC-reID以及CUHK03数据集上的实验结果表明该算法极大程度上提升了网络的检索能力,同时与现有算法进行比较,凸显出优越性能。  相似文献   

11.
使用有效的特征提取算法对虹膜纹理进行准确的表达是虹膜识别技术的关键。基于虹膜识别任务的特殊性,提出了用于虹膜特征编码的网络模型IrisCodeNet。该网络架构使用了改进的BasicBlock,并结合了可以扩大决策边界的损失函数AM-Softmax(additive margin softmax)。为了获取最佳的虹膜识别效果,对AM-Softmax的参数设置、虹膜图像预处理输入形式、数据增强方式、网络输入尺寸做了细致的研究。实验结果表明:使用IrisCodeNet训练得到的特征提取器在CASIA-Iris-Thousand、CASIA-Iris-Distance、IITD虹膜数据库上进行测试,所评估的等错误率(equal error rate,EER)和正确接受率(true acceptance rate,TAR)均远远超过了广泛应用的传统算法。特别地,IrisCodeNet无需传统的虹膜归一化或精确的虹膜分割步骤依然取得了极好的识别效果。并且使用Grad-CAM(gradient-weighted class activation mapping)算法进行了可视化分析,结果表明该网络框架有效地关注了虹膜纹理信息,从而证明了IrisCodeNet具有较强的虹膜纹理特征提取能力。  相似文献   

12.
针对基于深度学习的动态手势识别方法网络规模庞大、提取的时空特征尺度单一、有效特征的提取能力不足等问题,提出了一种深度网络框架。首先,使用时域多尺度信息融合的时空卷积模块改进3D残差网络结构,大幅度缩小网络规模,获得多种尺度的时空感受野特征;其次,引入一种全局信息同步的时空特征通道注意力机制,使用极少量参数构建特征图通道之间的全局依赖关系,使模型更加高效地获取动态手势的关键特征。在自建手势数据集SHC和公开手势数据集SKIG上的实验结果显示,提出的手势识别方法参数量更少且多尺度时空特征提取能力强,识别率高于目前的主流算法。  相似文献   

13.
人脸表情识别属于一种细粒度识别,模型需要同时聚焦于浅层与深层特征。针对独立结构的卷积神经网络对细粒度特征的提取、融合能力不足的问题,提出一种基于支路辅助学习的网络结构。在基础网络的输入层引入一条支路辅助网络,该网络将逐层使用金字塔卷积块提取全局特征;通过特征映射模块不断将支路提取到的决策信息传导至基础网络,辅助基础网络提取细节特征;在模型输出层采用特征拼接的方式将支路网络与主路网络融合。将所提出的网络在公开人脸表情数据集CK+、JAFFE、FER2013和MMEW上进行识别实验,结果表明:支路辅助学习模块能够有效提升基础网络的特征提取能力和泛化能力,提出的方法识别率达到了98.89%、94.80%、71.88%和86.67%,比仅采用基础网络(例如:ResNet50)进行识别提高了3.49、2.2、5.51和1.48个百分点。  相似文献   

14.
城市道路场景下的行人目标尺寸变化大,并且人群密集容易引起遮挡问题,增加了行人检测难度。为了提高城市道路区域行人检测的准确性和实时性,更好应对驾驶场景的实际需求,对You Only Look Once(YOLO)方法进行改进。原YOLO模型分为行人特征提取阶段和行人坐标回归阶段,将浅层特征与深层特征多尺度融合,增加骨架网络的特征提取效果;添加注意力机制,在特征融合后加入空间通道增强模块,并且将GIoU损失引入网络训练过程,提高对遮挡目标的识别能力;结合行人尺寸,提出CrossYOLO层对网络宽度进行调整,加快了模型运算速度。在Caltech行人基准数据集下进行验证实验,结果表明YOLO-Person模型与原YOLO以及其他流行方法相比,对小目标和遮挡目标误检率更低,并且速度更快,具有一定的实际应用价值。  相似文献   

15.
为了实现养殖场环境下无接触、高精度的奶牛个体有效识别,针对SSD(single shot multibox detector)算法识别准确率不高的问题,提出一种基于浅层特征模块的改进SSD(shallow feature module SSD,SFM-SSD)算法。将原始SSD算法的主干网络由VGG16替换为MobileNetV2,以降低网络的运算量,改善检测的实时性;针对SSD网络结构的浅层特征图设计浅层特征模块,扩大浅层特征图的感受视野,提高浅层特征图对目标物体的特征提取能力;利用[K]均值聚类算法重构区域候选框,提高算法的检测精度。实验结果表明:在奶牛个体识别任务中,SFM-SSD算法的平均准确率比原始的SSD算法提升3.13个百分点。同时检测的实时性也得到改善。  相似文献   

16.
为了更好地对股票价格进行预测,进而为股民提供合理化的建议,提出了一种在结合长短期记忆网络(LSTM)和卷积神经网络(CNN)的基础上引入注意力机制的股票预测混合模型(LSTM-CNN-CBAM),该模型采用的是端到端的网络结构,使用LSTM来提取数据中的时序特征,利用CNN挖掘数据中的深层特征,通过在网络结构中加入注意力机制--Convolutional Attention Block Module(CBAM)卷积模块,可以有效地提升网络的特征提取能力。基于上证指数进行对比实验,通过对比实验预测结果和评价指标,验证了在LSTM与CNN结合的网络模型中加入CBAM模块的预测有效性和可行性。  相似文献   

17.
心血管疾病已成为威胁人类生命健康的主要疾病之一。心电图是临床上常见的诊断心律失常的重要方法并被广泛用于监测心脏病患者的健康状况。由于现有的医疗资源匮乏,使用人工智能的方法来分析和诊断从而克服这些局限性的需求愈加迫切,在临床中使用自动检测和分类方法,可以帮助医生对疾病做出准确、快速的诊断。本文对8种常见的心律失常类型进行分类,提出一种基于对抗域自适应的心电信号深度学习分类的方法,解决并改善训练样本标注不足和个体差异导致的数据分布差异现象等问题。该方法包括3个模块:多尺度特征提取A模块、域识别B模块和多分类器C模块。A模块由2组不同的并行卷积块组成,增加了特征提取的宽度。B模块由3个卷积块和1个全连接层组成,用于充分提取浅层特征。在C模块中,将时间特征和深度学习提取特征串联在全连接层上,增强特征多样性。实验结果表明,该方法在准确率、敏感性和阳性预测值上可达到98.8%、97.9%和98.1%,所提出的模型可以帮助医生在常规心电图中准确地检测不同类别的心律失常。  相似文献   

18.
针对传统脱机手写汉字识别的过程复杂、精度低,而常用卷积神经网络的特征信息提取不充分,同时存在相同特征信息的重叠和冗余问题。设计了一个特征分组提取融合的深度卷积神经网络模型。通过多级堆叠的特征分组提取模块,提取图像的深层抽象特征信息,并进行特征信息之间的交流融合。利用设计的下采样和通道扩增模块,在降低特征维度的同时保留图像重要信息。将特征信息进行精炼和浓缩,来解决特征信息的重叠和冗余问题。最终训练出的神经网络达到top1当前先进的正确率为97.16%,同时top5正确率为99.36%,并具有很好的泛化能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号