首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对在高分辨率输电线路图像中,不同种类部件尺度跨越大,难以被均衡检测的问题,提出一种融合高效注意力的多尺度输电线路部件检测算法。在YOLO v5目标检测算法中,设计添加高效注意力模块ECBAM提高算法特征提取能力。根据输电线路部件的特征分布统计,使用滑动窗口对高分辨率输电线路图像进行切片,并对切片前后的图像分别使用改进后的YOLO v5算法训练模型。将两个模型的检测结果进行集成,得到多尺度输电线路部件检测结果。在公开的PLAD架空输电线路图像数据集上,该模型的检测性能远超现有目标检测模型,Precision可达83.2%,Recall可达92.8%,相比数据集原作者提出的模型,mAP值提升了1.6个百分点,达到了90.8%,且能检测出未在原始数据集上标注出的隐蔽目标,验证了在高分辨率图像中检测多尺度输电线路部件的有效性。  相似文献   

2.
针对小目标检测精度低、检测过程中易出现目标漏检和误检等问题,提出一种改进的YOLO v5道路小目标检测算法。首先在YOLO v5中计了ConvFocus模块;在特征融合部分使用双线性插值上采样操作,并插入5个CBAM注意力机制模块,减少小目标特征的丢失,增强小目标语义及位置信息;另外增加了一个大小为160×160的小目标检测层,利用浅层特征层中包含的丰富的语义及位置信息精确定位识别小目标。实验使用KITTI数据集,对该数据集进行处理并划分训练集和测试集。实验结果表明,改进的YOLO v5模型在KITTI数据集上平均精度均值达到96.5%,与原YOLO v5算法相比有显著提高,小目标检测效果更好。  相似文献   

3.
深度卷积神经网络模型在很多公开的可见光目标检测数据集上表现优异, 但是在红外目标检测领域, 目标 样本稀缺一直是制约检测识别精度的难题. 针对该问题, 本文提出了一种小样本红外图像的样本扩增与目标检测算 法. 采用基于注意力机制的生成对抗网络进行红外样本扩增, 生成一系列保留原始可见光图像关键区域的红外连 续图像, 并且使用空间注意力机制等方法进一步提升YOLOv3目标检测算法的识别精度. 在Grayscale-Thermal与 OSU Color-Thermal红外–可见光数据集上的实验结果表明, 本文算法使用的红外样本扩增技术有效提升了深度网 络模型对红外目标检测的精度, 与原始YOLOv3算法相比, 本文算法最高可提升近20%的平均精确率(mean average precision, mAP).  相似文献   

4.
为提高YOLOv5s目标检测算法在检测图像中小目标时的准确度,本文研究引入注意力机制来提高神经网络对于图像特征提取的能力。将三种注意力机制CBAM、CoordAtt和GAM分别与YOLOv5s相融合,并在小目标数据集上进行训练。实验的结果显示,在YOLOv5s算法中添加注意力机制时,需考虑注意力机制在网络中的添加位置、该机制与数据集任务之间是否匹配以及预训练权重的影响。  相似文献   

5.
针对现有基于注意力机制的多模态学习,对文字上下文之间的自我联系和图像目标区域的空间位置关系进行了深入研究。在分析现有注意力网络的基础上,提出使用自注意力模块(self-attention,SA)和空间推理注意力模块(spatial reasoning attention,SRA)对文本信息和图像目标进行映射,最终得到融合特征输出。相较于其他注意力机制,SA和SRA可以更好地将文本信息匹配图像目标区域。模型在VQAv2数据集上进行训练和验证,并在VQAv2数据集上达到了64.01%的准确率。  相似文献   

6.
随着计算机硬件和人工智能技术的发展,强监督目标检测算法已经取得了很大的成果。然而,强监督目标检测算法需要在大规模、标注精度高的数据集上进行训练。但在某些特定领域,上述条件要求过于苛刻。例如,军事上常用的迷彩伪装目标的图像数据集就比公共数据集更难获得且标注难度更大。因此,采用对数据集要求更低的弱监督目标检测算法来实现迷彩伪装目标的检测任务。由于图像中迷彩伪装目标与背景融合度较大,导致原始浅层特征感知伪监督目标定位(Shallow feature-aware Pseudo supervised Object Localization, SPOL)算法的检测精度相对较低。本文的核心是在SPOL算法的基础上融合注意力机制,通过加入注意力模块,让模型更加关注迷彩伪装目标的区域,以此来提高迷彩伪装目标的检测精度。  相似文献   

7.
迷彩伪装技术能有效降低目标的视觉显著度,对迷彩目标检测任务造成巨大的挑战.在RetinaNet检测框架的基础上,针对迷彩目标特性嵌入了空间注意力和通道注意力模块,并基于定位置信得分构建了新的预测框过滤算法,有效实现了对迷彩伪装人员的检测.在扩展后的伪装人员数据集上的实验表明,该模型将检测精度提升了8.7个百分点,达到了...  相似文献   

8.
本文针对图像中小目标难以检测的问题,提出了一种基于YOLOv5的改进模型.在主干网络中,加入CBAM注意力模块增强网络特征提取能力;在颈部网络部分,使用BiFPN结构替换PANet结构,强化底层特征利用;在检测头部分,增加高分辨率检测头,改善对于微小目标的检测能力.本文算法在人脸瑕疵数据集和无人机数据集VisDrone2019两份数据集上均进行了多次对比实验,结果表明本文算法可以有效地检测小目标.  相似文献   

9.
图像自动语句标注利用计算机自动生成描述图像内容的语句,在服务机器人等领域有广泛应用.许多学者已经提出了一些基于注意力机制的算法,但是注意力分散问题以及由注意力分散引起的生成语句错乱问题还未得到较好解决.在传统注意力机制的基础上引入注意力反馈机制,利用关注信息的图像特征指导文本生成,同时借助生成文本中的关注信息进一步修正图像中的关注区域,该过程不断强化图像和文本中的关键信息匹配、优化生成的语句.针对常用数据集Flickr8k, Flickr30k和MSCOCO的实验结果表明,该模型在一定程度上解决了注意力分散和语句顺序错乱问题,比其他基于注意力机制方法标注的关注区域更加准确,生成语句更加通顺.  相似文献   

10.
目的 太赫兹由于穿透性强、对人体无害等特性在安检领域中得到了广泛关注。太赫兹图像中目标尺寸较小、特征有限,且图像分辨率低,目标边缘信息模糊,目标信息容易和背景信息混淆,为太赫兹图像检测带来了一定困难。方法 本文在YOLO(you only look once)算法的基础上提出了一种融合非对称特征注意力和特征融合的目标检测网络AFA-YOLO(asymmetric feature attention-YOLO)。在特征提取网络CSPDarkNet53(cross stage paritial DarkNet53)中设计了非对称特征注意力模块。该模块在浅层网络中采用非对称卷积强化了网络的特征提取能力,帮助网络模型在目标特征有限的太赫兹图像中提取到更有效的目标信息;使用通道注意力和空间注意力机制使网络更加关注图像中目标的重要信息,抑制与目标无关的背景信息;AFA-YOLO通过增加网络中低层到高层的信息传输路径对高层特征进行特征融合,充分利用到低层高分辨率特征进行小目标的检测。结果 本文在太赫兹数据集上进行了相关实验,相比原YOLOv4算法,AFA-YOLO对phone的检测精度为81.15%...  相似文献   

11.
传统图像描述算法存在提取图像特征利用不足、缺少上下文信息学习和训练参数过多的问题,提出基于ViLBERT和双层长短期记忆网络(BiLSTM)结合的图像描述算法.使用ViLBERT作为编码器,ViLBERT模型能将图片特征和描述文本信息通过联合注意力的方式进行结合,输出图像和文本的联合特征向量.解码器使用结合注意力机制的BiLSTM来生成图像描述.该算法在MSCOCO2014数据集进行训练和测试,实验评价标准BLEU-4和BLEU得分分别达到36.9和125.2,优于基于传统图像特征提取结合注意力机制图像描述算法.通过生成文本描述对比可看出,该算法生成的图像描述能够更细致地表述图片信息.  相似文献   

12.
为解决传统目标检测算法在血细胞检测任务中出现的检测精度偏低、错检及漏检等问题,提出了一种基于YOLO框架的改进目标检测算法YOLO-Att,该算法在YOLO框架结构的基础上,在骨干网络中增加了一种多尺度残差增强模块,结合低层信息丰富网络的特征层次,进而提高特征信息利用率;并设计了一种注意力门控结构嵌入模型,以获取更多高质量的主要特征信息;同时使用Focal loss代替原损失函数中的交叉熵,提高正负样本权重,加快模型收敛速度;采用[K]-means++聚类算法对目标进行锚框优化,进一步提升检测准确率。相较于现有的Faster-RCNN、SSD以及YOLOv4等目标检测算法,YOLO-Att在通用血细胞数据集BCCD检测任务中,将mAP提高至66.32%,检测速率达到了85.4?ms,更符合血细胞检测任务的实时性。  相似文献   

13.
水下目标检测是海洋探测开发过程中一项具有挑战性的任务。针对现有的水下目标检测算法由于水下图像的低可见度和颜色失真等问题导致水下目标检测效果不佳的问题,提出了一种改进YOLOv7的水下目标检测算法,旨在提升水下目标检测性能。设计了一种多信息流融合注意力机制(spatial group-wise coordinated competitive attention,SGCA),解决卷积过程中由于图像全局上下文信息丢失而导致特征丢失的问题,提高了模型在图像模糊情况下的检测精度;并利用switchable atrous convolution(SAConv)模块替换ELAN结构中的3×3卷积模块,以增强骨干网络的特征提取能力。在预测部分采用Wise-IoU作为损失函数,Wise-IoU通过平衡不同质量图像上的模型训练结果,获得更准确的检测结果。采用基于暗通道先验(dark channel prior,DCP)和深度传输图的水下图像增强方法对水下数据集图像进行增强。实验结果表明,改进后的算法在自建的水下目标检测数据集上mAP取得了87.3%,与原始的YOLOv7算法相比较,mAP提高了3.4个百分...  相似文献   

14.
姚鲁  宋慧慧  张开华 《计算机应用》2020,40(10):3048-3053
目前用于图像超分辨率重建的通道注意力机制存在注意力预测破坏每个通道和其权重的直接对应关系以及仅仅只考虑一阶或二阶通道注意力而没有综合考虑优势互补的问题,因此提出一种混合阶通道注意力网络的单图像超分辨率重建算法。首先,该网络框架利用局部跨通道相互作用策略将之前一、二阶通道注意力模型采用的升降维改为核为k的一维卷积。这样不仅使得通道注意力预测更直接准确,而且得到的模型相比之前的通道注意力模型更简单;同时,采用改进一、二阶通道注意力模型以综合利用不同阶通道注意力的优势,提高网络判别能力。在基准数据集上的实验结果表明,和现有的超分辨率算法相比,所提算法重建图像的纹理细节和高频信息能得到更好的恢复,且在Set5和BSD100数据集上感知指数(PI)分别平均提高0.3和0.1。这表明此网络能更准确地预测通道注意力并综合利用了不同阶通道注意力,一定程度上提升了性能。  相似文献   

15.
为了提高图像分类性能,本文提出一种多模型特征和注意力模块融合的图像分类算法(image classification algorithm based on Multi-model Feature and Reduced Attention fusion,MFRA).通过多模型特征融合,使网络学习输入图像不同层次的特征,增加特征互补性,提高特征提取能力;通过加入注意力模块,使网络更关注有目标的区域,降低无关的背景干扰信息.本文算法在Cifar-10,Cifar-100,Caltech-101这3个公开数据集上的大量实验对比,验证了其有效性.与现有算法对比,本文算法的分类性能有较为明显的提升.  相似文献   

16.
姚鲁  宋慧慧  张开华 《计算机应用》2005,40(10):3048-3053
目前用于图像超分辨率重建的通道注意力机制存在注意力预测破坏每个通道和其权重的直接对应关系以及仅仅只考虑一阶或二阶通道注意力而没有综合考虑优势互补的问题,因此提出一种混合阶通道注意力网络的单图像超分辨率重建算法。首先,该网络框架利用局部跨通道相互作用策略将之前一、二阶通道注意力模型采用的升降维改为核为k的一维卷积。这样不仅使得通道注意力预测更直接准确,而且得到的模型相比之前的通道注意力模型更简单;同时,采用改进一、二阶通道注意力模型以综合利用不同阶通道注意力的优势,提高网络判别能力。在基准数据集上的实验结果表明,和现有的超分辨率算法相比,所提算法重建图像的纹理细节和高频信息能得到更好的恢复,且在Set5和BSD100数据集上感知指数(PI)分别平均提高0.3和0.1。这表明此网络能更准确地预测通道注意力并综合利用了不同阶通道注意力,一定程度上提升了性能。  相似文献   

17.
朱旭东  熊贇 《计算机工程》2022,48(4):173-178+190
图像多标签分类作为计算机视觉领域的重要研究方向,在图像识别、检测等场景下得到广泛应用。现有图像多标签分类方法无法有效利用标签相关性信息以及标签语义与图像特征的对应关系,导致分类能力较差。提出一种图像多标签分类的新算法,通过利用标签共现信息和标签先验知识构建图模型,使用多尺度注意力学习图像特征中目标,并利用标签引导注意力融合标签语义特征和图像特征信息,从而将标签相关性和标签语义信息融入到模型学习中。在此基础上,基于图注意力机制构建动态图模型,并对标签信息图模型进行动态更新学习,以充分融合图像信息和标签信息。在图像多标签分类任务上的实验结果表明,相比于现有最优算法MLGCN,该算法在VOC-2007数据集及COCO-2012数据集上的mAP值分别提高了0.6、1.2个百分点,性能有明显提升。  相似文献   

18.
为解决传统模型与算法对遥感卫星图像小目标的分割精度低、泛化能力差等问题,提出一种基于改进U-Net的图像分割算法。将骨干网络改为ResNet18并加入优化后的空洞卷积池化金字塔与卷积注意力机制模块,充分提取小目标边缘特征。该算法在中国南部某地区的公开卫星图像数据集上的平均交并比与分割总精度分别达到了75.8%与95.6%,均超过U-Net、DeepLabV3+、SegNet、W-Net等主流语义分割网络。实验结果表明,该算法能有效改善网络的预测精度与小目标的分割结果。  相似文献   

19.
航拍图像目标检测存在多尺度目标检测精度低、检测速度慢、漏检和误检严重等问题.针对这些问题,提出一种融合卷积注意力机制和轻量化网络的目标检测算法(pro-YOLOv4),并应用于多尺度航拍图像目标检测.首先,利用K-means聚类算法对航拍数据集进行聚类分析并优化锚框参数,以提高对目标检测的有效性;其次,采用轻量级网络结构,精简网络复杂度,提高检测速度;最后,引入卷积注意力模块来解决复杂场景对于航拍目标检测的干扰,从而有效降低误检率和漏检率.在航拍数据集RSOD和NWPU VHR-10上进行实验对比,实验结果表明,pro-YOLOv4检测效果较YOLOv4有明显提升,平均检测精度分别提高了3.42%和3.98%.该算法不仅对多尺度目标均表现出较好检测性能,还降低了目标漏检率,并具有较好的鲁棒性和泛化能力.  相似文献   

20.
针对夜间车辆检测模型的精度要求,提出以夜间车辆为研究对象,利用深度学习中的卷积神经网络构建检测模型。首先对数据集进行白平衡处理以减少路灯颜色的干扰进而增强图像画质,并用Mosaic数据增强来丰富检测数据集进而提升模型对小目标车辆的检测效果;其次针对先验框的选取采用K-means+〖KG-*3〗+算法,并利用交并比距离对先验框进行聚类;接着向主干特征提取网络加入注意力机制模块来增强残差结构特征图中目标的通道和空间特征信息;最后在损失函数的原始置信度交叉熵损失中引入梯度均衡机制,使模型有效衰减难易样本。通过在UA-DETRAC数据集的实验与对比分析可知:本文提出的夜间车辆检测算法的精度可达99.24%,同时每秒处理图像帧数高达19帧,验证了该算法的有效可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号