首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 187 毫秒
1.
为解决弱监督车辆重识别方法中标签不准确和背景干扰下预定义局部区域难以获得的问题,提出一种基于弱监督注意 力和知识共享的车辆重识别网络。 在弱监督注意力模块(WAM)中使用弱监督的方法生成车辆部件掩模,通过部件通道对齐步 骤使得该模块在复杂背景下也能自适应地进行特征对齐。 针对弱监督方法中标签准确性不高导致 WAM 模块生成部件掩模不 稳定的问题,在局部分支中构建了知识共享模块。 该模块利用迁移学习从 WAM 模块中提取车辆部件特征,并进行多尺度部件 特征提取,防止了不稳定的车辆部件掩模生成。 通过实验,mAP、CMC@ 1 和 CMC@ 5 分别达到了 82. 12%、98. 50%和 99. 12%, 优于现有的方法,验明该方法的有效性。  相似文献   

2.
如今,利用合成的成对数据集训练的有监督模型泛化能力弱,在多变的实际水下环境中表现不佳,而无监督模型虽摆脱 了成对数据集的依赖,但生成图像可能因缺少特征信息导致图像视觉质量较差。 故以循环生成对抗网络为架构,提出多特征选 择与双向残差融合的水下图像增强方法。 一方面,设计以混合注意力为基础的多特征选择模块对水下图像的多种特征进行选 择,再由双向残差融合对传统 U 型跳跃连接进行优化,使图像特征高效表达,有效恢复水下图像的纹理与色彩。 另一方面,在 判别器中引入混合注意力并提出内容感知损失和风格感知损失,保证增强图像在全局内容、局部纹理、风格特征等方面和清晰 图像一致。 与现有的无监督和有监督模型相比较,该模型 PSNR 分别提高了 6%和 2%,SSIM 分别提高了 4%和 3%,对水下图像 有着显著的增强效果,在色彩真实度和饱和度上相比其他现有方法更加优秀。  相似文献   

3.
为解决烟尘环境对红外图像增强处理的干扰,突出目标的轮廓细节,提出一种基于引导滤波图像分层的红外烟尘图像增强方法。首先利用引导滤波将图像拆分为基础层与细节层,对细节层使用分数阶微分掩模作增强处理;然后基于红外烟尘图像的特点设计了二次分层方法,利用各项异性扩散将基础层分为原始层与轮廓层;之后对原始层进行自适应直方图均衡化,对轮廓层进行增益放大并与细节层合并;最后利用平均亮度设置权值函数,将两层图像进行加权融合得到增强图像。实验结果表明,相较于其他增强算法,该方法能够更有效的提高烟尘干扰下红外图像的清晰度,突出其细节纹理特征,增强后3组图像的平均梯度和信息熵平均值为7.721 1及5.811 4,相较于原始图像提升1.011 9及3.177 8。  相似文献   

4.
针对目前已有的可见光图像生成红外图像的算法不能感知图像的弱纹理区域而导致生成的图像细节信息不突出、图像质量低的问题,本文提出了一种适用于图像生成任务的改进循环生成对抗网络(CycleGAN)结构。首先,利用特征提取能力更强的残差网络构建CycleGAN的生成器网络结构,使图像特征可以充分被提取,解决图像因特征提取不充分导致图像质量低下的问题;其次,在生成器的网络结构中引入了通道注意力机制和空间注意力机制,利用注意力机制对图像感知能力较差的区域进行权重处理,解决图像纹理细节丢失的问题。在OSU数据集上,本文所提出的方法相较于CycleGAN方法在峰值信噪比(PSNR)以及结构相似性(SSIM)指标上分别提高了7.1%和10.9%,在Flir数据集上的PSNR和SSIM分别提高了4.0%和6.7%。经过多个数据集上的实验结果证明,本文改进的方法能够突出图像生成任务中的细节特征信息,并且能有效地提升图像生成的质量。  相似文献   

5.
为了解决可见光图像在微弱光环境下会出现检测性能下降的问题,本文提出了一种半监督域适应的行人检测算法。首先,结合均值教师模型和YOLOv8检测器搭建半监督检测网络;其次,使用图像融合算法和风格迁移算法相结合的方式生成伪图像进行伪交叉训练,减少图像之间的域差异问题;最后,将基于Transform的混合注意力机制引入主干特征提取网络,在提升图像分辨率的同时进一步提升检测精度。实验结果表明:在LLVIP数据集和KAIST数据集上,该算法的检测精度分别达到89.3%和66.8%,相比SSDA-YOLO算法分别高出7.6%和19.8%;相比Efficient Teacher算法分别高出4%和8.7%;相比全监督算法ICAFusion分别高出1.8%和17.9%。与以往的算法相比,该算法具有更高的检测精度。  相似文献   

6.
针对现有算法在修复大面积破损区域的壁画图像时容易出现特征提取困难,上下文结构不一致等问题,提出一种基于双判别生成对抗网络的壁画图像虚拟修复。首先,将U-Net架构引入生成网络,结合扩张卷积与跳跃连接实现多尺度特征融合提取,利用重构损失初步构建修复模型。其次利用双重判别网络,保证图像全局一致性的同时,加强修复后的局部细节。最后交替训练生成网络和双重判别网络,加权重构损失和WGAN-GP损失,进一步优化网络模型,完成破损壁画图像的虚拟修复。根据创建的壁画数据集,进行训练测试,并与多组修复算法进行修复对比,结合主客观评价指标进行评价,结果表明,该算法修复的壁画图像质量更优,较好的完成了较大区域受损壁画图像的整体一致性修复。  相似文献   

7.
深度学习模型应用于输电线路绝缘子目标检测时,在训练样本方面存在公开样本集缺乏和优质样本不足的问题,为此提出一种基于循环一致性生成对抗网络(cycle-generative adversarial networks,Cycle-GAN)的绝缘子图像生成方法。首先分析绝缘子样本集,对绝缘子图像基于背景色彩特征进行风格域划分;之后在划分好的绝缘子风格域样本集基础上,采用Cycle-GAN生成绝缘子图像样本;最后,搭建分类网络验证生成图像用于扩充的有效性,并进一步探究了生成图像不同扩增比例对分类性能的影响。结果表明:绝缘子生成样本可一定程度上替代真实样本;生成图像不同扩充比例对网络性能影响不同,当扩充比例在40%~50%时,分类网络性能提升效果最佳。  相似文献   

8.
无监督立体匹配算法在自动驾驶等领域有重要的应用,然而无监督立体匹配算法在物体连续、边缘等细节信息区域的视差精度较低,本文提出了一种提高细节信息区域精度的无监督立体匹配算法。通过在特征金字塔网络中引入空间注意力机制和残差网络,设计了一种空间特征金字塔网络算法,抑制特征提取过程中边缘和小目标细节信息的丢失。构建了视差融合模块,将半全局立体匹配算法生成的原始视差和视差回归生成的初步视差进行置信度视差融合,提升连续细节信息区域的精度。对于网络损失函数,集成了原始视差监督损失和置信度遮挡损失,保留更多图像边缘和连续区域处的细节信息。实验结果表明,本文算法在KITTI 2015测试集中非遮挡区域和所有区域的误匹配率分别为6.24%和5.89%,与其他经典算法相比在细节信息区域的效果、精度方面有较大提升。  相似文献   

9.
为了解决当前红外图像增强算法难以较好地兼顾边缘增强与噪声抑制,导致增强结果易丢失细节与视觉不自然的问题,提出了基于结构特征先验与多尺度反锐化掩模机制的红外图像增强算法。首先,利用8个边缘核与8个角点核,对Prewitt梯度算子进行拓展,从多个方向来提取红外图像的结构特征映射;随后,利用结构特征映射来计算红外目标的约束控制函数,并基于Gibbs先验模型,构建结构特征先验,获取红外图像对应的最优估计;基于红外图像的多尺度特征,引入贝叶斯函数,并联合最优估计,对红外图像完成有序平滑处理;最后,利用多尺度特征映射来改进传统的反锐化掩模算法,对平滑后的红外图像完成增强。实验结果显示,与当前红外图像增强方案相比,所提算法具有更高的增强质量与噪声抑制能力,可以更好地保持图像细节,其模糊线性指数与熵值分别为0. 21、7. 35。  相似文献   

10.
针对气泡缺陷特征和图像背景像素差异较小、检测困难的问题,以Skip-GANomaly为基础框架,提出了融合注意力机制生成对抗网络(FAMGAN),首先,生成器中编码器和解码器之间的跳连层由注意力特征融合模块(AFF)和注意力机制模块(CBAM)构成,提高了对目标特征的关注、减少了图像特征丢失;然后,在判别器中加入联合上采样模块(JPU),提高了模型检测图像缺陷的速度。最后,将本文提出的FAMGAN网络与近几年经典的生成对抗网络在自制的轮胎缺陷数据集上进行训练、测试和评估。实验结果表明,本文提出的网络对轮胎气泡缺陷检测的精度达到0.837,相比于Skip-GANomaly网络提高了近30%。  相似文献   

11.
基于深度哈希的图像检索方法往往利用卷积和池化技术去提取图像局部信息,并且需要不断加深网络层次来获得全局长依赖关系,这些方法一般具有较高的复杂度和计算量。本文提出了一种注意力增强的视觉Transformer图像检索算法,算法使用预训练的视觉Transformer作为基准模型,提升模型收敛速度,通过对骨干网络的改进和哈希函数的设计,实现了高效的图像检索。一方面,本文设计了一个注意力增强模块,来捕获输入特征图的局部显著信息和视觉细节,学习相应的权重以突出重要特征,并增强输入到Transformer编码器的图像特征的表征力。另一方面,为了提高图像检索的效率,设计了一种对比哈希损失函数,生成具有判别力的二进制哈希码,从而降低了内存需求与计算复杂度。在CIFAR-10和NUS-WIDE数据集上的实验结果表明,本文提出的方法,在两个不同数据集上使用不同哈希码长度的平均精度均值达到了96.8%和86.8%,性能超过多种经典的深度哈希算法和其他两种基于Transformer架构的图像检索算法。  相似文献   

12.
针对建立无人起重装卸目标检测深度学习标注数据耗时问题,设计了货物图像检测生成对抗网络,构成准确的含语义标注和关键点标注的数据集,该数据集可用于有监督深度学习语义分割模型的训练。通过融合StyleGAN与DatasetGAN的生成对抗网络,对实际应用中存在的语义特征变形问题进行改进,将生成器的样本归一化层进行修改,去除均值操作,修改噪声模块和样式控制因子的输入方式;对纹理特征单一的物体的空间位置编码能力弱的问题,将生成网络的常数输入替换为傅里叶特征,并提出一个融合非线性上下采样的模块;最后引入WGAN-GP对目标函数进行改进。应用实验生成标签数据集,使用Deeplab-V3作为评价网络,以DatasetGAN方法作为基线,在语义标签生成任务上,Deeplab-V3输出mIOU值提高14.83%,在关键点标签生成任务上,L2损失平均降低0.4×10^(-4),PCK值平均提高5.06%,验证了改进的生成对抗网络生成语义及关键点标注数据的可行性和先进性。  相似文献   

13.
传统卷积神经网络虽然具有较好的应用准确度,但是其的主要缺陷是效率低,为解决这一问题,弱监督算法被提出,现有的弱监督学习算法标记训练样本较少,效率较理想,但是仍然存在误分类率较高等不足。为了同时满足高效率和高精度的要求,本研究结合了弱监督算法和卷积神经网络,提出一种基于类别空间约束的弱监督卷积神经网络特征学习算法。首先,建立弱监督卷积神经网络特征学习算法的网络模型;其次,通过对空间加以约束,使标记样本和未标记样本建立一定的联系,从而实现特征空间聚类;最后,利用模型训练样本数据,实现基于类别空间约束的弱监督卷积神经网络特征学习算法的设计。实验结果表明,所提方法误分类率达到5%,分类耗时不超过0.4 ms,能够更好地开展特征学习。  相似文献   

14.
螺栓缺陷非常容易引起输电线路异常甚至故障,但大量的缺陷数据难以获得。将生成式对抗网络应用于缺陷螺栓图像的生成,针对生成过程中存在的图像质量差、生成样本单一,模型收敛缓慢等问题,提出一种基于改进DCGAN的螺栓图像生成方法。首先在损失函数中加入相对均值鉴别器和梯度惩罚,平衡了生成器和判别器的能力,提高了样本质量和模型的收敛速度;然后在模型的生成器和鉴别器中引入注意力机制,捕获图像中长距离的像素特征,提高了缺陷样本的多样性;实验结果验证了改进方法的有效性,实现了缺陷样本的扩增。  相似文献   

15.
In recent years, sustainable sources of energies attract significant interest due to the serious environmental issues of fossil fuels. Rooftop photovoltaic (PV) panels are among the important power generation technologies exploited in many modern countries. Most PV panels are installed behind-the-meter (BTM), resulting in a lack of observability of actual load and PV power generation in a power distribution system. This paper proposes a novel supervised spatiotemporal approach to accurately disaggregate the net-load data of a set of neighboring residential units. To this end, spatiotemporal correlations of a group of neighboring residential units are modeled using a weighted undirected graph where the nodes store the temporal features. The edges reflect the spatial correlation between neighboring residential units and are determined by the information analysis technique. Afterward, a generative graph attention recurrent neural network (RNN) is devised for capturing highly nonlinear patterns of input graphs using an RNN encoder. In addition, to boost the generalization capacity and robustness of the proposed model, we reconstruct the input graphs using sparse contractive decoders. Finally, an extreme learning machine (ELM) neural network is employed to disaggregate the input net-load time-series of a set of residential units using the extracted complex spatiotemporal patterns. Experimental results on the real-world Pecan Street dataset demonstrate the superiority of the proposed RNN-ELM method over the recent BTM disaggregation techniques.  相似文献   

16.
提出了一种基于油色谱时频域数据和残差注意力的变电站故障分类模型.对收集到的油色谱数据,计算其频域分量和时频域分量的特征比值,将所有数据作为网络的输入来训练网络;残差注意力网络通过跨层连接的方式来堆叠注意力模块,以降低网络的过拟合影响并提升模型训练速度,同时注意力模块能够重点关注对结果影响大的信息,进一步提高对变电站故障...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号