共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
基于高密度遮挡下鸟巢识别正确率低的问题,提出一种基于Transformer技术改进的Yolov5变电站鸟巢识别算法模型。首先将现有Yolov5算法原本的Yolo预测头(Yolo Prediction Heads)替换为Transformer预测头(Transformer Prediction Heads, TPH),同时,为了提高对小物体的检测能力新增了一个预测头。然后嵌入卷积注意力模块(Convolutional Block Attention Module, CBAM),提取注意区域,以抵制干扰信息,关注有用的目标对象。最后利用CSPDarknet53结构设计思想,提取最终的特征图,经CSP模块将输出的特征图进行快速降维。实验结果表明,对比Yolov5算法,TPH-Yolov5算法的mAP(Meanaverage Precision)值提高了15.7%。 相似文献
3.
精准感知水位信息变化是实现精细水务管控和洪涝灾害的关键环节之一,而低照度、雾霾、雨雪、冰冻、波浪、镜头抖动等恶劣场景给水位检测带来极大挑战。针对现有方法中难以实现水位精准检测难题,构建一种融合Transformer与残差通道注意力机制的Unet模型(TRCAM-Unet),进而提出基于TRCAM-Unet的恶劣场景水位智能检测方法。关键技术包括通过全尺度连接结构实现多层次特征融合,通过Transformer模块强化区域特征的关联性,通过残差通道注意力模块强化有用信息的表达并削弱无用信息的干扰。相关试验和实践表明,TRCAM-Unet取得了98.84%MIOU评分与99.42%的MPA评分,在约150 m距离外水位检测最大误差不超过0.08 m,水位偏差均值(MLD)仅有1.609×10-2 m,优于Deeplab、PSPNet等主流语义分割算法。研究结果对解决恶劣场景下水位精准检测难题及洪涝灾害预警具有重要应用价值。 相似文献
4.
由于水下环境复杂,采集的水下图像通常是退化的低质图像。因此本文提出一种多注意力机制引导的双目图像超分辨率重建算法,选择性挖掘学习图像特征信息,实现高质量图像重建。针对水下图像分辨率低问题,引入双层注意力机制来加强重要细节特征的学习;然后针对双目图像的视差特性,提出一种视差注意力机制来充分学习左右目图像的先验信息,有效提高了图像质量。在Middlebury数据集2倍和4倍重建图像的信噪比分别为33.3dB和28.39dB,表明本文算法可以在提高图像空间分辨率的同时保留图像细节信息;同时该算法在拍摄的真实水下图像上的重建效果优于其他算法,表明其能实现更高质量的水下图像超分辨率重建。 相似文献
5.
针对图像的底层特征与高层语义特征之间建立映射,使用基于支持向量机(SVM)的语义关联方法,将HSV颜色特征作为SVM的输入参数,对图像库学习和分类,建立图像底层特征与高层语义的关联,并结合图像底层特征和语义信息进行检索.实验表明:该方法提高了检索效率,取得了较高的准确率. 相似文献
6.
7.
为解决当前多模态情感识别效果不佳的问题,提出了一种基于Transformer与增强信息融合的双源情感识别模型,模型由音视频编码分支网络和双源增强特征融合模块组成。其中,视频编码分支利用MobileViTv2提取每帧视频的空间特征,并通过在Transformer编码器结构中内嵌残差结构,强化各帧短期关联语义信息的提取能力。在音频特征提取部分构建了维度匹配器,避免了潜在异构鸿沟,提高了模型训练的鲁棒性。在音视频特征融合处引入低参数量跨模态注意力机制,从两个角度同时增强特征融合能力。通过对比和消融实验证明了方法在多模态情感识别任务中的有效性。 相似文献
8.
针对现有红外与可见光图像融合算法中存在融合图像的纹理细节不清晰,红外信息和纹理细节的显示不平衡等问 题,提出了一种基于注意力密集网络的伪彩色红外与可见光图像融合方法。首先对灰度的红外图像进行伪彩色处理再与彩 色的可见光图像组成多通道数据输入融合网络。其次,设计了一种由卷积层和带有注意力模块的密集连接块组成的生成器 网络结构,关注源图像的关键信息,增强网络提取源图像信息的能力。最后,利用红外像素、可见光像素、可见光梯度和红外 梯度构建内容损失函数,以保持融合图像中红外目标和纹理细节的平衡。与5种具有代表性的融合方法进行定性和定量比 较。结果表明,该方法所获得融合图像的峰值信噪比、信息熵、平均梯度和互信息取得最优值,分别为31.6841、6.5581、 6.0096、3.0960。定量以及定性结果证明所提融合方法使融合图像具有更为丰富的纹理细节以及良好的视觉效果。 相似文献
9.
为实现跨域情形下精确的服装图像检索,从关键区域识别技术和深度度量学习技术两个方面总结了最新研究进展,分析了现有研究中存在的问题.发现关键区域识别技术有助于服装关键特征的提取,可以有效的提升检索精度,但对具有相似特征不同类别的困难样本判别效果不佳,深度度量学习技术是解决这一问题的有效途径,利用不同损失函数的优化以及集成网... 相似文献
10.
人体动作识别是计算机视觉领域的研究热点之一,在人机交互、视频监控等方面具有深远的理论研究意义。为了解决2D CNN无法有效获取时间关系等问题,利用Transformer在建模长期依赖关系上的优势,引入Transformer架构并将其与2D CNN相结合用于人体动作识别,以更好地捕获上下文时间信息。首先使用融合通道-空间注意力模块的2D CNN提取强化的帧内空间特征,其次利用Transformer捕捉帧间的时间特征,最后应用MLP Head进行动作分类。实验结果表明在HMDB-51数据集和UCF-101数据集上分别达到了69.4%和95.5%的识别准确度。 相似文献
11.
针对图像检索时常见的尺度及旋转问题,本文提出了一种基于双树复小波变换的尺度及旋转不变纹理图像检索方法.对图像进行尺度变化的预处理,对原图像和变化后的图像分别进行DT-CWT后,提取纹理特征并插值为特征矩阵;分别在尺度维和旋转维上进行FFT消除尺度和旋转变换影响,得到尺度和旋转不变的特征向量;采用Canberra距离进行相似性度量.通过对尺度及旋转变化的纹理图像库的实验表明,该方法对图像的旋转和尺度变化具有较好的鲁棒性. 相似文献
12.
为提高同时定位与地图构建(simultaneous localization and mapping,SLAM)在室内定位的不同场景下的鲁棒性,应对室内场景纹理少,光线差等极端环境的挑战.通过利用改进快速自动彩色增强(automatic color enhancement,ACE)图像增强技术,优化定向FAST和旋转B... 相似文献
14.
随着大量数字图像数据库的出现,基于内容的图像检索技术成为研究热点。本文针对小波的多尺度分析特性,描述了一种基于小波分析的图像检索算法,在小波变换域内提取出图像的显著特征点,然后提取显著特征点的颜色和纹理特征,颜色选取HSV空间,纹理特征用Gabor小波幅值的均值与方差表示,通过相似性匹配实现图像的检索。最后,本文通过实验证实了这种方法具有较高的检索精度,与基于角点检测方法的图像检索相比,检索效果与人的视觉更加相符。 相似文献
15.
为了实现高准确率要求的数字出版物中引用图片的侵权审查,提出了一种基于改进SIFT算法的图像检索算法。该改进算法首创性地提出了在特征提取过程中加入图像SIFT特征点的邻域颜色特征,并设计了双匹配的特征点匹配策略,增强了特征点匹配的可靠性,提升了图像检索的性能。该改进算法被分为3个步骤来实现:基于灰度和HSV彩色空间的双尺度空间的生成,结合传统SIFT特征点描述子和特征点颜色特征向量的新特征点描述子的生成,特征点搜索与双匹配。实验结果表明,与原始的SIFT算法相比,本文改进算法的检索精度更高,并且检索速度没有明显下降。 相似文献
16.
基于形状特征的图像检索系统的设计 总被引:1,自引:0,他引:1
基于图像形状特征的图像检索方法已成为一个研究热点。为了便于在众多的图像信息库中快速、准确的检索出所需图像,研究了基于形状特征图像检索的主要步骤,且对步骤中所涉及的算法做了比较、选取、改进。利用MATLAB语言开发了一个基于形状特征的图像检索系统。并对该系统进行了测试,通过测试表明该系统可以有效的检索出相似的图像,且对于实验结果做了查全率和查准率的计算与分析,结果证明该系统切实可行具有一定的推广价值和使用价值。 相似文献
17.
18.
19.
20.
在无人值守变电站中,电力变压器作为常用和主要的设备,其运行状况必须能实时监测,当出现异常状况时应给出相应的报警.提出了一种基于颜色特征的变压器渗漏油检测方法,通过差分法检测出异常区域,对异常区域的H-S颜色直方图进行分析,当前后图像的黄褐色部分变化较大时可认为其发生了渗漏油异常.实验表明,此方法简单易行,能较准确地检测出变压器的渗漏油异常,并能很好地消除影子对检测结果的影响. 相似文献