首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
提出了一种基于特征调和筛选的X射线不锈钢焊缝缺陷语义分割模型。通过池化与特征调和筛选块对输入图像进行下采样,利用特征注意模块为相同层级的特征图进行通道与空间重新赋权,并且使用反卷积逐步恢复特征图大小。实验表明:在X射线不锈钢焊缝缺陷数据集上进行语义分割识别性能时,本方法MIoU指数达到了53.87%,相较于其他方法,本方法具有更高的识别准确度与图像处理速度,具有一定的工程应用价值。  相似文献   

2.
通过对图像中感兴趣的对象进行分类与定位,能够帮助人们理解唐卡图像丰富的语义信息,促进文化传承。针对唐卡图像样本较少,背景复杂,检测目标存在遮挡,检测精度不高等问题,本文提出了一种结合多尺度上下文信息和双注意力引导的唐卡小样本目标检测算法。首先,构建了一个新的多尺度特征金字塔,学习唐卡图像的多层级特征和上下文信息,提高模型对多尺度目标的判别能力。其次,在特征金字塔末端加入双注意力引导模块,提升模型对关键特征的表征能力,同时降低噪声的影响。最后利用Rank&Sort Loss替换交叉熵分类损失,简化模型训练的复杂度并提升检测精度。实验结果表明,所提出的方法在唐卡数据集和COCO数据集上的10-shot实验中,平均检测精度分别达到了19.7%和11.2%。  相似文献   

3.
针对当前图像多标签分类方法只关注图像本体类别信息(本体),而忽略图像深层次语义信息(隐义)的问题,本文提出了一种"本体-隐义"融合学习的图像多标签分类模型。该模型首先利用CNN中间层和较高层分别学习图像的本体信息和隐义信息,然后利用本体信息与隐义信息之间的依赖关系设计了融合学习模型,同时对提出模型的不同中间层特征和模型的不同结构进行了深入研究,最终实现了对图像中多类别以及各类别蕴含的隐义信息分类。在传统民族服饰纹样图像数据集上进行实验,得到图像本体多标签分类和隐义多标签分类的mAP分别为0.88和0.82;在Scene数据集上进行对比实验,本文模型在Hamming loss,One-error以及Average precision指标上分别优于其他最好方法0.103,0.091和0.083,实验结果证明了本文方法的有效性和优越性。  相似文献   

4.
基于CReLU和FPN改进的SSD舰船目标检测   总被引:1,自引:0,他引:1  
在遥感图像中,舰船目标具有目标尺寸较小、形状细长、多个目标紧密排列、类间相似度高等特点,现有的深度学习目标检测算法对舰船小目标的检测精度不高,易发生错检、漏检情况。为了更有效地利用遥感图像信息,提高小目标检测精度,构建了舰船数据集SDNGV,提出基于串行修正线性单元CReLU和特征金字塔网络(FPN)改进的单射探测器(SSD)舰船目标检测识别方法。首先,在SSD网络的浅层添加CReLU,提升其浅层特征的传递效率;然后,采用FPN从网络的深层到浅层逐级融合SSD中用于检测的多尺度特征图,提升网络的定位精度和分类精度。实验表明,所提目标检测算法具有较好的检测精度,改进方法具有明显的效果,在舰船小目标的检测上有10%的检测精度提升。  相似文献   

5.
为了解决遥感图像场景分类中因样本量小而分类精度不高的问题,提出了一种基于多尺度特征融合(MSFF)的分类方法。首先,对遥感图像进行尺度变换,得到同一遥感源图像的多个不同尺度图像。接着,将其分别输入深度卷积神经网络(DCNN)中进行卷积操作。然后,将各卷积层和全连接层提取出的不同尺度特征进行降维和编码/平均池化操作。最后,将各尺度特征进行编码融合并利用多核支持向量机(MKSVM)进行场景分类。在两个公开遥感图像数据集UCM Land-Use和NWPU-RESISC45中进行试验,分类精度最高分别达到98.91%和99.33%。本文方法能够利用不同尺度的图像特征,结合低、中、高层语义表示,使融合特征的可辨识性更高,同时使用多核支持向量机提高了深度网络学习的泛化能力,因此分类效果更好。  相似文献   

6.
为提高图像语义分割准确程度,针对场景解析中类别边缘分辨清晰度,提出了一种基于多路径网络的权值调整图像语义分割算法。通过引入多路径网络和权值调整并对图像场景中的物体类别具有的特征进行分析,提高图像的语义分割的准确程度;通过采用ADE20K数据集进行训练,提高边缘信息的分割效果,使模型具有更好的泛化能力。此算法加快了网络收敛速度。  相似文献   

7.
依据轴测图中存在的仿射不变性 ,提出 5个描述多边形拓扑和几何特征的特征向量 ,以这些特征向量为约束条件给出轴测投影下类似形的定义。提出基于类似形原理匹配轴测图新方法。基于类似形原理可将轴测图中的面分类。匹配过程限制在类似形基础上 ,可大大减少搜索范围。用拓扑结构定性分析类似形对图像中的噪声不敏感 ,用几何特征进行定量分析能反应轴测图的细小差别。该匹配算法能识别不同形状的目标 ,而且还可以区分形状相同但大小、比例不同的目标。实验结果表明该匹配方法是有效的。  相似文献   

8.
基于模糊分类的弱小目标检测方法   总被引:4,自引:2,他引:2  
李欣  赵亦工  陈冰  薛晶 《光学精密工程》2009,17(9):2311-2320
提出了一种新的基于模糊分类的红外云层背景弱小目标检测方法。本文直接从待分类图像入手提取出不同的类别区域,这样得到的分类模板就准确的体现了当前图像的不同类别,在此基础上进行分类就能得到图像的准确的类别分类从而实现弱小目标检测。首先,对红外天空背景弱小目标图像进行分析,将图像中的三类物体:净空、云及弱小目标细分为11个类别区域;其次,定义了类别特征矢量并基于此提出了类别核的定义;再次,根据类别核的定义从待检测图像中提取出11类区域的类别核;最后,根据模糊分类的理论,定义了类别相似系数和类别贴近度,通过类别核对图像进行分类和类别归并,保留弱小目标类别完成检测。实验结果表明,该方法能够对红外弱小目标图像中不同类型的区域进行准确分类,较好的实现了对低信杂比的复杂云层背景图像中的弱小目标检测。  相似文献   

9.
针对手机镜头固定槽表面缺陷过小导致自动化质检平台难以检测的问题,提出改进YOLOv5的镜头固定槽表面缺陷检测算法实现。在图片预处理阶段使用有效的数据增强策略来平衡不同类别样本的分布;在FPN中添加融合因子控制特征图融合时深层传递到浅层的信息,得到含有更多小目标信息的多尺度特征图;使用K-means算法得到更适合本数据集的先验框数量和大小。通过采集的镜头固定槽表面缺陷数据集评估本算法的性能,并和基线算法YOLOv5进行对比分析。实验结果表明,改进的算法对小目标缺陷拥有更好的检测效果,并且对各类缺陷均能实现准确分类定位,平均精度均值(mAP)达到92.70%,满足智能制造自动化生产的需求。  相似文献   

10.
由于航空图像背景复杂,包含的物体类别多样,航空图像分类任务仍然面临困难。针对传统航空图像多标签分类算法准确率低、泛化性差的问题,本文提出了一种基于循环神经网络多标签航空图像分类方法。首先,采用超像素分割获取图像的低层特征,通过注意力机制生成注意力特征图;接着,采用交叉验证的方式获取最佳的图像尺度,将多尺度注意力特征图嵌入卷积神经网络中对图像进行特征提取;最后,采用改进的双向长短期记忆网络挖掘标签之间的相关性,改进的双向长短期记忆网络增加了输入门到输出门之间的连接,使输入状态可以更好地控制每一内存单元输出的信息,并且将遗忘门和输入门合并成单一的更新门,使得改进的双向长短期记忆网络可以学到更长时期的历史信息。结果显示,在图像变换尺度为1,1.3,2时,模型在UCM多标签数据集上的精确率和召回率分别达到了85.33%和87.05%,F1值达到了0.862。本文方法相比于原始VGGNet16模型,精确率提高了7.25%,召回率提高了8.94%。实验表明,该方法可以有效提高航空图像多标签分类任务的准确率。  相似文献   

11.
为了解决复杂图像背景下无人机航拍图像小目标检测问题,提出了一种基于Faster R-CNN的多尺度小目标检测方法。以高压塔上的鸟巢为检测对象,首先通过改进卷积神经网络ResNet101对目标进行特征提取,然后采用多尺度滑动窗口方式在不同分辨率卷积特征图上获取目标初始建议区域,最后在选取的分辨率较高的卷积特征图上增加一个反卷积操作进一步对特征图的分辨率进行提升,并作为建议窗口的特征映射层传入目标检测子网络中。通过对无人机实际航拍图像中鸟巢的检测结果表明,所提出的算法可以实现对航拍图像中小目标的精确检测。  相似文献   

12.
针对小样本数据集条件下深度学习算法的方案图像智能决策限制问题,提出一种基于胶囊网络的产品形态设计决策模型.应用人工智能方法搭建基于产品形态语义的多视角图像数据集,并将数据集图像进行预处理和特征提取.再利用卷积层学习得到图像特征,将不同卷积层中的若干特征划分为一组,生成具有丰富语义特征的主胶囊.利用动态路由算法获取一组数...  相似文献   

13.
为了解决类能量图易受人体运动时间和位置移动等因素影响而难以有效描述动作细节特征的问题,本文提出了一种基于类能量图金字塔梯度直方图(PHOG)融合特征和多类别Adaboost分类器的人体行为识别方法。该方法首先对经过躯体配准的运动人体目标轮廓图像构造平均运动能量图(AMEI)和增强的运动能量图(EMEI),分别提取其分层梯度方向直方图(PHOG)特征并进行串联融合,作为一种多层次的行为特征描述;然后使用基于查找表的LUT-Real Adaboost算法设计多类别分类器,实现图像中人体行为动作的识别。实验结果显示其在典型的人体动作数据集DHA上的正确识别率达97.6%,高于其它采用单一特征描述和SVM等分类器的方法。表明该方法将整体与局部特征相结合,可以有效描述不同尺度下的动作细节特征,增强了人体行为特征的描述能力,提高了识别性能。  相似文献   

14.
为了解决复杂图像背景下无人机航拍图像小目标检测问题,提出了一种基于Faster R-CNN的多尺度小目标检测方法。以高压塔上的鸟巢为检测对象,首先通过改进卷积神经网络ResNet101对目标进行特征提取,然后采用多尺度滑动窗口方式在不同分辨率卷积特征图上获取目标初始建议区域,最后在选取的分辨率较高的卷积特征图上增加一个反卷积操作进一步对特征图的分辨率进行提升,并作为建议窗口的特征映射层传入目标检测子网络中。通过对无人机实际航拍图像中鸟巢的检测结果表明,所提出的算法可以实现对航拍图像中小目标的精确检测。  相似文献   

15.
为解决图像背景复杂造成图像检索效果差的问题,提出了一种结合主体检测的图像检索方法。该方法首先训练用于目标检测的深度卷积神经网络模型,利用训练好的模型检测查询图像中的物体类别、类别概率和其所在区域坐标及特征。根据物体的类别概率和其所在区域的坐标判断图像主体后,在数据库中查找和主体类别相同的图像。计算查询图像与检索的同类别图像之间区域特征的余弦距离,结合类别概率对所有检索图像进行打分排序,返回分值最高的前10幅图像作为检索结果。最后在VCO2007数据集和自己收集的书页数据集上进行算法验证。实验结果表明,在随机选取的1 000幅测试图片检索结果的全正确率为96.5%,比现有方法提升了6.6个百分点。本文方法可有效排除图像背景的干扰,得到更加准确的检索结果和定位精度。  相似文献   

16.
针对机器人在抓取目标工件的过程中由于光线强度变化、图像环境复杂和拍摄设备移动等造成的工件识别精度低的问题,文章提出一种改进YOLOv5s的工件识别检测算法。首先,通过数据增强扩充数据集并进行预处理;其次,使用改进的k-means聚类算法重新生成更有效的预设锚框,缩短收敛路径;然后,在特征融合网络中添加CBAM注意力机制,有效抑制背景信息干扰,提高特征提取速度;此外,将特征融合模块中原有的特征金字塔结构替换成加权双向特征金字塔Bi-FPN结构,实现高效的加权特征融合和双向跨尺度连接,提高网络对不同尺度特征的融合效率;最后,通过采用α-IoU作为边界框回归损失函数,提高模型的定位效果。结果表明,改进后的YOLOv5s算法对工件检测的mAP值提升了6.03%,检测速度提升了13.7 fps,验证了改进算法的有效性。  相似文献   

17.
针对在传统的道路目标识别中,需要进行手工提取特征,模型的泛化能力差。使用深度学习的技术,提出了使用深度卷积神经网络(SSD)解决道路目标问题。该方法首先对图像特征进行自动提取,在基础网络后添加不同尺寸的特征图,然后对多尺寸的特征图做卷积滤波,得到目标坐标值和目标的类别。实验中,在SSD模型中增加了特征图的检测层数,增大原图像尺寸,调试相应的参数,经过多次迭代,最终得到目标模型。实验采用行车记录仪采集的图像,在图像中标定出车辆、行人和骑行的人三类,实验表明,检测目标尺寸越小,检测难度越大,检测效果越差,SSD模型对目标检测的平均准确率均值提高了0.082。提出的道路目标检测方法与传统目标识别算法相比,省去了手工特征提取,减少了工作量,提高了模型的泛化能力。  相似文献   

18.
随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战,主要表现为不同类别的像素区分不够清晰、对于复杂场景结构的理解不够精准以及对小尺度对象或大尺度结构的分割不准确等问题。为此,本文提出一种基于跨层次聚合网络的实时城市街景语义分割算法。首先,在编码器末端设计了结合跨层次聚合的金字塔池化模块,用于高效提取多尺度上下文信息;其次,在编码器和解码器之间设计了跨层次聚合模块,通过引入通道注意力机制增强信息的表征能力,逐级聚合编码器阶段的特征以充分实现特征复用;最后,在解码器阶段设计了多尺度融合模块,在通道维度聚合全局信息与局部信息,促进深层特征与浅层特征的融合。将所提算法在两个通用的城市街景数据集上进行了验证。在一张RTX3090显卡上(TensorRT测速环境),本文算法在Cityscapes测试集以294 FPS的实时性达到73.0%mIoU的准确性,在更高分辨率的图像上以164 FPS的实时性达到75.8%mIoU的准确性;...  相似文献   

19.
针对双目视觉测量中工件表面轮廓形状和尺寸的自动检测问题,提出一种新的基于边缘曲率角的工件三维轮廓信息提取方法。首先,针对不同边缘点误匹配率不同的特点,提出一种基于灰度相关的边缘点分类匹配算法获取边缘点云数据。第二,提出一种环形排序数据结构表示点云数据以提高后续信息处理的效率。提出边缘曲率角概念,用其快速划分直线和曲线,提取出工件轮廓的形状、尺寸等三维信息。实验结果表明,该方法可实时准确地识别具有圆柱体或多面体等较规则形状的工件,尺寸提取误差在2%以内,可满足大多工业生产要求。  相似文献   

20.
一种多尺度时频纹理特征融合的场景分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
史静  朱虹  邢楠  韩勇  杜森 《仪器仪表学报》2016,37(10):2333-2339
场景分类目前是机器视觉领域的一个研究热点,为了解决该研究领域中分类特征的提取问题,提出了一种多尺度纹理描述子(MSTD)特征。首先,采用小波变换,获得图像在时频域上的多尺度纹理视觉全局特征信息,之后提取反映局部细节的局部二值模式(LBP)特征,在时频域上进行融合,生成多尺度纹理描述子特征,以此作为图像分类的依据,最后采用支持向量机(SVM)作为分类器进行场景分类。在4个标准数据集上进行测试,实验结果表明,该方法具有较高的分类正确率,对室外场景的分类正确率都在84%以上。所提出的分类方法充分考虑了全局特征和尺度信息,增强了单层特征的区分度,有效地改善了分类的精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号