首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
郑烨  崔莉 《高技术通讯》2023,(6):602-609
现有基于深度学习的水下声呐图像目标检测方法受限于水下声呐图像噪声大、信噪比低,因而检测精度有限。针对该问题,本文提出了基于投影感知和声呐参数信息嵌入的水下声呐图像目标检测方法 SonarNet。提出的非参数化的投影感知对齐模块(PAA)在不引入额外的训练参数且无需额外标注的情况下,通过提取水下目标的投影区域特征与目标本身特征融合来提升目标检测精度。同时为了提升算法在不同声呐工作参数下的鲁棒性,本文设计了一个轻量级的声呐全连接网络SonarMLP,将声呐设备的工作参数信息以嵌入信息的形式引入到目标检测过程中。本文在声呐图像目标检测数据集上对算法的有效性进行了验证,在有效检测出水下目标的同时,比现有常用深度学习方法有更高的检测精度,能够提升3%以上的各类平均精确度(m AP)。  相似文献   

2.
目的 为精确分析点云场景中待测目标的位置和类别信息,提出一种基于多级特征融合的体素三维目标检测网络。方法 以2阶段检测算法Voxel?RCNN作为基线模型,在检测一阶段,增加稀疏特征残差密集融合模块,由浅入深地对逐级特征进行传播和复用,实现三维特征充分的交互融合。在二维主干模块中增加残差轻量化高效通道注意力机制,显式增强通道特征。提出多级特征及多尺度核自适应融合模块,自适应地提取各级特征的关系权重,以加权方式实现特征的强融合。在检测二阶段,设计三重特征融合策略,基于曼哈顿距离搜索算法聚合邻域特征,并嵌入深度融合模块和CTFFM融合模块提升格点特征质量。结果 实验于自动驾驶数据集KITTI中进行模拟测试,相较于基线网络,在3种难度等级下,一阶段检测模型的行人3D平均精度提升了3.97%,二阶段检测模型的骑行者3D平均精度提升了3.37%。结论 结果证明文中方法能够显著提升目标检测性能,且各模块具有较好的移植性,可灵活嵌入到体素类三维检测模型中,带来相应的效果提升。  相似文献   

3.
针对少量样本条件下模型易过拟合、目标错检与漏检问题,本文基于TFA (two-stage fine-tuning approach)提出了一种在线推断校准的小样本目标检测框架。该框架设计了一种全新的Attention-FPN网络,通过建模特征通道间的依赖关系选择性融合特征,结合分级冻结的学习机制引导RPN模块提取正确的新类前景目标;同时,构建了一种在线校准模块对样本进行实例分割编码,对众多候选目标进行评分重加权处理,纠正误检和漏检的预测目标。结果表明,所提算法在VOC数据集Novel Set1中,五个任务的平均nAP50提升10.16%,在性能上优于目前的主流算法。  相似文献   

4.
针对车载平台发展过程中,在辅助驾驶环境感知方面,现有的目标检测方法对目标检测精度不高、算法推理速度慢等问题,本文以YOLOv4目标检测网络为基础,引入通道与空间注意力模块CBAM,有效提升了YOLOv4目标检测网络特征识别精度;引入Mobilenetv3轻量化网络结构替换YOLOv4的主干特征提取网络CSPDarkNet53,并利用深度可分离卷积替换整个网络的普通卷积,有效降低了YOLOv4目标检测模型大小,提升了网络模型推理速度。通过消融实验与检测结果分析,证明了改进方案的可行性。  相似文献   

5.
孙红  袁巫凯  赵迎志 《包装工程》2023,44(1):141-150
目的 为了进一步提升语义分割精度,解决当前语义分割算法中特征图分辨率低下,低级信息特征随意丢弃,以及上下文重要信息不能顾及等问题,文中尝试提出一种融合反馈注意力模块的并行式多分辨率语义分割算法。方法 该算法提出一种并行式网络结构,在其中融合了高低分辨率信息,尽可能多地保留高维信息,减少低级信息要素的丢失,提升分割图像的分辨率。同时还在主干网络中嵌入了带反馈机制的感知注意力模块,从通道、空间、全局3个角度获得每个样本的权重信息,着重加强样本之间的特征重要性。在训练过程中,还使用了改进的损失函数,降低训练和优化难度。结果 经实验表明,文中的算法模型在PASCAL VOC2012、Camvid上的MIOU指标分别为77.78%、58.67%,在ADE20K上的也有42.52%,体现了出较好的分割性能。结论 文中的算法模型效果相较于之前的分割网络有一定程度的提升,算法中的部分模块嵌入别的主干网络依旧表现出较好的性能,展现了文中算法模型具备一定的有效性和泛化能力。  相似文献   

6.
针对黏稠流质食品的自动化灌装中,传统灌装成品缺陷检测方法难以同时对多目标高速检测的难题,提出一种基于YOLOv4目标检测算法的轻量级灌装成品缺陷检测方法.MobileNetV3主干特征提取网络能对输入样本进行轻量级特征提取;增强特征提取网络采用深度可分离卷积策略,以降低参数计算量,然后通过设计的全面路径聚合网络(FPANet)和引入的通道注意力机制(ECA)提升增强特征提取网络对于目标特征的靶向表达.将设计的轻量化网络进行模型训练和精度测试,并在同一数据集下与其它目标检测算法进行对比,以分析本文方法的优劣.实验结果表明,本文方法能够在保持精度的前提下提升检测速度,实现了黏稠食品灌装成品缺陷的多目标高速检测.  相似文献   

7.
苟于涛  马梁  宋怡萱  靳雷  雷涛 《光电工程》2021,48(12):42-55
与高质量可见光图像相比,红外图像在行人检测任务中往往存在较高的虚警率.其主要原因在于红外图像受成像分辨率及光谱特性限制,缺乏清晰的纹理特征,同时部分样本的特征质量较差,干扰网络的正常学习.本文提出基于多任务学习框架的红外行人检测算法,其在多尺度检测框架的基础上,做出以下改进:1)引入显著性检测任务作为协同分支与目标检测网络构成多任务学习框架,以共同学习的方式侧面强化检测器对强显著区域及其边缘信息的关注.2)通过将样本显著性强度引入分类损失函数,抑制噪声样本的学习权重.在公开KAIST数据集上的检测结果证实,本文的算法相较于基准算法RetinaNet能够降低对数平均丢失率(MR-2)4.43%.  相似文献   

8.
为了解决近岸船舶检测时目标尺度变化大,环境干扰严重等问题,提出了一种改进YOLOX的无锚框检测算法。首先,在主干网络中引入CoT模块,通过动态利用上下文信息来增强表达能力,降低环境干扰的影响;其次,将SimAM注意力嵌在特征金字塔和检测头之间,丰富语义信息,提升小目标检测精度。再利用CIOU来取代原有损失函数,以提高收敛速度;最后,使用深度可分离卷积替换特征金字塔中普通卷积,减少参数量,提升检测速度。实验结果表明:在SeaShips数据集上,改进后模型在减少参数量的同时,精度提高了6.73%,均值平均精度(mAP)达到了96.63%,检测速度达到了48.6帧/s,能够实时、高精度地检测近岸船舶。  相似文献   

9.
目的:实现多种风格域的无监督字体风格迁移。方法:使用StarGANv2网络模型,对生成器进行改进。引入IBN-Net,将实例标准化(Instance normalization, IN)和批标准化(Batch normalization, BN)结合,形成残差网络的基础模块。然后在此模型的风格编码网络中增加注意力机制,进一步对不同风格字体挖掘关键性区域特征,增强目标域的差异化特征分布,实现对小样本字体图像抽取更加丰富的特征信息。结果:在不同风格字体的数据集上来验证改进模型的有效性,研究表明,在像素级、感知级等评价指标中均优于其他算法。相比原始模型,本文方法生成的汉字图像,FID下降5.12,LPIPS下降0.062 1,SSIM增加0.041 1。并且视觉上有更好的生成效果,保留了更多的细节信息。结论:改进的模型能够有效的生成高质量的多风格字体汉字。  相似文献   

10.
汽车轮毂加工过程中产生的表面缺陷严重影响整车的美观性及服役性能,针对人工检测效率低、漏检率高的问题,提出一种基于改进YOLOv4算法的轮毂表面缺陷检测方法。构建了轮毂缺陷数据集,其包含6种表面缺陷,由2346张4928×3264pixel的图像组成;采用K-means方法进行先验框聚类,并针对YOLOv4算法在纤维、粘铝等小尺度缺陷上检测精度不足问题,在原网络Neck部分引入细化U型网络模块(TUM)和注意力机制,用于增强有效特征并抑制无效特征,强化多尺度特征提取与融合,改善特征处理过程中可能存在的小目标信息丢失问题;基于该数据集,训练并测试不同算法的缺陷检测性能并验证改进模块的有效性。结果表明,该方法大幅提升了粘铝等小尺寸缺陷的检测能力,缺陷检测平均精度达到85.8%,与多种算法相比较检测精度最高。  相似文献   

11.
针对钢筋混凝土腐蚀检测中单一传感器或检测方式获取锈蚀特征信息不足及准确率不高等问题,提出一种改进神经网络模型结构下对集成阳极梯、应变力、温度传感器的多传感器数据融合检测方式。首先将一维多传感器数据二维化,采用卷积核对特征信息滤波提取,提取后的信息平展后连接BP残差神经网络层,增强浅层低非线性度特征信息向深层网络的直接传递和重复利用,提高网络模型的拟合及泛化能力。针对ADAM优化算法在模型训练后期学习率可能震荡不收敛问题,引入分段学习率衰减策略抑制后期震荡,同时对二阶矩估计梯度变化进行调整,提高迭代收敛效率。仿真结果表明,改进后的ADAM-CNN算法模型具有更好的分类性能,在钢筋腐蚀样本测试集上的平均准确率为96.2%。  相似文献   

12.
为改进无人驾驶技术部署困难问题,该文提出一种基于YOLOv5的目标识别算法。算法引入Ghost Bottleneck模块,CBAM模块,将网络参数压缩,减少模型整体的计算量,同时提升模型推理速度;将原始模型CIoU损失函数替换为α-IoU损失函数,使得模型训练过程中更快收敛;用DWConv层替代原有网络中Neck部分的Conv层,可大大降低网络参数数量以及运算成本,同时可提取不同大小的特征信息,提升模型在物体识别方面的鲁棒性。实验证明,原始模型的参数量为7 095 906,权重文件为14.4 MB,mAP@0.5达到86.11%,检测速度为30.30 f/s;改进后模型参数量缩减为2 546 136,参数量减少了64.12%,权重文件为5.8 MB,权重文件大小减小了59.72%,m AP@0.5达到89.44%,检测速度提升至40.00 f/s,检测速度提升了32.01%。将改进后的模型部署至RK3399嵌入式移动端,算法识别速度较原始算法提升了约35.04%。  相似文献   

13.
针对声呐图像存在的模糊、样本量不足的现象,本文提出一种基于YOLOv5的声呐图像目标检测改进算法。利用几何滤波、垂直翻转等方法,对声呐图像数据集进行数据增强。添加融合注意力机制模块,使算法更好地关注声呐图像小目标的特征。同时,针对目前大多数目标检测算法运行在云端,无法做到实时性声呐图像检测的问题,本文利用替换轻量级网络和NCNN边端移植技术,同时在颈部网络中采用GSConv模块,将算法成功移植到ZYNQ平台,实现声呐图像的嵌入式端实时检测。实验表明,本文提出的算法在降低了56%参数量的同时,在map50和map50-95上分别提高2.2%和2.5%。改进后的算法性能提升明显,证明所提出的方法在轻量化声呐图像目标检测任务上具有一定的可行性与有效性。  相似文献   

14.
王一  龚肖杰  程佳  苏皓 《包装工程》2022,43(15):54-60
目的 针对金属工件表面小尺寸缺陷检测精度低的问题,提出以YOLOv5网络为基础,结合注意力机制与Ghost卷积的表面缺陷检测算法。方法 首先,在原网络中增加SE通道注意力模块,增加缺陷有关信息的权重,减少无用特征的干扰,从而提高目标的检测精度。然后,将网络中空间金字塔池化模块的池化方式由最大池化替换为软池化,使得在下采样激活映射中保留更多的特征信息,获得更好的检测精度。最后,采用Ghost卷积块替换主干网络中的常规卷积模块,提取丰富特征及冗余特征,以此提高模型效率。结果 改进后网络平均精度均值达到0.997 8,相比原网络提高了7.07个百分点。结论 该网络显著提高了金属工件表面缺陷检测的精度。  相似文献   

15.
在线多目标跟踪是实时视频序列分析的重要前提。针对在线多目标跟踪中目标检测可靠性低、跟踪丢失较多、轨迹不平滑等问题,提出了基于R-FCN网络框架的多候选关联的在线多目标跟踪模型。首先,通过基于R-FCN网络从KF预测结果和检测结果中获取更可靠的候选框,然后利用Siamese网络进行基于外观特征的相似性度量,实现候选与轨迹之间的数据关联,最后通过RANSAC算法优化跟踪轨迹。在人流密集和目标被部分遮挡的复杂场景中,提出的算法具有较高的目标识别和跟踪能力,大幅减少漏检和误检现象,跟踪轨迹更加连续平滑。实验结果表明,在同等条件下,与当前已有的方法对比,本文提出在目标跟踪准确度(MOTA)、丢失轨迹数(ML)和误报次数(FN)等多个性能指标均有较大提升。  相似文献   

16.
陈宏彩  程煜  任亚恒 《包装工程》2024,45(9):135-140
目的 为了克服药包玻璃瓶缺陷样本不足带来的缺陷检测模型精度不准的问题,提出改进StyleGAN2-ADA的缺陷样本生成方法,提升模型鲁棒性。方法 首先,基于StyleGAN2-ADA算法,在无缺陷图像集上训练网络模型并作为骨干。其次,在骨干网络上添加缺陷感知残差块,生成缺陷掩码,在少量的缺陷图像数据集上训练网络模型操纵掩码区域的特征,模拟缺陷图像生成过程,合成缺陷图像。最后,采用YOLOv7检测网络验证该样本生成方法的效果。结果 实验结果表明,该方法在大量正常图像和少量缺陷图像基础上生成逼真且多样性的缺陷图像,应用该缺陷样本合成方法丰富数据集后,西林瓶缺陷检测平均准确率(mAP)达到97.3%,较原始数据集合和StyleGAN2-ADA算法分别提高了33.1%和4.1%。结论 该图像生成方法可以在少量缺陷样本下生成高质量的缺陷图像,优化不均衡数据集,增强模型训练的稳定性,提高药用玻璃包装产品的质量和合格率。  相似文献   

17.
刘琼 《高技术通讯》2016,(5):464-474
研究了仿生人眼视觉注意机制,采用目标导引概率图作为自上而下的信息,通过调制基于目标显著特征的自下而上信息,实现行人目标检测的方法。首先,对相似场景的目标样本图像提取尺度不变特征变换(SIFT)特征,基于贝叶斯公式,采用高斯混合模型(GMM)建立目标导引概率模型,利用期望最大(EM)算法和狄利克雷过程(DP)自动估计模型参数;进而,对一副待检测图像,采用已估概率模型计算图像中每一像元的目标似然性,形成导引概率图作为自上而下的信息;同时,针对行人目标,模拟中央-外周机制计算多尺度的肤色特征和竖直方向特征,形成基于目标显著特征的自下而上信息;最后,将两者结合得到候选目标区域,再通过提取候选区域的积分梯度直方图和等价的局部二值模式(LBP)特征,输入到级联支持向量机(SVM)分类器,验证并得到目标检测结果。基于实拍数据库和复旦大学-宾夕法尼亚大学行人数据库的大量实验表明,对概率模型的这种改进能显著提升行人目标预测效果,且检测算法在整体上优于传统检测算法。  相似文献   

18.
沈中华  陈万委  甘增康 《包装工程》2023,44(19):229-237
目的 提高工业分拣上常见的纹理多样、随机堆放盒体的检测与识别能力。方法 提出一种基于YOLOv5的旋转目标检测算法,该算法包括目标分类、位姿角度识别和边界框位置定位3个模块功能。目标分类模块中,通过自建数据集和设计8种目标分类标签以供模型分类学习;位姿角度识别模块对YOLOv5头网络中添加角度预测分支,引入环形平滑标签角度分类方法,实现分拣盒体的旋转角度精准检测;在边界框位置定位模块上,使用LCIoU回归框损失函数来计算旋转框回归损失,得到紧密包裹目标位置的边界框。结果 改进的YOLOv5算法在自建数据集上检测精度达到95.03%,在机器人多物体分拣实验中的准确率可达100%。结论 本文算法在盒体处于散乱堆放、密集堆放、堆叠堆放场景下均具有较高的定位与识别精度。  相似文献   

19.
针对3D-CNN能够较好地提取视频中时空特征但对计算量和内存要求很高的问题,本文设计了高效3D卷积块替换原来计算量大的3×3×3卷积层,进而提出了一种融合3D卷积块的密集残差网络(3D-EDRNs)用于人体行为识别。高效3D卷积块由获取视频空间特征的1×3×3卷积层和获取视频时间特征的3×1×1卷积层组合而成。将高效3D卷积块组合在密集残差网络的多个位置中,不但利用了残差块易于优化和密集连接网络特征复用等优点,而且能够缩短训练时间,提高网络的时空特征提取效率和性能。在经典数据集UCF101、HMDB51和动态多视角复杂3D人体行为数据库(DMV action3D)上验证了结合3D卷积块的3D-EDRNs能够显著降低模型复杂度,有效提高网络的分类性能,同时具有计算资源需求少、参数量小和训练时间短等优点。  相似文献   

20.
本文针对目标跟踪应用,提出了基于Siamese-FC跟踪网络的改进卷积网络Siamese-MF,意在更进一步提升跟踪速度和准确性,满足目标跟踪的工程应用需求。对于跟踪网络,考虑速度和精度的权衡,减少计算量,增加卷积特征的感受野是改进跟踪网络的速度和精度的方向。在卷积网络结构上面进行改进结构创新,改进主要集中为两点:1)引入特征融合,丰富特征;2)引入空洞卷积,减少计算量的同时增强感受野。Siamese-MF算法实现了对于复杂场景目标的实时准确跟踪,在公开数据集OTB上测试速度达到平均76 f/s,跟踪成功率的均值达到0.44,而跟踪稳定性的均值达到0.61,实时性、准确性和稳定性均提升,满足目标实时跟踪应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号