首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
李经宇  杨静  孔斌  王灿  张露 《光学精密工程》2021,29(6):1448-1458
无人驾驶汽车在复杂多变的交通场景中能提前且准确检测到车辆行人的动态信息尤为重要.然而,无人驾驶场景下存在相机快速运动、尺度变化大、目标遮挡和光照变化等问题.为了应对这些挑战,本文提出了一种基于注意力机制的多尺度目标检测算法.基于YOLOv3网络,首先,使用空间金字塔池化模块对多尺度局部区域特征进行融合和拼接,使网络能够...  相似文献   

2.
交通场景下的行人检测在高级辅助驾驶系统和自动驾驶汽车领域中占有重要地位.为了解决道路行人因采集视角和低像素模糊而导致小、尺度行人氏检测精度的问题,提出了一种基于DSSD的行人检测网络框架,结合改进的ResNeXt特征提取模型作为DSSD检测框架的前置网络以保证小尺度行人特征的精确提取和高效传递.为了充分获取局部细节信息...  相似文献   

3.
张勇  石志广  沈奇  张焱  张宇 《光学精密工程》2023,(19):2910-2920
针对PointPillar在自动驾驶道路场景下对点云稀疏小目标检测效果差的问题,通过引入一种多尺度特征融合策略和注意力机制,提出一种点云目标检测网络Pillar-FFNet。针对网络中的特征提取问题,设计了一种基于残差结构的主干网络;针对馈入检测头的特征图没有充分利用高层特征的语义信息和低层特征的空间信息的问题,设计了一种简单有效的多尺度特征融合策略;针对主干网络提取的特征图中信息冗余的问题,提出了一种卷积注意力机制。为验证所提算法的性能,在KITTI和DAIR-V2X-I数据集上进行实验。实验结果表明,所提出的算法在KITTI数据集上与PointPillar相比,汽车、行人和骑行者的平均精度最大提高分别为0.84%,2.13%和4.02%;在DAIR-V2X-I数据集上与PointPillar相比,汽车、行人和骑行者的平均精度最大提高分别为0.33%,2.09%和4.71%,由此证明了所提方法对点云稀疏小目标检测的有效性。  相似文献   

4.
针对传统检测算法对工业铝材表面缺陷识别率不高、对于小缺陷定位不准确等问题,提出改进的Faster RCNN深度学习网络对于铝材表面10种缺陷进行检测。首先,对数据进行增强后,在主干网络加入特征金字塔网络(FPN)结构以加强对小缺陷的特征提取能力,随后用感兴趣区域校准(ROI Align)算法来代替粗糙的感兴趣区域池化(ROI Pooling)算法,获得更准确的缺陷定位信息,最后加入K-means算法对缺陷数据进行聚类,得出更适应铝材缺陷的锚框。实验表明,改进后的网络对铝材表面缺陷检测的平均精度均值(mAP50)为91.20%,比原始的Faster RCNN网络提高了16%,并且对铝材小缺陷的检测能力也得到明显的提高。  相似文献   

5.
张新伟  陈东  闫昊  马兆昆 《工具技术》2023,(10):150-155
针对零件在密集遮挡等复杂场景下存在视觉识别难度大、检测精度低和实时性差的问题,提出YOLOv5零件目标检测的改进算法。在YOLOv5的主干网络中添加卷积注意力机制模块,进而增强算法对零件的特征提取能力;将抑制准则改为考虑真实框与预测框重叠区域且同时计算两个框之间中心点距离的DIoU-NMS,并以此作为后处理方法,进而提高零件检测精度。试验结果表明,相比原始YOLOv5算法,本改进算法将mAP@0.5提升1.6%,识别速度达58.8帧/s,可以更好地完成检测密集遮挡零件的任务,同时保证了实时性。  相似文献   

6.
X光片对肺炎疾病的诊断具有重要作用,但其成像时易受噪声污染,导致肺炎疾病的影像学特征不明显和病灶特征提取不充分。针对上述问题,提出密集双流聚焦网络DDSF-Net的肺炎辅助诊断模型。首先设计残差多尺度块,利用多尺度策略提高网络对医学影像中不同尺寸肺炎病灶的适应性,采用残差连接提高网络参数的传递效率;然后设计双流密集块,采用全局信息流和局部信息流并行结构的密集单元,其中Transformer对全局上下文语义信息进行学习,卷积层进行局部特征提取,利用密集连接方式实现两种信息流的深浅层特征融合;最后,设计具有中心注意操作和邻近插值操作的聚焦块,利用裁剪医学影像尺寸来过滤背景噪声信息,利用插值对医学图像进行放大,增强病灶的细节特征。在肺炎X光片数据集中与典型模型进行对比,本文模型的准确率、精确率、召回率、F1,AUC值和训练时间分别为98.12%,98.83%,99.29%,98.71%,97.71%和15 729 s,准确率和AUC值较密集网络分别提升了4.89%和4.69%。DDSFNet能够有效缓解肺炎影像学特征不明显和病灶特征提取不充分的问题,通过热力图和三份公共数据集进一步验证了本文...  相似文献   

7.
为了在有限训练样本情况下充分提取高光谱影像的空间光谱特征,提高分类精度,提出一种结合空洞卷积和密集网络 的高光谱影像分类方法。 首先,构建多尺度空洞特征提取模块,引入不同数量的空洞卷积层和普通卷积层通过级联的方式增大 模型的感受野,并提取多尺度特征。 然后,在多尺度空洞特征提取模块之间建立密集连接,实现特征复用的同时缓解梯度消失 问题,而模块内部无密集连接,避免构建深度网络而导致网络参数过多的问题。 最后,将得到的特征依次通过池化层,全连接层 和 Softmax 层完成分类。 另外,本文在全连接层后加入 dropout 正则化防止出现过拟合。 在 Indian Pines 和 WHU-Hi-Longkou 数 据集上与经典分类方法进行对比,本文方法 OA 分别为 98. 75% 和 98. 82% 。 实验结果表明,本文设计的网络模型在有限训练样 本情况下,分类效果最优。  相似文献   

8.
基于深度学习的自然场景文本检测算法进展显著,但对具有密集不规则排布特点的文本来说,由于其间距小、分布密集,导致特征提取困难,文本检测不全;同时,现有文本检测方法常采用的不同维度特征直接拼接的方式会导致多尺度特征融合不充分,造成语义信息的丢失。针对上述问题,本文提出一种基于多维度卷积融合的密集不规则文本检测方法。网络主体采用FPN结构,设计了文本增强模块(Text Enhancement Module,TEM),通过引入额外全局文本映射以强化网络对文本信息的关注能力;提出了通道融合策略(Channel Fusion Strategy,CFS),采用自底向上方式建立高低维度特征信息链,生成语义更加丰富的特征图,减少信息损失;预测阶段采用渐进式拓展文本核的方法生成文本预测结果。在DAST1500及ICDAR2015和CTW1500数据集上的实验表明,该方法其F值分别达到81.8%,83.0%及79.0%。提出算法不仅在密集不规则文本检测上表现出更好的性能,而且在一般自然场景文本(多向、曲线文本)上也具有一定竞争力。  相似文献   

9.
高分辨率图像具有特征尺度差异较大的特点,针对其造成的细粒度特征难以捕获、多尺度特征融合不佳问题,提出一种共享核空洞卷积与注意力引导(Kernel-Sharing Dilated Convolutions and Attention-guided FPN,KDA-FPN)的复杂场景文本检测方法;提出最小交集(Intersection Over Minimum,IOM)后处理策略,改善因文本长宽比变化较大特性导致的掩膜重叠现象,提升检测效果。首先,模型以Resnet50为主干网络采用FPN结构捕获多尺度特征;然后,利用空洞卷积扩大特征感受野,提高特征信息的多尺度捕获能力,深层次挖掘文本细粒度特征,并通过共享核手段减少模型参数量,降低计算成本;同时,采用上下文注意模块(Context Attention Module,CxAM)捕捉多感受野间的语义信息关系,通过内容注意模块(Content Attention Module,CnAM)精确定位目标位置信息,增强多尺度融合能力,提升特征图质量;最后,将同一文本区域预测的候选框按大小排列,提出将面积最大的框与相邻文本框之间区域的交集面积占较小框面积的比值作为候选框筛选指标,抑制检测结果的掩模重叠现象,实现文本的精准检测。采用ICDAR2013、ICDAR2015、TotalText数据集进行对比实验,实验结果表明,本文模型对于水平场景文本检测的精度和召回率分别为95.3和90.4;对于倾斜文本检测的精度和召回率分别为87.1和84.2;对于任意形状文本检测的精度和召回率分别为69.6和57.3。提出的算法有效克服了图像分辨率、文本形状与长度等因素的影响,提高了检测精度,得到了更为精准的文本边界。  相似文献   

10.
针对R-C3D行为检测网络特征提取冗余度高及边界定位不准确的问题,结合残差收缩结构和时空上下文,提出一种改进的行为检测网络(RS-STCBD)。首先,将收缩结构和软阈值化操作融入到3D-ResNet的残差模块中,设计通道自适应阈值的残差收缩单元(3D-RSST),并级联多个3D-RSST单元构建特征提取网络以消除行为特征中的噪声、背景等冗余信息;然后,在时序候选子网中嵌入多层卷积替代一次卷积,以增加时序侯选片段的时序维度感受野;最后,在行为分类子网引入非局部注意力机制,通过捕获优质行为时序片段间的远程依赖以获取动作时空上下文信息。在THUMOS14和ActivityNet1.2数据集上的实验结果表明:改进网络的mAP@0.5分别达到36.9%和41.6%,比R-C3D方法提升了8.0%和14.8%。基于改进网络的行为检测方法提高了动作边界定位精度和行为分类准确率,有利于改善自然场景下的人机交互质量。  相似文献   

11.
针对人工智能辅助骨折部位治疗时由于骨折部位通常伴随着出血等症状,不同体位所拍摄的CT影像存在较大差异,骨折部位大小不一,以及受到出血部位以及周围组织的干扰,骨折部位的特征提取不充分、骨折部位检测精度不高的问题,设计了一种3M-YOLOv5网络来检测下颌骨骨折部位。在特征提取网络中采用密集模块,利用密集连接特性提高网络的特征提取能力;采用局部全局注意力模块来提取CT影像的全局信息;构造一个轻量化的多尺度密集块,以较少的参数量提取骨折部位的多尺度特征;在特征增强网络中设计跨维度双向特征融合模块,使得特征图的高度、宽度以及通道之间有所交互,同时引入可训练的权重来平衡不同尺度特征图的融合重要性。为了验证3M-YOLOv5网络的有效性,在自建数据集上进行消融实验和对比实验。实验结果表明,在置信度阈值取0.5时,3M-YOLOv5网络的mAP值、F1值、召回率、精确率分别为99.17%,99.06%,98.81%和99.32%。所提出的下颌骨骨折CT影像检测网络能够较好地检测出影像中的骨折部位,辅助医生制定治疗方案。  相似文献   

12.
针对单目视觉行人检测无法获得深度信息从而导致冗余信息较多、检测效率和准确度存在局限性的问题,首先,在图像的预处理阶段提出了一种利用双目立体视觉产生的视差信息优化分析来简化复杂场景的动态规划棒状像素场景(stixel-world)表达方式;然后,在行人目标检测阶段,对传统HOG特征中block尺度进行分析、降维,采用Fisher准则筛选得到了适用于道路环境下的多尺度HOG(multi-HOG)特征,将Multi-HOG特征与LUV颜色通道特征进行融合,最后采用交叉核支持向量机(hikSVM)分类器对行人目标分类。实验结果表明,采用改进过后的Stixel-world算法用于图像预处理极大地减少了计算时间。缩小了行人检测的候选区域,基于特征融合和hik-SVM的目标检测算法在保证检测准确度的前提下,具有较好的实时性和鲁棒性。  相似文献   

13.
远距离行人小目标成像像素少、缺乏纹理信息,深度卷积神经网络难以提取小目标细粒度特征,难以准确识别与检测。本文提出一种远距离行人小目标检测方法。首先,在YOLOv4的基础上引入浅层特征改进特征金字塔,提取行人小目标细粒度特征,提出引力模型特征自适应融合方法,增加多层次语义信息之间的关联度,防止小目标特征信息流失。然后,采用增强型超分辨率生成对抗网络增加行人小目标特征数量,提高行人小目标检测准确率。最后,选取图像像素中占比范围为0.004%~0.026%的行人小目标建立试验数据集,通过与Faster RCNN、ION、YOLOv4对比实验验证。结果表明,本文方法mAP0.5提高了25.2%、26.3%、11.9%,FPS达到24,研究成果在远距离安防监测监控领域具有重要应用价值。  相似文献   

14.
针对异常事件位于图像前景的某个局部区域,且背景区域对于异常检测存在干扰的问题,提出了一种多任务异常检测双流模型,模型架构包含未来帧预测网络和光流重构网络。首先利用前景检测算法获取自然图像和光流图像的目标区域,再将选取的区域送入到编码-解码网络完成未来帧预测和运动重构,对运动特征和表观特征进行提取,最后,使用深度概率网络给出的概率值作为判断异常的决策,并与重构损失及预测损失相结合来判断视频的异常性。本文针对大型场景的3个视频监控数据集(UCSD行人数据集、Avenue、Shanghai Tech)对本文提出的模型进行了异常性评估,所提出的方法在3个数据集上的AUC值分别为97.4%,86.4%,73.4%。与现有工作相比,本文的模型架构简洁且易于训练,异常检测结果更加准确。  相似文献   

15.
针对传统LBP算法的人脸识别易受光照、背景、遮挡等因素的影响,使用改进局部二值模式(LBP)和深度信念网络(DBN)相结合的方法,用多尺度块局部二值模式(MB-LBP)算法获取人脸图像的纹理特征,在此人脸纹理特征的基础上使用中心对称局部二值模式(CS-LBP)算法获取图像的纹理特征,然后将两次获得的纹理特征图像的直方图进行融合,并将其输入到DBN中进行训练,优化网络参数。  相似文献   

16.
为了提高在如无人机航拍图像等背景复杂情况下的小目标检测能力,本文在YOLOv4网络的基础上,提出了一种引入注意力机制的轻量级小目标检测网络.首先,在通道注意力机制中加入多尺度融合模块并构造多方法特征提取器,再将所设计的通道注意力模块嵌入到YOLOv4特征提取网络,增强网络对于图像感兴趣区域的关注能力;接着,改进YOLO...  相似文献   

17.
为了实现电致发光(Electroluminescent,EL)条件下太阳能电池的高精度裂纹和碎片缺陷检测,将多尺度YOLOv5(You Only Look Once version 5)模型用于真实工况下的太阳能电池缺陷检测。首先,提出一种融合可变形卷积(Deformable Convolutional Networks Version 2,DCNv2)和坐标注意力(Coordinate Attention,CA)的改进特征提取网络,拓宽小目标缺陷的感受野,有效增强小尺度缺陷特征的提取。其次,提出一种名为CA-PANet的改进路径聚合网络(Path Aggregation Network,PANet),将CA与跨层级联整合在路径增强结构中,实现浅层特征的复用,使深层特征和浅层特征结合,增强不同尺度缺陷的特征融合,提高缺陷的特征表达能力,提升缺陷检测框的准确度。轻量级CA的计算成本低,保证了模型的实时性。实验结果表明,融合DCNv2与CA注意力的YOLOv5模型平均精度均值(Mean Average Precision, mAP)值可达95.4%,较YOLOv5模型提高3%,较YOLOX...  相似文献   

18.
初烤烟叶等级的快速准确检测对开发烟叶智能分级设备以促进农产品精细化管理有着重要意义。针对相似度较高但等级不同的初烤烟叶难以区分的问题,本文提出多感受野特征自适应融合及动态损失调整的初烤烟叶等级检测网络(Flue-cured Tobacco Leaf Grade Detection Network,FTGDNet)。首先,FTGDNet采用CSPNet作为特征提取主干网络,采用GhostNet作为辅助特征提取网络以增强模型的特征提取能力;其次,在主干网络末端嵌入显式视觉中心瓶颈模块(Explicit Visual Center Bottleneck module,EVCB)以实现全局特征信息与局部细节特征信息融合;然后,构建多感受野特征自适应融合模块(Multi-Receptive Field Feature Adaptive Fusion module,MRFA_d),利用注意力特征融合机制(Attention Feature Fusion,AFF)将不同感受野特征图进行自适应加权融合,在增强模型局部感受野的同时突出有效通道信息;最后,设计了一种新的定位损失函数(More Comple...  相似文献   

19.
针对铸件检测存在精度不够高和易漏检、误检等问题,提出一种基于多尺度特征的YOLOv5铸件自动检测算法。该算法使用双目相机采集铸件图像,并构建铸件图像数据集;为提取更全面的铸件特征,采用多尺度特征融合模块,增加一个检测层检测不同尺度的铸件;为获取更多细节特征,在特征金字塔网络中嵌入卷积注意力机制(CBAM),以提高铸件图像关键特征的提取能力;同时用Hardswish替换卷积层中的SiLU激活函数来减少模型参数量。实验结果表明,该算法检测m AP值达到了96.5%,较原YOLOv5算法提升了2.6%,能实现铸件自动检测对检测精度及实时性的要求。  相似文献   

20.
随着计算机视觉之深度学习的兴起与人脸识别技术在智能化产品的广泛应用,基于深度卷积神经网络的人脸检测相关技术成为计算机视觉领域的热门研究。基于RetinaFace结构,提出一种改进的人脸检测模型。该模型采用Resnet34作为特征提取层,利用特征金字塔网络(FPN)进行上下文分辨率信息融合,结合Inception网络适应多尺度的人脸。基于人脸边界框回归损失和分类损失,额外增加人脸五点关键点训练损失。通过IoU大于0.5非极大抑制处理在Wider Face的Easy、Medium、Hard数据集的检测边界框,训练的卷积模型在测试集准确率分别是93.79%、91.92%、55.75%。在人脸密集、遮挡严重、背景复杂的场景下检测的效果并不是很理想,而在人脸稀疏的情况下取得较好的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号