首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 375 毫秒
1.
目的 实例分割通过像素级实例掩膜对图像中不同目标进行分类和定位。然而不同目标在图像中往往存在尺度差异,目标多尺度变化容易错检和漏检,导致实例分割精度提高受限。现有方法主要通过特征金字塔网络(feature pyramid network,FPN)提取多尺度信息,但是FPN采用插值和元素相加进行邻层特征融合的方式未能充分挖掘不同尺度特征的语义信息。因此,本文在Mask R-CNN(mask region-based convolutional neural network)的基础上,提出注意力引导的特征金字塔网络,并充分融合多尺度上下文信息进行实例分割。方法 首先,设计邻层特征自适应融合模块优化FPN邻层特征融合,通过内容感知重组对特征上采样,并在融合相邻特征前引入通道注意力机制对通道加权增强语义一致性,缓解邻层不同尺度目标间的语义混叠;其次,利用多尺度通道注意力设计注意力特征融合模块和全局上下文模块,对感兴趣区域(region of interest,RoI)特征和多尺度上下文信息进行融合,增强分类回归和掩膜预测分支的多尺度特征表示,进而提高对不同尺度目标的掩膜预测质量。结果 在MS ...  相似文献   

2.
SSD算法利用多尺度特征图进行分类和位置回归,检测小目标效果优于YOLO算法,但SSD算法在进行车辆检测时存在漏检问题。为此,提出一种改进SSD算法。为提取更多的车辆特征信息,设计改进Inception模块替代SSD网络中的Conv8、Conv9和Conv10层。将浅层特征的位置信息和深层特征的语义信息进行均衡化融合,构建多尺度特征融合均衡化网络,提高小目标车辆识别率。在特征提取层均引入SENet,对不同特征通道的重要性进行重标定以提高模型性能。实验结果表明,改进后SSD算法在自制的车辆数据集上平均精度为90.89%,检测速度达到59.42 frame/s,相比改进前的SSD算法,在精度和速度上分别提高2.65个百分点和17.41 frame/s,能够更快速、准确地对图像中的车辆进行识别和定位。  相似文献   

3.
针对特征金字塔网络在多尺度与小目标检测上的问题,提出基于功能保持的特征金字塔目标检测网络.首先在主网络中选择特征图构建特征金字塔,针对不同尺度的特征图,通过功能保持融合模块自上而下地进行低损失的特征融合.功能保持融合模块有效保留高层的强语义信息,增强底层特征图对小目标的表示能力.再利用网络两个阶段的特征描述目标,提升检测精度.最后,充分利用上下文信息进一步增强对多尺度目标的判别能力.在PASCAL VOC公共数据集上的实验表明,文中网络检测效果较优.同时,通过检测效果图可看出,文中网络在目标遮挡、模糊等情况下的检测效果也较优.  相似文献   

4.
目的 目标语义特征提取效果直接影响图像语义分割的精度,传统的单尺度特征提取方法对目标的语义分割精度较低,为此,提出一种基于多尺度特征融合的工件目标语义分割方法,利用卷积神经网络提取目标的多尺度局部特征语义信息,并将不同尺度的语义信息进行像素融合,使神经网络充分捕获图像中的上下文信息,获得更好的特征表示,有效实现工件目标的语义分割。方法 使用常用的多类工件图像定义视觉任务,利用残差网络模块获得目标的单尺度语义特征图,再结合本文提出的多尺度特征提取方式获得不同尺度的局部特征语义信息,通过信息融合获得目标分割图。使用上述方法经多次迭代训练后得到与视觉任务相关的工件目标分割模型,并对训练权重与超参数进行保存。结果 将本文方法和传统的单尺度特征提取方法做定性和定量的测试实验,结果表明,获得的分割网络模型对测试集中的目标都具有较精确的分割能力,与单尺度特征提取方法相比,本文方法的平均交并比mIOU(mean intersection over union)指标在验证集上训练精度提高了4.52%,在测试集上分割精度提高了4.84%。当测试样本中包含的目标种类较少且目标边缘清晰时,本文方法能够得到更精准的分割结果。结论 本文提出的语义分割方法,通过多尺度特征融合的方式增强了神经网络模型对目标特征的提取能力,使训练得到的分割网络模型比传统的单尺度特征提取方式在测试集上具有更优秀的性能,从而验证了所提出方法的有效性。  相似文献   

5.
针对遥感影像场景分类中提取特征信息不准确以及融合冗余信息的问题,提出一种多尺度特征关联网络的遥感影像场景分类方法。首先,利用ResNet18提取多尺度影像特征,并在特征金字塔结构中引入空洞卷积和多头自注意力模块关注各层有效信息,以增强语义信息和抑制周围噪声;其次,使用多特征关联模块来增强关键特征信息,对各层使用全局平均池化并加和,得到特征向量;最后,采用全连接层进行分类。该方法在NWPU数据集上的总体分类精度为90.51%,相比VGG_VD16-MSCP、VGG_VD16-SAFF以及DTDCNN等网络分别提升1.58%、2.65%和6.39%。结果表明,文章所用的多尺度融合方式能够更好地提取特征地物并抑制周围背景,从而取得更高的遥感影像场景分类精度。  相似文献   

6.
当前小目标检测算法的实现方式主要是设计各种特征融合模块,检测效果和模型复杂度很难达到平衡.此外,与常规目标相比,小目标信息量少,特征难以提取.为了克服这两个问题,采用了一种不降维局部跨通道交互策略的通道注意力模块,实现通道间的信息关联,通过对每个通道的特征进行权重分配来学习不同通道间特征的相关性.同时,加入改进的特征融合模块,使网络可以使用低层和高层的特征进行多尺度目标检测,提升了以低层特征为主要检测依据的小目标检测精度.骨干网络采用特征表达能力强和速度快的ResNet,在获取更多网络特征的同时保证了网络的收敛性.损失函数采用Focal Loss,减少易分类样本的权重,使得模型在训练时更关注于难分类样本的分类.该算法框架在VOC数据集上的mAP为82.7%,在航拍数据集上的mAP为86.8%.  相似文献   

7.
针对口罩检测模型缺少不规范佩戴分类的检测,精度高与速度快难以兼容的问题,提出一种单阶段口罩规范佩戴实时检测算法,引入轻量提取网络DM-CSP,添加多尺度注意力MCA增强提取能力;针对融合阶段深浅层特征信息不对齐问题,设计特征对齐及选择模块FAS,提出特征增强模块CTM关联特征图谱上下文信息,构建解耦通道进行图像识别,提高算法的识别精度和收敛速度。实验结果表明,改进算法检测精度达到93.2%,较主流算法YOLOv4-Tiny提高4.8%,检测速度和模型容量具有更优性能表现。  相似文献   

8.
现有的目标检测框架中,浅层弱分类能力是制约着网络精度进一步提高的关键.对此,提出基于浅层定位信息的动态细化检测网络.该网络在单阶段算法的基础上,通过增加多连接模块来增强浅层特征,同时去除浅层的分类操作以最大程度地保留浅层的定位结果,并将其作为候选框送入深层网络.深层网络通过使用引入自适应因子的感受野模块构建特征金字塔,以获得丰富的语义信息用于对浅层的回归结果进行判别和微调.最后设计基于自注意的可变形卷积头,通过对候选框的偏移来自发进行定位校准,使得网络获得精确的检测结果.在PASCAL VOC和MS COCO数据集上的实验结果表明,所提出的网络结构可以实现优异的检测精度.  相似文献   

9.
目标数量多、尺度较小与高度重叠等问题导致目标检测精度低、难度大。为提升目标检测精度,尽可能避免漏检、误检情况,提出一种基于边界极限点特征的改进YOLOv3目标检测算法。首先,引入边界增强算子Border,从边界的极限点中自适应地提取边界特征来增强已有点特征,提高目标定位准确度;然后,增加目标检测尺度,细化特征图,增强特征图深、浅层语义信息的融合,提高目标检测精度;最后,基于目标检测中目标实例特性及改进网络模型,引入完全交并比(CIoU)函数对原YOLOv3损失函数进行改进,提高检测框收敛速度以及检测框召回率。实验结果表明,相较于原YOLOv3目标检测算法,改进后的YOLOv3目标检测算法的平均精度提高了3.9个百分点,且检测速度与原算法相近,能有效提高模型对目标的检测能力。  相似文献   

10.
本文面向光学遥感图像目标检测应用,针对光学遥感图像中的典型目标一飞机和汽车,提出一种改进的SSD模型:首先在SSD (Single Shot multibox Detector)网络模型基础上引入多尺度特征融合模块,实现深层特征与浅层特征的融合以获得更多的特征上下文信息,增强网络对目标特征的提取能力;其次根据数据集目标样本尺寸分布特征进行聚类分析获得更准确的默认目标框参数,从而有效提升网络对目标位置信息的提取能力.将本文模型与SSD及YOLOv3模型在常用遥感图像目标检测数据集上进行对比,目标检测精度均有较大提升,验证了该模型的有效性.  相似文献   

11.
激光雷达点云3D物体检测,对于小物体如行人、自行车的检测精度较低,容易漏检误检,提出一种多尺度Transformer激光雷达点云3D物体检测方法MSPT-RCNN(multi-scale point transformer-RCNN),提高点云3D物体检测精度.该方法包含两个阶段,即第一阶段(RPN)和第二阶段(RCN...  相似文献   

12.
沈文祥  秦品乐  曾建潮 《计算机应用》2019,39(12):3496-3502
针对室内人群目标尺度和姿态多样性、人头目标易与周围物体特征混淆的问题,提出了一种基于多级特征和混合注意力机制的室内人群检测网络(MFANet)。该网络结构包括三部分,即特征融合模块、多尺度空洞卷积金字塔特征分解模块以及混合注意力模块。首先,通过将浅层特征和中间层特征信息融合,形成包含上下文信息的融合特征,用于解决浅层特征图中小目标语义信息不丰富、分类能力弱的问题;然后,利用空洞卷积增大感受野而不增加参数的特性,对融合特征进行多尺度分解,形成新的小目标检测分支,实现网络对多尺度目标的定位和检测;最后,用局部混合注意力模块来融合全局像素关联空间注意力和通道注意力,增强对关键信息贡献大的特征,来增强网络对目标和背景的区分能力。实验结果表明,所提方法在室内监控场景数据集SCUT-HEAD上达到了0.94的准确率、0.91的召回率和0.92的F1分数,在召回率、准确率和F1指标上均明显优于当前用于室内人群检测的其他算法。  相似文献   

13.
为了满足锂离子电池电极缺陷检测精度与实时性的需求,解决电极图像背景噪声复杂、缺陷微小且对比度低等问题,提出一种基于注意力机制与多尺度特征融合的电极缺陷YOLO检测算法.在YOLOv4的基础上,首先,将SE(squeeze-and-excitation)注意力模块嵌入特征提取主干网络中,区分feature map中不同通道的重要性,强化目标区域的关键特征,提高网络的检测精度;其次,加入融合空洞卷积的池化金字塔(ASPP)结构,增大网络感受野的同时最大程度地保留多尺度特征信息,提高算法对小目标的检测性能;然后,设计一种多尺度稠密特征金字塔,在三尺度特征图的基础上增加一个浅层特征,采用稠密连接的方式融合特征,提升浅层细节特征与高级语义信息的融合能力,增强对微小缺陷特征的提取;最后,采用$ K $-means++算法聚类先验框,引入focal loss损失函数增大小目标样本的损失权重,有效提高网络学习的收敛速度.实验结果表明,所提算法较原YOLOv4模型的mAP值提升6.42%,较其他常用算法综合性能上有着较大的优势,可较好地满足实际工业生产的实时监测需求.  相似文献   

14.
针对现有人脸检测算法难以处理多尺度、多姿态的人脸检测,尤其是面对小尺寸时准确性低的问题,提出了多尺度和纹理特征增强的小尺寸人脸检测算法。该算法的多尺度增强模块能够丰富特征的多尺度信息,提高对多尺度人脸的检测能力;纹理特征增强模块能够通过融合低层的纹理信息提升高层语义的表达,从而加强对小尺寸人脸的检测能力;多阶段加权损失函数平衡网络的输出,充分发挥各个模块的增强作用。实验结果表明,该方法不仅在检测速度上可以达到实时,而且对MALF数据集中高度小于60像素的人脸检测精度可达88.69%;在FDDB数据集上相比目前的BBFCN算法精度提高近四个百分点。  相似文献   

15.
车辆检测是智能交通系统重要的一个研究方向.针对监控视角下的车辆检测问题,提出了一种改进YOLOX算法的车辆检测方法.使用网络深度更小的YOLOX_S模型,对网络结构改进.使用GHOST深度可分离卷积模块代替部分传统卷积,在保证模型检测精度的同时减少模型参数;将CBAM注意力模块融合到特征提取网络中,并添加特征增强结构,加强特征提取网络获得的特征图语义信息,增强提取网络对目标的检测能力;通过使用CIoU_loss优化损失函数,提高模型边界框的定位精度.测试实验结果表明,改进后的网络识别准确率提升了2.01%,达到95.45%,证明了改进方法的可行性.  相似文献   

16.
针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题, 本文提出了一种语义分割网络(LDPANet). 首先, 将空洞卷积与引入残差学习单元的深度可分离卷积结合, 来优化编码器结构, 在降低了计算复杂度的同时缓解梯度消失的问题. 然后利用层传递的迭代空洞空间金字塔, 将自顶向下的特征信息依次融合, 提高了上下文信息的有效交互能力; 在多尺度特征融合之后引入属性注意力模块, 使网络抑制冗余信息, 强化重要特征. 再者, 以通道扩展上采样代替双线插值上采样作为解码器, 进一步提升了特征图的分辨率. 最后, LDPANet方法在Cityscapes和CamVid数据集上的精度分别达到了91.8%和87.52%, 与近几年网络模型相比, 本文网络模型可以精确地提取像素的位置信息以及空间维度信息, 提高了语义分割的准确率.  相似文献   

17.
为了提高对中小占比手势识别的准确性与稳定性,提出了一种多尺度卷积特征融合的SSD(single shot multibox detector)手势识别方法。该方法突出表现在两大方面,其一,在原始的SSD算法的多尺度卷积检测方法基础上,引入了不同卷积层的特征融合思想,经过空洞卷积下采样操作与反卷积上采样操作,实现网络结构中的浅层视觉卷积层与深层语义卷积层的融合,代替原有的卷积层用于手势识别,以提高模型对中小目标手势的识别精度;其二,为了解决正负样本不均衡导致分类性能差的问题,提出一种改进的损失函数,以提升模型对目标手势的分类能力。在手势识别公开的数据集上的实验结果表明,与SSD和Faster R-CNN等识别方法相比,能够在保持较高的手势检测精度的同时,又具有较好的鲁棒性与检测速度。  相似文献   

18.
王昊  李俊峰 《软件工程》2022,(3):34-38,16
针对车载导航导光板表面缺陷像素值分布不均且普遍较小、背景复杂多变等特点,提出了基于改进掩膜区域卷积神经网络(Mask Region-based Convolutional Neural Network,Mask R-CNN)模型检测车载导航导光板表面缺陷的检测方法.首先,引入PinFPN模块改进原有Mask R-CNN...  相似文献   

19.
汪荣贵  汤明空  杨娟  薛丽霞  胡敏 《计算机工程》2021,47(5):244-250,259
针对深度学习领域内通过少量样本难以实现视觉识别的小样本学习问题,提出一种新的语义匹配网络。利用双注意力机制匹配图像的语义信息,并在多尺度分类网络下匹配图像的相似度,提升同类别样本之间的语义相关性,从而获得更加准确的样本类别。实验结果表明,与Siamese Net、Matching Net等网络相比,该语义匹配网络可有效提取样本间的语义信息,提升小样本分类准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号