首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
贾熹滨  李佳 《北京工业大学学报》2021,46(5):455-462, 519

小样本图像语义分割任务是计算机视觉领域一个有挑战性的问题,其目标是利用现有一张或几张带有密集分割注释的图片来预测未见类图像的分割掩码.针对该任务,提出了一个基于金字塔原型对齐的轻量级小样本图像语义分割网络.首先,该网络在MobileNetV2网络的深度可分离卷积和逆残差结构基础上,通过金字塔池化模块进行提取特征,保持高维度和低维度的信息,获得不同尺度的特征.同时通过在支持集原型和查询集之间进行相互对齐,使得网络能够从支持集中学到更多的信息,充分利用支持集的信息进行反馈.基于PASCAL-5i数据集的大量实验结果表明,提出的网络结构的均值在1-way 1-shot和1-way 5-shot上分别为49.5%和56.6%,与先进的主流小样本语义分割网络PANet相比分别对应提高了1.4%和0.9%,网络参数量为3.0 MB,相比PANet减小了11.7 MB,同时浮点计算量显著减少,证明了该网络在小样本图像语义分割中的有效性和高效性.

  相似文献   

2.
图像语义分割的传统方法是依靠人工设计提取特征,用机器学习的方法进行分类,来达到分割的效果,但是过程比较复杂,且最终的分割效果也不理想.为解决该问题,提出运用深度学习的方法自动提取图像中物体特征,实现端到端训练,并提升分割精度.采用的基础网络是ResNet-50,同时采用空洞空间金字塔池化模块进行有效的特征融合,并在最后...  相似文献   

3.
提出面向水下场景的图像语义分割网络,考虑到速度和准确度之间的权衡问题,网络采用轻量且高效的编解码器结构.在编码器部分,设计倒置瓶颈层和金字塔池化模块,高效地提取特征.在解码器部分,构建特征融合模块融合多水平特征,提升了分割的准确度.针对水下图像边缘模糊的问题,使用辅助的边缘损失函数来更好地训练网络,通过语义边界的监督细化分割的边缘.在水下语义分割数据集SUIM上的实验数据表明,对于320像素×256像素的输入图像,该网络在NVIDIA GeForce GTX 1080Ti显卡上的推理速度达到258.94帧/s,mIoU达到53.55%,能够在保证高准确度的同时,达到实时的处理速度.  相似文献   

4.
在自动驾驶场景下,针对语义分割模型在车载硬件设备中部署时内存受限且算力不足的问题,需要设计一种较好权衡效率和精度的语义分割模型。采用单分支网络结构,设计了一个轻量级多尺度双向注意力网络。为了实现高效的特征提取,设计了一种轻量级卷积单元来构成网络的特征提取骨干。为了较好地定位和分割道路场景中尺度差异较大的物体,提出了一种多尺度双向注意力模块。它具有全局多尺度感受野,并且在沿一个方向编码通道注意力的同时保留了另一个方向的空间位置信息。基于该注意力模块,设计了跳跃注意力连接模块和特征注意力融合模块,使得输出特征兼具细节信息和语义信息。模型在Cityscapes数据集上以0.9M的参数量,取得了71.86%的平均交并比,同时在单个RTX2080Ti GPU下实现了88FPS的推理速度。实验结果表明,该模型能够实现较高的分割精度,适用于车载硬件下的部署和应用,具有一定的实用价值。  相似文献   

5.
基于多级特征并联的轻量级图像语义分割   总被引:1,自引:0,他引:1  
针对当前语义分割算法普遍具有网络结构复杂和计算开销巨大的问题,为了综合提高语义分割算法实时性和精确度,提出计算高效的基于多级特征并联网络(LSSN)的轻量级图像语义分割网络. 该算法综合考虑网络的参数量、运行速度和性能,能更好地应用到嵌入式设备和可移动设备上. 应用微调的深度卷积神经分类网络作为特征提取网络结构,提取网络不同深浅层语义和位置特征. 提出空洞残差增强模块和深度空洞空间金字塔模块分别处理来自特征提取基准网络的深层特征和浅层特征,并将深浅层特征按特定维度比例以并联的方式进行融合. 所提方法在PASCAL VOC 2012数据集上准确度(平均交并比)为77.13%,与当前具有高性能的语义分割算法和实时语义分割算法相比,能更好地平衡网络的实时性和精确度,具有更优的实用价值和性能效果.  相似文献   

6.
针对遥感图像目标尺度变化较大、分割不够准确的问题,提出了一种融合多尺度特征注意力卷积神经网络(CNN)的图像分割方法。该方法基于卷积块注意力模块提出了改进的有效注意力模块(ECBAM)。在通道注意力模块中加入空洞卷积以降低池化操作造成的特征损失,并在通道注意力模块后添加卷积层对通道注意力特征映射进行特征融合。然后,基于ECBAM设计了一种编码解码架构的卷积神经网络模型ECBAM-CNN,其中编码器主要由卷积层、ECBAM和空洞空间金字塔池化模块组成,解码器主要由卷积层和ECBAM组成,并且采用跳跃连接将编码阶段的多尺度信息融合到解码器。实验表明,提出的方法无需预训练和后处理,与SegNet等前沿方法相比取得了更好或相近的分割准确度,在DLRSD和WHDLD测试集上的mIoU分别为67.3%和62.0%。  相似文献   

7.
针对图像超分辨率重建领域中目前大多数轻量级卷积神经网络采用单调的局部或全局连接方式,层间联系弱导致分层特征未能充分利用,而密集网络又存在大量的特征冗余及计算量和内存占用过大等问题,设计了一个轻量级的卷积神经网络,以实现图像超分辨率重建,在保证重建质量的基础上,尽可能减少网络参数和计算复杂度.该方法在残差网络的基础上,提...  相似文献   

8.
雷达调制识别技术在电子侦察、电子支援等领域发挥着重要的作用.现有的雷达调制信号识别算法,通常采用脉内特征提取或者深度学习技术来实现.但这两种方法都存在弊端.提取脉内特征需要复杂的先验知识;深度学习技术虽然不需要复杂的先验知识,但是深度学习技术是数据驱动需要海量的数据以支撑其训练.雷达信号数据的获取又十分的困难,难以构建...  相似文献   

9.
针对基于深度学习的虹膜分割模型存在参数量大、计算量大、占用空间大的问题,提出了一种轻量级的虹膜分割模型。首先,将Linknet中特征提取网络替换为改进的轻量级网络MobileNetv3。这种设计在保持准确性的同时显著地提高了模型效率。其次,为了减少虹膜特征信息丢失,设计了一个多尺度特征提取模块。再次,引入了通道注意力机制,抑制无关噪声,加大虹膜区域的权重。最后,在3个虹膜数据库上将本文模型与其他虹膜分割模型进行比较,结果表明,本文模型在虹膜分割准确率和效率之间取得了更好的平衡。  相似文献   

10.
基于脑组织分割的精确头模型有助于提升经颅磁刺激的治疗效果,但由于人脑的复杂性,很难实现精确的脑组织分割。为此,本文提出了基于迁移学习的多尺度注意网络,该网络可以学习多模态数据之间的互补信息,采用迁移学习方法解决小样本数据引起的过拟合问题,利用膨胀卷积提取多尺度特征,加入注意力机制提高脑组织分割的准确性。通过MRBrainS挑战赛验证了网络的有效性,在多项指标中取得了最好成绩。多尺度注意网络可以为个性化头模型的建立提供一个较好的分割结果,进而优化经颅磁刺激的治疗效果。  相似文献   

11.
深度卷积神经网络对高分辨率遥感影像进行语义分割时,对图像的下采样会造成物体边缘模糊,使分割结果在边缘附近划分不清晰,误分类较多.通过在网络中增加边缘信息可以提升模型对遥感图像的分割能力.因此,提出了一个用于语义分割的双路网络模型,增加一路边缘网络学习目标的边缘特征,并利用边缘特征对分割特征进行细化.同时,作为一个多任务...  相似文献   

12.
基于金字塔连接算法的彩色图像分割   总被引:5,自引:0,他引:5  
根据金字塔连接算法的特性,提出一种彩色图像自动分割算法。根据HSV颜色空间颜色和亮度无关,将彩色图像从RGB空间变换到HSV空间,然后用基于金字塔的图像分割算法对色调、饱和度和亮度3个分量进行分割.通过合并得到最终分割结果.试验表明,这是一种计算高效的自动分割算法,  相似文献   

13.
基于数学形态金字塔分解和流域分割的骨髓细胞图像分割   总被引:1,自引:0,他引:1  
提出了一种基于数学形态金字塔分解和流域分割的骨髓细胞图像分割方法。根据形态金字塔的分解方法,将细胞图像经过形态金字塔分解后,先在低分辨率图像上进行流域分割,然后对低分辨率图像的分割结果进行复合得到原始图像的分割结果。实验结果表明,使用该方法能够获得较好的分割效果,并可提高分割算法的运算速度。  相似文献   

14.
A novel convolutional neural network based on spatial pyramid for image classification is proposed. The network exploits image features with spatial pyramid representation. First, it extracts global features from an original image, and then different layers of grids are utilized to extract feature maps from different convolutional layers. Inspired by the spatial pyramid, the new network contains two parts, one of which is just like a standard convolutional neural network, composing of alternating convolutions and subsampling layers. But those convolution layers would be averagely pooled by the grid way to obtain feature maps, and then concatenated into a feature vector individually. Finally, those vectors are sequentially concatenated into a total feature vector as the last feature to the fully connection layer. This generated feature vector derives benefits from the classic and previous convolution layer, while the size of the grid adjusting the weight of the feature maps improves the recognition efficiency of the network. Experimental results demonstrate that this model improves the accuracy and applicability compared with the traditional model.  相似文献   

15.
随着大量视频监控和摄像头网络的架设,非受限场景下的连续视频帧人脸识别愈发引人关注.传统的连续视频帧人脸识别方法大多存在识别结果易波动和计算资源消耗密集的问题.因此,该文对比了不同的帧间汇聚方式,采用注意力机制优化帧间汇聚过程,并采用3D分离卷积进行视频人脸建模,有效降低了视频人脸识别的计算消耗,提高了识别准确率.此外,...  相似文献   

16.
为了提高各类神经疾病诊断中对感兴趣区的分割准确度,推动基于卷积神经网络(convolutional neural networks,CNN)的语义分割的进一步应用,综述了基于CNN的语义分割方法在多种神经影像研究中的应用.首先,回顾了当前CNN体系结构以及基于CNN语义分割的多种经典模型及其架构变化.然后,对基于CNN的语义分割方法在脑神经影像领域的应用进行了深入的介绍.最后,对该方法在神经影像处理领域的未来发展方向和面临的挑战进行了展望.  相似文献   

17.
针对传统服饰图像分割中标签易混淆和小目标易丢失带来的目标边缘细节难以保留等问题,提出了一种基于卷积注意力特征的残差期望最大化注意力语义分割网络模型。该模型首先以ResNeXt-50作为共享特征的主干网络,并通过在特征提取阶段引入一组平行的卷积注意力模块,可以有效地抑制无效特征,使目标区域的特征更加显著。然后利用残差思想对期望最大化注意力(EMA)单元进行优化,以解决迭代过程中梯度爆炸或者消失的问题,从而更好地建立特征图中位置间的关联,最终实现基于显著性融合学习的语义分割模型。最后在传统民族服饰数据集上通过定性与定量的实验验证了所提模型的有效性,其中平均交并比分割指标达到83.91%,取得了同类算法中最优效果。  相似文献   

18.
随着深度学习的广泛应用,人体姿态估计成为动作识别领域的重要研究方向.为了解决人体姿态估计的准确率低以及目标的多尺度问题,提出了一种基于改进R-FCN(Region-based Fully Convolutional Networks)与语义分割相结合的人体姿态估计模型.首先针对模型的主体网络部分,采用ResNeXt-101深度学习网络替换R-FCN原有的ResNet-101基础网络,使得减少超参数的数量,从而提高准确率.然后针对候选区域结构,结合了一种多尺度RPN(Region Proposals Network)结构,处理候选区域中出现的多尺度问题.最后针对姿态估计部分,以目标检测框架R-FCN为基础,添加了Mask R-CNN中并行的mask分支作为语义分割网络,并且对人体的关键点进行提取,从而实现多任务的姿态识别.实验结果显示,模型在2017 MS COCO数据集上平均检测精度比Mask R-CNN模型提升了12.1%,比RMPE模型提升了2%.  相似文献   

19.
提出了一种新颖的高阶CRF模型, 能够同时获得语义分割和目标检测结果. 该高阶CRF模型由低阶能量项和改进目标检测能量项构成. 该模型采用了一二阶合并方法和逻辑斯蒂回归, 从而降低了由于初始检测不准确而导致的错误识别率. 在MSRC 21和PASCAL VOC 2007两组数据库上进行的实验表明, 该方法显著优于传统方法.  相似文献   

20.
针对终端用户开发与部署网络服务的问题,提出了一个基于网络功能虚拟化技术的网络服务编排环境.该环境主要包含3部分:虚拟网络功能数据模型用于适配异构的网络功能,将网络功能以可视化的形式呈献给用户;服务编排环境用于协助用户完成网络服务流程的设计;服务执行环境用于协助用户完成网络服务的部署与运行.3部分构成了轻量级虚拟网络功能编排工具(LVO).将该工具引入相应的开发方法,用户可以在网页浏览器上通过易用的图形化界面"设计即开发"的方式开发网络服务.通过面向用户的实验和系统性能实验,评估了该网络服务生成环境.评估结果表明,LVO可有效降低普通用户的工具学习时间,提高网络服务开发的正确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号