首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
在智能算法领域,人脸识别是一个重要的算法部分,而人脸分割又是人脸识别的一个重要组成部分。提出一种基于改进的深度卷积生成式对抗网络的人脸分割方法,将端到端的图像变换模式应用于生成器中,利用生成器对人脸图像进行分割。深度卷积生成式对抗网络将卷积层加入到生成器和判别器,使得生成器通过反卷积产生图像,而文中在反卷积之前再加入卷积层,组合形成全卷积的网络结构,将生成器的图像生成功能扩展成为语义分割功能。同时,生成器的输入原图和输出标签的通道组合作为判别器的判别对象,通过判别器来评判分割水平,进一步提高分割的标签与输入原图的关联性。经过多次实验,验证此方法能有效分割人脸主要区域。  相似文献   

2.
在自动驾驶场景下,针对语义分割模型在车载硬件设备中部署时内存受限且算力不足的问题,需要设计一种较好权衡效率和精度的语义分割模型。采用单分支网络结构,设计了一个轻量级多尺度双向注意力网络。为了实现高效的特征提取,设计了一种轻量级卷积单元来构成网络的特征提取骨干。为了较好地定位和分割道路场景中尺度差异较大的物体,提出了一种多尺度双向注意力模块。它具有全局多尺度感受野,并且在沿一个方向编码通道注意力的同时保留了另一个方向的空间位置信息。基于该注意力模块,设计了跳跃注意力连接模块和特征注意力融合模块,使得输出特征兼具细节信息和语义信息。模型在Cityscapes数据集上以0.9M的参数量,取得了71.86%的平均交并比,同时在单个RTX2080Ti GPU下实现了88FPS的推理速度。实验结果表明,该模型能够实现较高的分割精度,适用于车载硬件下的部署和应用,具有一定的实用价值。  相似文献   

3.
针对实时语义分割任务中需要同时兼顾位置信息和语义信息的问题,提出一种改进特征融合的实时语义分割方法。该方法由卷积神经网络、轻量级注意力模块(light attention module, LAM)和双通道特征融合模块(bilateral feature fusion module, BFFM)组成。首先,使用卷积神经网络结合轻量级注意力模块快速提取图像的位置信息和语义信息。然后,使用双通道特征融合模块指导位置信息和语义信息的特征图融合。所提方法在CamVid上,平均交并比达到67.8%,分割速度可达到52.6帧/s。在Cityscapes上,平均交并比达到73.5%,分割速度可达到31.8帧/s。实验结果表明,提出的分割方法满足分割的准确性和实时性要求,能够适用于实时语义分割任务中。  相似文献   

4.
针对核电安全壳表面裂缝视觉检查任务面临的裂缝细小且占像素少、裂缝与背景对比度低、相似纹理干扰多、光照影响等问题,作者提出了一种细小裂缝分割模型TCS-Net(Segmentation network of tiny cracks)。该模型是编码——解码的网络结构,在下采样过程使用Soft Pooling减少编码过程池化导致的信息损失以保留图像边缘细节及位置信息;解码端在下采样过程中通过加入兼顾通道注意力和空间注意力的语义补偿模块(ResCRAM)以融合编码端的各层特征,可增强裂缝的多尺度细节信息;结合Bce(Binary Cross-Entropy)损失和Dice损失作为目标损失函数,以解决单一损失关注度倾向带来的训练不稳定的问题,也可优化Acc(Accuracy)、IOU(Intersection over Union)、Recall等性能指标。为了验证模型的有效性,在真实的安全壳图像对所提裂缝分割模型进行了测试。实验结果表明,与现有的主流语义分割模型相比,TCS-Net裂缝分割模型的IOU指标可提高5%-9%,Recall指标可提高9%-13%,由此说明该模型具有检测率和检测精度更高,能有效适用于目标与背景严重不平衡、背景复杂且干扰较多情况下的细小裂缝分割任务。  相似文献   

5.
针对传统服饰图像分割中标签易混淆和小目标易丢失带来的目标边缘细节难以保留等问题,提出了一种基于卷积注意力特征的残差期望最大化注意力语义分割网络模型。该模型首先以ResNeXt-50作为共享特征的主干网络,并通过在特征提取阶段引入一组平行的卷积注意力模块,可以有效地抑制无效特征,使目标区域的特征更加显著。然后利用残差思想对期望最大化注意力(EMA)单元进行优化,以解决迭代过程中梯度爆炸或者消失的问题,从而更好地建立特征图中位置间的关联,最终实现基于显著性融合学习的语义分割模型。最后在传统民族服饰数据集上通过定性与定量的实验验证了所提模型的有效性,其中平均交并比分割指标达到83.91%,取得了同类算法中最优效果。  相似文献   

6.
目标检测作为计算机视觉的重要分支之一应用广泛,其中针对细长物体的检测不仅研究成果少,且识别精度低。相较于基于锚框的检测算法,无锚框方法对任意几何形状物体的定位均具有较好的灵活性,能更好地适应细长物体的形状,其中基于全卷积网络的一阶段检测算法(FCOS)通过基于中心度的预测框抑制机制可以更好地标定细长目标。据此提出改进FCOS的细长物体检测算法,将FCOS骨干网络中卷积运算替换为可变形卷积,设计了增强的特征金字塔网络的特征融合模块(EFPN),EFPN充分利用通道注意力机制和空洞卷积减少语义信息的丢失,同时能进行有效的特征融合;为更好标定细长目标,使用带有细长度的中心度抑制低质量的检测框。实验结果表明,改进的算法与FCOS相比平均精度提升了3.3%,与卷积神经网络(Faster R-CNN)相比提升了6.9%,验证了其有效性。  相似文献   

7.
针对现有语义分割网络模型在道路语义分割方面检测精度低、计算量大等问题,基于BiSeNet V2网络模型进行优化改进,引入一种高效的通道注意力(efficient channel attention, ECA)模块,在BiSeNet V2的语义分支和细节分支的每个阶段末端分别加入ECA,得到ECA-Semantic-BiSeNet V2网络。使用实车采集道路图像数据进行标注并构建自采数据集,在Cityscapes数据集、KITTI数据集及自采数据集上分别对改进前后的网络模型进行试验验证。试验结果表明,与BiSeNet V2模型方法相比,本研究方法在Cityscapes数据集上MIoU提高14.01%,在KITTI数据集上MIoU提高1.86%,同时在BiSeNet V2的语义分支加入ECA后运算量增加0.02 GFlops的条件下,模型推理速度提高了7.82帧/s。  相似文献   

8.
针对烟雾分割领域缺乏应用于实际监控系统的实时烟雾分割算法的现况,提出高准确率的实时烟雾分割算法. 该算法利用轻量化的多分辨率卷积模块并行提取特征图,在获得丰富语义信息的同时满足实时分割的需求. 提出烟雾前景增强模块,使得烟雾像素点融合前景增强表征、避免背景信息干扰,分割准确率得以提高. 提出残差注意力模块,从通道、空间维度增强重要特征信息,抑制无效信息. 该算法在自建数据集上平均交并比为91.27%,每张图片预测时间为39.06 ms,网络权重为74.66 MB;在公开数据集上的对比结果表明,该算法综合检测性能优于其他烟雾检测算法. 该算法分割准确率高、检测速度快且模型轻量化,可以应用于实际视频监控系统.  相似文献   

9.
为了解决糖尿病性视网膜病变诊断难、各地评判标准不统一的问题,提出了基于注意力机制和稠密卷积的视网膜微血管分割算法,即通过图像分割技术来辅助诊断,既减轻了工作量,又能保证准确率.以LadderNet为基础网络,为了更加突出微血管信息,加入注意力机制,使微血管的特征信息更加完整、准确地保留下来.使用稠密卷积在增强特征信息传递的同时减少参数数量,进一步提升图像分割性能.该算法具有更好的分割性能,能够更好地完成视网膜微血管分割任务.  相似文献   

10.

针对现有半监督视频目标分割方法不能同时满足分割精度和分割效率的问题,在传统半监督视频目标分割方法上引入注意力机制对分割结果进行修正. 首先,构建一个外观特征提取子网用于提取视频第1帧的特征图,并将其作为外观指导信息;然后,得到视频前一帧的分割结果,作为位置引导信息;最后,构建一个当前帧特征提取子网,以双分支的结构结合位置修正注意力与外观修正注意力,将位置信息和外观信息与当前帧特征图进行融合,实现目标分割. 实验结果表明,该目标分割方法可以纠正视频目标分割中的传播误差,并能有效提升分割精度.

  相似文献   

11.
Existing video smoke detection methods have a low detection accuracy in complex scenes and cannot detect smoke areas in video frames accurately. In this paper, a phased smoke detection algorithm that combines the smoke movement process and the target detection algorithm is proposed. First, an improved ViBe algorithm based on smoke color features is used to extract the continuously moving smoke in video. Then, the YOLO v3 model is used as the target detection network. The channel attention mechanism is added to the residual structure of its backbone network. Focal-loss and GIoU are utilized to improve the loss function. According to the test of the smoke image data set, the detection time of the improved network on a single picture is 38.4ms and the mAP reaches 92.13%, which is 2.19% higher than that by the original model. While extracting smoke motion, the same frame is sent to the improved YOLO v3 for smoke detection. Finally, comprehensive discrimination is made based on the smoke detection results in stages. Public smoke video test results show that the algorithm has an average detection rate of 98.88%, which proves that the algorithm has a strong adaptability, a high detection efficiency in complex scenes and a high practical application value.  相似文献   

12.
When the feature of stroke lesions is non-distinct,and the boundary between the lesions and the healthy brain tissue is difficult to distinguish,the segmentation model based on the self-attention mechanism is prone to generate a wrong attention coefficient map of the focus area,which affects the segmentation performance.To solve this problem,based on the global-attention-upsample attention U-Net (GAU-A-UNet),we propose a primary-auxiliary path attention compensation network (PAPAC-Net).The primary path network is responsible for accurate lesion segmentation and outputting the segmentation results while the auxiliary path network generates a tolerant auxiliary attention compensation coefficient to compensate for the primary path network’s potential attention coefficient map errors.Two compound loss functions are also proposed to realize the different functions for the primary and auxiliary path networks.Experimental results show that our GAU-A-UNet and PAPAC-Net both have a significant improvement in segmentation performance,which proves the effectiveness of our method.  相似文献   

13.
基于多级特征并联的轻量级图像语义分割   总被引:1,自引:0,他引:1  
针对当前语义分割算法普遍具有网络结构复杂和计算开销巨大的问题,为了综合提高语义分割算法实时性和精确度,提出计算高效的基于多级特征并联网络(LSSN)的轻量级图像语义分割网络. 该算法综合考虑网络的参数量、运行速度和性能,能更好地应用到嵌入式设备和可移动设备上. 应用微调的深度卷积神经分类网络作为特征提取网络结构,提取网络不同深浅层语义和位置特征. 提出空洞残差增强模块和深度空洞空间金字塔模块分别处理来自特征提取基准网络的深层特征和浅层特征,并将深浅层特征按特定维度比例以并联的方式进行融合. 所提方法在PASCAL VOC 2012数据集上准确度(平均交并比)为77.13%,与当前具有高性能的语义分割算法和实时语义分割算法相比,能更好地平衡网络的实时性和精确度,具有更优的实用价值和性能效果.  相似文献   

14.
提出了一种改进的脉冲耦合神经网络(Receptive field-pulse coupled neural net-works,RF-PCNN)模型。通过感受野模型对连接矩阵的优化,使脉冲耦合神经网络(Pulsecoupled neural networks,PCNN)模型具有了方向性和尺度性,能够更好地模拟视觉细胞图像分割的功能。试验结果表明:RF-PCNN模型对自然环境中车辆图像分割的有效性,分割结果具有较高的边界检出率,较好地解决了图像分割中车牌区域存在的欠分割和过分割问题。  相似文献   

15.
为了从医疗图像中自动且准确地提取兴趣区域,提出基于神经网络的分割模型MS2Net.针对传统卷积操作缺乏获取长距离依赖关系能力的问题,为了更好提取上下文信息,提出融合卷积和Transformer的架构.基于Transformer的上下文抽取模块通过多头自注意力得到像素间相似度关系,基于相似度关系融合各像素特征使网络拥有全局视野,使用相对位置编码使Transformer保留输入特征图的结构信息.为了使网络适应兴趣区域形态的差异,在MS2Net中应用解码端多尺度特征并提出多尺度注意力机制.对多尺度特征图依次应用分组通道和分组空间注意力,使网络自适应地选取合理的多尺度语义信息. MS2Net在数据集ISBI 2017和CVC-ColonDB上均取得较U-Net、CE-Net、DeepLab v3+、UTNet等先进方法更优的交并比指标,有着较好的泛化能力.  相似文献   

16.
Current methods focusing on 3D model recognition and segmentation have to some extent ignored the relationship between the high-level global single-point features and the low-level local geometric features of those models, resulting in poor recognition results. A multi-feature fusion approach which takes into consideration the aforementioned ignored relationship is proposed. First, a global single-point network is established to extract the global single-point features with high-level semantic recognition ability by increasing both the width of convolution kernel and the depth of the network. Second, an attentional fusion layer is constructed to learn the implicit relationship between global single-point features and local geometric features to fully explore the fine-grained geometric features that can better represent model categories. Finally, the global single-point features and fine-grained geometric features are further fused to achieve the complementation of advantages and enhance the feature richness. Experimental verification is carried out on the 3D model recognition datasets ModelNet40, ModelNet10 and segmentation datasets ShapeNet Parts, S3DIS, vKITTI, respectively, and comparison with current mainstream recognition algorithms shows that the proposed algorithm not only has higher recognition and segmentation accuracy, but also has stronger robustness.  相似文献   

17.
本文介绍了一种改进的塔形结构图像分割算法,对原算法的迭代过程作了修正,设计了新的连接强度及面积因子公式,并在分割过程中同步地完成区域的合并以及区域特征值的计算。与原算法相比较,改进算法具有收敛速度快、运算量减少、实现方便、功能较全面等优点。对红外前视图像的分割结果表明:改进算法是行之有效的。  相似文献   

18.
在水下生物检测中,经典目标检测模型由于体积大、参数量多,不适用于微小型水下硬件设备,而现有轻量化模型又难以平衡检测精度和实时性.针对这一问题,本研究提出了基于改进Mobilenet-YOLOv3的轻量级检测算法CPM-YOLOv3,该算法利用规整通道剪枝算法对Mobilenet-YOLOv3进行剪枝,并将特征提取网络中的SE(squeeze-and-excitation)模块替换成CBAM (convolutional block attention module),实现对网络模型的压缩.同时,在不同尺寸的检测层中分别加入2个CBAM,在几乎不增加模型大小的情况下提升模型关注目标特征信息的能力.实验结果表明,CPM-YOLOv3模型大小仅有4.86 MB,与原模型相比大小降低了94.7%,平均检测精度为87.0%,速度为5.1 ms/帧.相较于其他网络模型,CPM-YOLOv3更适合在微小型水下设备中应用.  相似文献   

19.
针对病理图像染色不均匀及良恶性难以鉴别的问题,提出基于Cycle-GAN和改进的双路径网络(DPN)的算法框架. 利用Cycle-GAN进行颜色归一化处理,解决因病理图像染色不均匀导致的检测模型精度偏低问题,通过对图像进行重叠切片,基于DPN网络采用增加小卷积、反卷积和注意力机制,增强模型对病理图像纹理特征的分类能力. 在BreaKHis数据集上的实验结果表明,所提算法有效提高了乳腺癌病理图像良恶性分类的准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号