首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
虹膜识别是生物特征识别中最稳定和最可靠的身份识别方法之一.在虹膜识别的整个流程中,虹膜分割处于预处理阶段,因此虹膜分割结果的好坏将直接影响虹膜识别的精度.自从1993年Daugman第1次提出高性能的虹膜识别系统以来,各种各样的虹膜分割算法陆续提出,尤其是近年来基于深度学习的虹膜分割算法极大地提升了虹膜分割的精度.然而,由于缺乏统一的数据库和评价指标,各种算法的性能比较杂乱而不公平,因此提出了一个公开的虹膜分割评价基准.首先,介绍了虹膜分割的定义和面临的挑战;其次全面梳理了3个有代表性的公开虹膜分割数据库,总结了其特点和挑战性;紧接着定义了虹膜分割的评价指标;然后对传统的和基于深度学习的虹膜分割算法进行了总结,并通过详细的实验对各类算法进行了比较和分析.实验结果表明:当前基于深度学习的虹膜分割算法在准确性上超越了传统的方法.最后,对基于深度学习的虹膜分割算法存在的问题进行了思考和讨论.  相似文献   

2.
对基于深度学习的高精度图像语义分割模型参数量大、分割速度慢的问题,提出一种基于双路径特征融合编解码结构的语义分割模型.首先,该模型编码器通过对语义路径和空间路径同时进行编码,其能够融合不同的特征信息,弥补了空间信息和语义信息难以两全的弊端,对特征图进行高效的卷积操作;其次,该模型解码器通过融合高层语义信息和低层空间信息,有效地弥补了编码时下采样操作丢失的特征信息.在Cityscapes和Camvid数据集上的实验结果表明,整体模型的参数量仅为3.91×10^(6),在2个数据集上分别取得了67.7%和65.8%的均交并比,分割速度分别为111帧/s和86帧/s.对比其他同类模型,所提模型拥有更少的参数量和更高的精度,其分割速度远远超过实时语义分割的最低要求24帧/s.  相似文献   

3.
皮肤镜图像的病灶区域与背景像素相似度高,且病灶存在形状多样,边缘模糊,人工或毛发遮挡等情况,为了获得更高精度的皮肤病变分割,提出了一种皮肤镜图像自动分割算法.首先,使用ResNet 34提取多种分辨率特征,在上下文部分使用Transformer模块对输入的特征进行全局建模;其次,通过混合池化模块聚合上下文特征的多尺度信息,在对应连接编解码器的跳跃连接间设计一个高效卷积模块以提高跳跃路径的边缘细化和抗干扰能力;最后,利用解码器恢复图像分辨率,并逐层融合其他浅层分辨率特征,利用Focal Loss函数改善难分割目标的精度.文中算法在ISIC2017,ISIC2018数据集上获得的Dice系数、准确率、Jaccard指数、灵敏度得分分别为88.83%,94.77%,81.43%,88.49%和89.46%,94.50%,82.56%,94.62%,与其他算法相比具有一定的优势,证明了该算法的有效性.  相似文献   

4.
活体虹膜图像的定位与分割   总被引:2,自引:0,他引:2  
介绍了一种活体虹膜的定位与分割算法。算法主要分为两部分:圆环的定位与非虹膜区域的去除。本算法根据眼睛的生理特点和数字虹膜图像的实际情况,利用传统定位方法与数学形态学相结合对虹膜区域进行快速而准确的定位,并分别提出了去除眼睑、睫毛和光斑影响的解决方案。算法中也考虑到实际应用可能遇到的影响虹膜定位与分割的问题。实验表明,该算法取得较好的分割结果,并且具有鲁棒性。  相似文献   

5.
如何迅速、准确地分割虹膜区域是基于虹膜图像的身份鉴别技术的一个研究热点和难点。本文结合虹膜图像的特点,在内边缘的定位中采用了阈值化结合最小二乘估计的方法;对外边缘和眼睑的边缘图进行预处理,并改进了Hough变换的决策方法,准确而快速地分割出虹膜区域。  相似文献   

6.
图像级标签的弱监督图像语义分割方法是目前比较热门的研究方向,类激活图生成方式是最为常用的解决该类问题的主要工作方法。由于类激活图的稀疏性,导致判别区域的准确性降低。针对上述问题,提出了一种改进的Transformer网络弱监督图像学习方法。首先,引入空间注意力交换层来扩大类激活图的覆盖范围;其次,进一步设计了一个注意力自适应模块,来指导模型增强弱区域的类响应;特别地,在类生成过程中,构建了一个自适应跨域来提高模型分类性能。该方法在Pascal VOC 2012 验证集和测试集上分别达到了73.5%和73.0%。实验结果表明,细化Transformer网络学习方法有助于提高弱监督图像的语义分割性能。  相似文献   

7.
医学图像对疾病的诊断、治疗和评估均有所帮助,准确分割医学图像中的器官对于辅助医生的诊断具有重要的实际意义.由于医学图像中各器官部位与周围组织的图像对比度低,不同器官的边缘和形状也会存在很大差异,从而增加了分割的难度.针对这些问题,本文提出了一种基于卷积神经网络和Transformer的医学图像语义分割网络,有效提高了医学图像语义分割的精度.特征提取部分使用ResNet-50网络结构,在特征提取后使用Transformer模块来扩大感受野.在上采样过程中加入多个跳跃连接层,充分利用各阶段的特征提取信息,来恢复至与输入图像相近的分辨率.在胃肠道医学图像分割数据集上的实验结果证明本文的方法可以有效分割医学图像中的器官组织,提升分割准确率.  相似文献   

8.
目前,医学图像分割模型广泛采用基于全卷积网络(FCN)的U型网络(U-Net)作为骨干网,但卷积神经网络(CNN)在捕捉长距离依赖能力上的劣势限制了分割模型性能的进一步提升。针对上述问题,研究者们将Transformer应用到医学图像分割模型中以弥补CNN的不足,结合Transformer和U型结构的分割网络成为研究热点之一。在详细介绍U-Net和Transformer之后,按医学图像分割模型中Transformer模块所处的位置,包括仅在编码器或解码器、同时在编码器和解码器、作为过渡连接和其他位置进行分类,讨论各模型的基本内容、设计理念以及可改进的地方,并分析了Transformer处于不同位置的优缺点。根据分析结果可知,决定Transformer所在位置的最大因素是目标分割任务的特点,而且Transformer结合U-Net的分割模型能更好地利用CNN和Transformer各自的优势,提高模型的分割性能,具有较大的发展前景和研究价值。  相似文献   

9.
毛琳  任凤至  杨大伟  张汝波 《软件学报》2023,34(7):3408-3421
提出一种基于卷积神经网络的Transformer模型来解决全景分割任务,方法借鉴CNN在图像特征学习方面的先天优势,避免了Transformer被移植到视觉任务中所导致的计算量增加.基于卷积神经网络的Transformer模型由执行特征域变换的映射器和负责特征提取的提取器这两种基本结构构成,映射器和提取器的有效结合构成了该模型的网络框架.映射器由一种Lattice卷积模型实现,通过对卷积滤波器进行设计和优化来模拟图像的空间关系.提取器由链式网络实现,通过链式单元堆叠提高特征提取能力.基于全景分割的结构和功能,构建了基于CNN的全景分割Transformer网络.在MS COCO和Cityscapes数据集的实验结果表明,所提方法具有优异的性能.  相似文献   

10.
【目的】数据分布对深度学习模型的性能影响较大。模型学习了与分割目标无关的特征后,这些无关特征通常不适用于新的数据集,从而导致模型泛化能力不足。【方法】为缓解这一问题,本文提出基于因果约束的Transformer医学图像分割方法。以MCRformer为网络主体,利用形态约束流模块提取形态约束先验信息,网状Transformer进一步提取局部信息和网络各层次信息,并加入因果约束模块降低目标区域相关特征和无关特征之间的相关性,通过形态先验和因果先验信息为模型选出具有代表性的特征,最终提高分割性能。【结果】在公开数据集Synapse上,Dice相关系数和Hausdorff距离的均值分别达到了80.01%和19.39 mm,在公开数据集ACDC上,Dice相关系数均值达到了90.95%,优于其他对比方法。【结论】实验证明,本文提出的方法可以有效提升CT和MRI中多器官的分割性能,并验证因果约束模块在不同模型上的有效性。  相似文献   

11.
多器官医学图像分割有助于医生做出临床诊断. 针对CNN提取全局特征能力弱, Transformer提取局部特征能力弱, 以及Transformer具有二次方计算复杂度的问题, 提出了用于多器官医学图像分割的多级特征交互Transformer模型. 所提模型采用CNN提取局部特征, 局部特征经Swin Transformer输出全局特征; 通过下采样分别产生多级局部和全局特征, 每级局部和全局特征经过交互并增强; 每级增强后的特征经多级特征融合模块进行交叉融合; 再次融合后的特征经过上采样和分割头输出分割掩码. 所提模型在Synapse和ACDC数据集上进行实验, 平均DSC和平均HD95系数值为80.16%和19.20 mm, 均优于LGNet和RFE-UNet等代表性模型. 该模型对多器官医学图像分割是有效的.  相似文献   

12.
针对以往医学图像分割网络中卷积的感受野太小以及Transformer的特征丢失问题,提出了一种端到端的轻量化上下文Transformer医学图像分割网络(lightweight context Transformer medical image segmentation network,CoT-TransUNet)。该网络由编码器、解码器以及跳跃连接三部分组成。对于输入图像,编码器使用CoTNet-Transformer的混合模块,采用CoTNet作为特征提取器来生成特征图。Transformer块则把特征图编码为输入序列。解码器通过一个级联上采样器,将编码后的特征进行上采样。该上采样器级联了多个上采样块,每个上采样块都采用CARAFE上采样算子。通过跳跃连接实现编码器与解码器在不同分辨率上的特征聚合。CoT-TransUNet通过在特征提取阶段采用全局与局部上下文信息相结合的CoTNet;在上采样阶段采用具有更大感受野的CARAFE算子。实现了生成更好的输入特征图,以及基于内容的上采样,并保持轻量化。在多器官分割任务的实验中,CoT-TransUNet取得了优于其他网络的性能。  相似文献   

13.
关于虹膜优化检测问题,由于人眼图像中存在眼睑、瞳孔等无关区域,形成的躁声信息严重影响识别精度,针对难以提取准确虹膜图像,提出了一种高效的利用面积分微分算子的直接虹膜提取方法,采用John Daugman积分微分算子进行边界检测.首先以虹膜图像灰度直方图为基础,通过灰度投影定位虹膜内边缘,然后利用积分微分算子确定虹膜左右外边界.最后,利用面积分微分算子求解最恰当的虹膜上下边界.识别过程中,利用Gabor小波提取虹膜图像特征,通过比对虹膜特征来识别虹膜.试验结果表明,改进方法可以有效地实现虹膜识别准确性.  相似文献   

14.
基于深度学习的驱油图像分割是驱油率分析计算的关键步骤,相对于其他方法,基于U形结构的全卷积神经网络(Fully Convolutional Networks, FCN)在许多不同的图像任务中取得了显著的成效。但在这些结构中,标准卷积具有固定的感受野,不能提取到不同尺度的信息,丢失细节特征,导致分割精度较差,边缘模糊;其次主流模型对噪声的鲁棒性较差,并且信息之间往往会存在冗余,在融合阶段中未能对关键信息有效提取。为解决上述问题,在U-net的基础上引入多尺度信息提取和空间注意力融合并将其集成为多尺度信息提取融合(MIEF)模块,通过提取不同的尺度信息有效地保留了图像细节特征,之后通过空间注意力动态地融合提取到的多尺度信息,增强抗干扰性,实现网络对多尺度信息的有效利用。通过在驱油数据集上进行实验,准确率和MIoU相较于原始U-net网络分别提高了2.55%和1.24%,并与其他方法进行对比,验证了该方法的可行性和有效性。  相似文献   

15.
高精(high-definition, HD)地图可以提供准确的道路信息和丰富的语义信息,使自动驾驶系统引导车辆正确行驶。高精地图通常依赖人工标注,现有自动化标注方法在自动驾驶场景下的识别精度较低,导致高精地图标注效率低下。为了解决这一问题,提出了一种新的用于高精地图自动标注的语义分割方法MapFormer,包括一个多级特征融合模块,能够使模型聚合不同级别的细节和语义信息;一种新的边界解耦联合解码器用以提高模型处理类别间边界的能力。在鸟瞰图数据集上的实验验证了该模型不仅在分割精度上取得了优秀的表现,而且在对类别边界的处理上更为清晰。其mIoU为55.82%,高于SegFormer的mIoU 1.03%,该方法可提升高精地图标注效率与标注自动化率。  相似文献   

16.
目的 虹膜识别是一种稳定可靠的生物识别技术,但虹膜图像的采集过程会受到多种干扰造成图像中虹膜被遮挡,比如光斑遮挡、上下眼皮遮挡等。这些遮挡的存在,一方面会导致虹膜信息缺失,直接影响虹膜识别的准确性,另一方面会影响预处理(如定位、分割)的准确性,间接影响虹膜识别的准确性。为解决上述问题,本文提出区域注意力机制引导的双路虹膜补全网络,通过遮挡区域的像素补齐,可以显著减少被遮挡区域对虹膜图像预处理和识别的影响,进而提升识别性能。方法 使用基于Transformer的编码器和基于卷积神经网络(convolutional neural network, CNN)的编码器提取虹膜特征,通过融合模块将两种不同编码器提取的特征进行交互结合,并利用区域注意力机制分别处理低层和高层特征,最后利用解码器对处理后的特征进行上采样,恢复遮挡区域,生成完整图像。结果 在CASIA(Institute of Automation, Chinese Academy of Sciences)虹膜数据集上对本文方法进行测试。在虹膜识别性能方面,本文方法在固定遮挡大小为64×64像素的情况下,遮挡补全结果的TAR(true...  相似文献   

17.
目的 脊椎CT(computed tomography)图像存在组织结构显示不佳、对比度差以及噪音干扰等问题;传统分割算法分割精度低,分割过程需人工干预,往往只能实现半自动分割,不能满足实时分割需求。基于卷积神经网络(convolutional neural network,CNN)的U-Net模型成为医学图像分割标准,但仍存在长距离交互受限的问题。Transformer集成全局自注意力机制,可捕获长距离的特征依赖,在计算机视觉领域表现出巨大优势。本文提出一种CNN与Transformer混合分割模型TransAGUNet (Transformer attention gate U-Net),以实现对脊椎CT图像的高效自动化分割。方法 提出的模型将Transformer、注意力门控机制(attention gate,AG)及U-Net相结合构成编码—解码结构。编码器使用Transformer和CNN混合架构,提取局部及全局特征;解码器使用CNN架构,在跳跃连接部分融入AG,将下采样特征图对应的注意力图(attention map)与下一层上采样后获得的特征图进行拼接,融合低层与高层特征从而实现更精细的分割。实验使用Dice Loss与带权重的交叉熵之和作为损失函数,以解决正负样本分布不均的问题。结果 将提出的算法在VerSe2020数据集上进行测试,Dice系数较主流的CNN分割模型U-Net、Attention U-Net、U-Net++和U-Net3+分别提升了4.47%、2.09%、2.44%和2.23%,相较优秀的Transformer与CNN混合分割模型TransUNet和TransNorm分别提升了2.25%和1.08%。结论 本文算法较以上6种分割模型在脊椎CT图像的分割性能最优,有效地提升了脊椎CT图像的分割精度,分割实时性较好。  相似文献   

18.
目的 图像检索是计算机视觉领域的一项基础任务,大多采用卷积神经网络和对称式学习策略,导致所需训练数据量大、模型训练时间长、监督信息利用不充分。针对上述问题,本文提出一种Transformer与非对称学习策略相结合的图像检索方法。方法 对于查询图像,使用Transformer生成图像的哈希表示,利用哈希损失学习哈希函数,使图像的哈希表示更加真实。对于待检索图像,采用非对称式学习策略,直接得到图像的哈希表示,并将哈希损失与分类损失相结合,充分利用监督信息,提高训练速度。在哈希空间通过计算汉明距离实现相似图像的快速检索。结果 在CIFAR-10和NUS-WIDE两个数据集上,将本文方法与主流的5种对称式方法和性能最优的两种非对称式方法进行比较,本文方法的mAP(mean average precision)比当前最优方法分别提升了5.06%和4.17%。结论 本文方法利用Transformer提取图像特征,并将哈希损失与分类损失相结合,在不增加训练数据量的前提下,减少了模型训练时间。所提方法性能优于当前同类方法,能够有效完成图像检索任务。  相似文献   

19.
针对运动捕获数据分割问题,提出一种基于时频分析的多粒度分割算法.该算法在时域分析阶段利用稀疏重构对运动序列进行预分割,通过多尺度时序关联方法将原始运动序列分割为独立行为片段和混合运动基元,实现粗粒度分割;进一步,在频域分析阶段先在主频率下对每个独立行为片段进行特征提取,再结合零速度穿越点检测和自适应K-means算法将每个独立行为片段分割为多个重复子周期片段,实现细粒度分割.实验结果表明,预分割及多尺度分割策略的使用使得分割准确率更高,对混合运动基元的识别和分割更为精准,而且在主频率下进行特征提取使得算法对噪声具有更好的鲁棒性.  相似文献   

20.
面向任意输入条件的曲面等值分割方法具有通用性,但已有方法未对其界点跟踪环节进行深入探讨.为此,提出曲面等值分割中的界点跟踪算法.首先,通过循环选择当前网格单元的出入界点,构建后继网格单元,并设为当前网格单元来跟踪界点;其次,对算法中的关键技术——网格单元动态构建方法以及基于界边生长趋势预测的网格单元出入界点选择方法进行介绍;最后,针对坐标、可加工性、法向量、高斯曲率和平均曲率等面点属性设计5个分割条件集,并进行实例测试.当网格单元均仅有2个界点时,该方法与已有方法的分割精度相同;当存在网格单元有2个以上界点时,该方法的平均界点误差比已有方法降低91.78%.实验结果表明,该方法适用于更复杂的分割问题,且具有较高的分割精度和鲁棒性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号