期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

潘显珊王正勇罗彬彬滕奇志何小海《计算机系统应用》2024,33(12):222-230

岩屑识别是地质勘探录井工作中的重要手段, 为了解决传统人工岩性识别效率低下和常见深度学习网络推理速度慢计算量大等问题, 本文借助于表现较好的短时密集串联网络模型, 提出了一种实时岩屑图像语义分割网络DAF-STDC. 该网络使用空洞卷积在提取特征过程中保持分辨率, 利用注意力机制帮助模型获取特征图中全局信息, 从而细化岩屑颗粒边缘信息, 使用特征融合模块加强低阶细节特征与高阶语义特征的融合程度, 帮助特征表达. 经实验证明, 改进后的网络模型在精度方面有了大幅提升, 在岩屑录井工作中收集到的6类岩屑图像, 制成的数据集RC_Dataset上, 平均交并比达到83.12%, 在保持参数量的同时, 推理速度和分割精度有了明显提升, 为岩屑录井数字化提供了有效参考. 相似文献

2.

用于交通图像识别的改进尺度依赖池化模型

徐喆冯长华《计算机应用》2018,38(3):671-676

针对交通标志在自然场景中所占的比例较小、提取的特征量不足、识别准确率低的问题,提出改进的尺度依赖池化（SDP）模型用于小尺度交通图像的识别。首先,基于神经网络深卷积层具有较好的轮廓信息与类别特征,在SDP模型只提取浅卷积层特征信息的基础上,使用深卷积层特征补足型SDP（SD-SDP）映射输出,丰富特征信息;其次,因SDP算法中的单层空间金字塔池化损失边缘信息,使用多尺度滑窗池化（MSP）将特征池化到固定维度,增强小目标的边缘信息;最后,将改进的尺度依赖池化模型应用于交通标志的识别。实验结果表明,与原SDP算法比较,提取特征量增加,小尺度交通图像的识别准确率较好地提升。相似文献

3.

基于改进残差网络的扬尘图像识别方法

下载免费PDF全文

王艳张游杰《计算机系统应用》2021,30(5):202-207

当前利用深度学习方法进行扬尘图像识别的研究较少,一些传统的方法使得扬尘图像的识别率较低.针对这种情况,提出一种基于改进残差网络的扬尘识别方法.该方法将ResNet-50网络应用到扬尘数据集中,并对其网络结构进行了改进.加入空间金字塔池化以解决输入图像尺寸不固定的问题,并且将金字塔池的策略改为平均池化,将扩大特征图的方法应用到主干网络中,有利于提取到更加细粒度的特征,提升模型的性能,从而提高识别率.实验结果表明,该方法具有很高的精确度,为扬尘识别提供了一种有效的方案. 相似文献

4.

轻量化卷积注意力特征融合网络的实时语义分割

董荣胜刘意马雨琪李凤英《计算机辅助设计与图形学学报》2023,35(6):935-943

轻量化卷积神经网络的出现促进了基于深度学习的语义分割技术在低功耗移动设备上的应用. 然而, 轻量化卷积神经网络一般不考虑融合特征之间的关系, 常使用线性方式进行特征融合, 网络分割精度有限. 针对该问题,提出一种基于编码器-解码器架构的轻量化卷积注意力特征融合网络. 在编码器中, 基于 MobileNetv2 给出空洞MobileNet 模块, 以获得足够大的感受野, 提升轻量化主干网络的表征能力; 在解码器中, 给出卷积注意力特征融合模块, 通过学习特征平面通道、高度和宽度 3 个维度间的关系, 获取不同特征平面之间的相对权重, 并以此对特征平面进行加权融合, 提升特征融合的效果. 所提网络仅有 0.68×10⁶ 参数量, 在未使用预训练模型、后处理和额外数据的情况下, 使用 NVIDIA 2080Ti 显卡在城市道路场景数据集 Cityscapes 和 CamVid 上进行实验的结果表明, 该网络的平均交并比分别达到了 72.7%和 67.9%, 运行速度分别为 86 帧/s 和 105 帧/s, 在分割精度、网络规模与运行速度之间达到了较好的平衡. 相似文献

5.

改进DeepLabv2的实时图像语义分割算法

马书浩安居白于博《计算机工程与应用》2020,56(18):157-164

图像语义分割是计算机视觉感知系统的重要组成之一,针对现有的语义分割算法存在分割速度慢的问题提出基于DeepLabv2改进的实时图像语义分割算法。与DeepLabv2相比,改进后的算法使用轻量卷积神经网络Xception作为编码器,增加特征金字塔网络（Feature Pyramid Net,FPN）解码特征的过程,减少空洞金字塔池化网络（Atrous convolution Spatial Pyramid Pooling,ASPP）参数的数量,进而大幅度压缩了算法模型,提升了算法分割速度。此外,还对Focal Loss损失函数在多分类任务中难以选择超参数的问题做出改进,并用于提升算法分割精度。在Cityscapes和Pascal VOC2012数据集上的实验结果表明改进后的算法可达到实时分割速度且具有分割精度高的优点,同时还表明提出的超参数选择方法可进一步提升算法分割精度。相似文献

6.

基于改进深度神经网络的遥感影像语义分割

陈天华郑司群林宇骁《计算机仿真》2021,38(12):27-32

研究了基于深度学习的遥感图像语义分割问题,将建筑物作为遥感图像中的待分割目标,采用语义分割算法将建筑物提取出来.提出了一种改进的U-net网络,根据分割实际需求,保持网络对目标提取特征能力的前提下,将原U-net网络的卷积核数量适当减少,降低了网络参数数量和计算复杂度;增加了Batch Normalization层抑制过拟合问题;在上采样部分增加特征图的局部信息以优化网络对于细节的分割效果.使用公开的数据集INRIA Aerial Image Dataset来评估改进的U-net网络的实际效果,和原U-net相比,单张图片训练速度提升了8％,分割精度也明显提升,训练中的过拟合情况得到改善.证明了本文改进的U-net网络具有对遥感图像的语义分割任务的有效性和可行性. 相似文献

7.

多尺度信息融合的遥感图像语义分割模型

张静靳淇兆王洪振达铖向世明潘春洪《计算机辅助设计与图形学学报》2019,31(9):1509-1517

遥感图像分割是目前学术界和工业界的一个研究热点,在城市规划、变化检测以及GIS信息构建等方面有着十分广泛的应用.然而,诸多复杂因素(如多变的尺度、多样化的拓扑形状以及复杂的背景和阴影等)使得遥感图像语义分割成为一项具有挑战性的任务.为此,提出一种基于多尺度信息融合的遥感图像语义分割深层卷积神经网络模型,该模型分为编码器和解码器2部分.在编码阶段,设计了基于DenseNet网络的跨卷积层级的多尺度特征融合策略,采用子区域全局平均池化及多尺度卷积处理复杂的背景区域;在解码阶段,为了准确地恢复图像的细节信息,设计了能够融合不同层级卷积特征的短解码器;最后,在整体模型构建方面设计了一种具有多输出的分层监督机制网络模型,从不同层级获取监督信息,可在充分利用监督信息的同时更好地引导网络的训练.在ISPRS公开数据集以及北京市遥感数据集上,通过实验验证了文中模型的有效性. 相似文献

8.

改进Xception模型的乳腺钼靶图像识别研究

李锦通安建成王悦曹锐《计算机测量与控制》2022,30(8):189-196

乳腺X线摄影技术是早期发现乳腺癌的主要方法,但其结果很大程度上受放射科医师临床诊断经验的限制;基于卷积神经网络对乳腺钼靶图像自动分类的研究可以为放射科医师临床诊断提供意见,然而乳腺癌肿块边缘模糊且良恶性肿块特征差异较小,分类任务面临重重挑战;为了提高乳腺钼靶图像分类的准确率,提出一种基于Xception模型的改进优化算法,改进模型中的残差连接模块,并嵌入Squeeze-and-excitation（SE）注意力机制对模型进行优化;采用优化后的Xception模型并结合迁移学习算法进行乳腺钼靶图像特征提取,并优化全连接层网络进行图像分类,使用公开的乳腺癌图像数据库CBIS-DDSM进行实验,将乳腺钼靶图像自动分为良性和恶性;实验结果表明该方法可以有效提高模型的分类效果,准确率和AUC分别达到了97.46%和99.12%。相似文献

9.

改进Inception-v3网络的手势图像识别

下载免费PDF全文

邓志军田秋红《计算机系统应用》2022,31(11):157-166

鉴于Inception-v3网络参数量过大的问题,本文提出了一种有效的手势图像识别方法,能够满足在模型参数量较少的情况下高精度手势识别的需求.本文利用Inception-v3的结构,对原Inception-v3的Inception模块重新进行设计,降低学习的参数量和难度,结合残差连接,保护信息的完整性,防止网络退化,引入注意力机制模块,让模型聚焦于有用的信息而淡化无用信息,在一定程度上也防止了模型的过拟合,并且在模型中进行上采样与低层特征进行特征融合,融合后的特征比原输入特征更具有判别能力,进一步提高模型的准确率.实验结果表明改进的Inception-v3网络的参数量仅为1.65 M,而且拥有更高的准确率和更快的收敛速度.将ASL手语数据集与孟加拉手语数据集分别打乱,然后按照4:1的比例单独划分出训练集和验证集.改进的Inception-v3在ASL手语数据集与孟加拉手语数据集上的识别率分别达到了100%和95.33%. 相似文献

10.

图像语义分割方法在高分辨率遥感影像解译中的研究综述

马妍古丽米拉·克孜尔别克《计算机科学与探索》2023,(7):1526-1548

快速获取遥感信息对图像语义分割方法在遥感影像解译应用发展具有重要的研究意义。随着卫星遥感影像记录的数据种类越来越多,特征信息越来越复杂,精确有效地提取遥感影像中的信息,成为图像语义分割方法解译遥感图像的关键。为了探索快速高效解译遥感影像的图像语义分割方法,对大量关于遥感影像的图像语义分割方法进行了总结。首先,综述了传统的图像语义分割方法,并将其划分为基于边缘检测的分割方法、基于区域的分割方法、基于阈值的分割方法和结合特定理论的分割方法,同时分析了传统图像语义分割方法的局限性。其次,详细阐述了基于深度学习的语义分割方法,并以每种方法的基本思想和技术特点作为划分标准,将其分为基于FCN的方法、基于编解码器的方法、基于空洞卷积的方法和基于注意力机制的方法四类,概述了每类方法中包含的子方法,并对比分析了这些方法的优缺点。然后,简单介绍了遥感图像语义分割常用数据集和性能评价指标,给出了经典网络模型在不同数据集上的实验结果,同时对不同模型的性能进行了评估。最后,分析了图像语义分割方法在高分辨率遥感图像解译上面临的挑战,并对未来的发展趋势进行了展望。相似文献

11.

分级特征融合的图像语义分割

赵小强徐慧萍《计算机科学与探索》2021,15(5):949-957

在图像语义分割中,利用卷积神经网络对图像信息进行特征提取时,针对卷积神经网络没有有效利用各层级间的特征信息而导致图像语义分割精度受损的问题,提出分级特征融合的图像语义分割方法.该方法利用卷积结构分级提取含有像素级的浅层低级特征和含有图像级的深层语义特征,进一步挖掘不同层级间的特征信息,充分获取浅层低级特征和深层语义特征... 相似文献

12.

深度特征融合方法及其在叶片病害识别中的应用

下载免费PDF全文

李昊王斌《计算机系统应用》2022,31(7):349-355

农作物叶片病害的自动识别是计算机视觉技术在农业领域的一个重要应用. 近年来, 深度学习在农作物叶片病害识别上取得了一些进展, 但这些方法都是采用基于单一深度卷积神经网络模型的深度特征表示. 而不同的深度卷积神经网络模型对图像的表征能力的互补性这一有用的特性, 还没有得到关注和研究. 本文提出一种用于融合不同深度特征的网络模型MDFF-Net. MDFF-Net将两个预训练的深度卷积神经网络模型进行并联, 再为各个模型分别设置一个具有相同神经元个数的全连接层, 以将不同模型输出的深度特征变换成相同维度的特征, 再通过2个全连接层的非线性变换, 进一步提升特征融合的效果. 我们选取VGG-16和ResNet-50作为MDFF-Net网络的并联骨干网络, 在一个包含5种苹果叶片病害的公开数据集上进行实验. 实验结果显示, MDFF-Net网络的识别精度为96.59%, 取得了比VGG-16和ResNet-50单一网络更好的识别效果, 证明了该深度特征融合方法的有效性. 相似文献

13.

基于CNN与Transformer的医学图像分割

下载免费PDF全文

王金祥付立军尹鹏滨李旭《计算机系统应用》2023,32(4):141-148

医学图像对疾病的诊断、治疗和评估均有所帮助,准确分割医学图像中的器官对于辅助医生的诊断具有重要的实际意义.由于医学图像中各器官部位与周围组织的图像对比度低,不同器官的边缘和形状也会存在很大差异,从而增加了分割的难度.针对这些问题,本文提出了一种基于卷积神经网络和Transformer的医学图像语义分割网络,有效提高了医学图像语义分割的精度.特征提取部分使用ResNet-50网络结构,在特征提取后使用Transformer模块来扩大感受野.在上采样过程中加入多个跳跃连接层,充分利用各阶段的特征提取信息,来恢复至与输入图像相近的分辨率.在胃肠道医学图像分割数据集上的实验结果证明本文的方法可以有效分割医学图像中的器官组织,提升分割准确率. 相似文献

14.

多级特征交互Transformer的多器官图像分割

下载免费PDF全文

武书磊张方红杨有刘学文《计算机系统应用》2024,33(6):232-241

多器官医学图像分割有助于医生做出临床诊断.针对CNN提取全局特征能力弱, Transformer提取局部特征能力弱,以及Transformer具有二次方计算复杂度的问题,提出了用于多器官医学图像分割的多级特征交互Transformer模型.所提模型采用CNN提取局部特征,局部特征经Swin Transformer输出全局特征;通过下采样分别产生多级局部和全局特征,每级局部和全局特征经过交互并增强;每级增强后的特征经多级特征融合模块进行交叉融合;再次融合后的特征经过上采样和分割头输出分割掩码.所提模型在Synapse和ACDC数据集上进行实验,平均DSC和平均HD95系数值为80.16%和19.20 mm,均优于LGNet和RFE-UNet等代表性模型.该模型对多器官医学图像分割是有效的. 相似文献

15.

注意力引导网络的显著性目标检测

下载免费PDF全文

何伟潘晨《中国图象图形学报》2022,27(4):1176-1190

目的全卷积模型的显著性目标检测大多通过不同层次特征的聚合实现检测,如何更好地提取和聚合特征是一个研究难点。常用的多层次特征融合策略有加法和级联法,但是这些方法忽略了不同卷积层的感受野大小以及产生的特征图对最后显著图的贡献差异等问题。为此,本文结合通道注意力机制和空间注意力机制有选择地逐步聚合深层和浅层的特征信息,更好地处理不同层次特征的传递和聚合,提出了新的显著性检测模型AGNet(attention-guided network),综合利用几种注意力机制对不同特征信息加权解决上述问题。方法该网络主要由特征提取模块(feature extraction module, FEM)、通道—空间注意力融合模块(channel-spatial attention aggregation module, C-SAAM)和注意力残差细化模块(attention residual refinement module,ARRM)组成,并且通过最小化像素位置感知(pixel position aware, PPA)损失训练网络。其中,C-SAAM旨在有选择地聚合浅层的边缘信息以及深层抽象的语义特征,利用通道注意力和空间注意力避免融合冗余的背景信息对显著性映射造成影响;ARRM进一步细化融合后的输出,并增强下一个阶段的输入。结果在5个公开数据集上的实验表明,AGNet在多个评价指标上达到最优性能。尤其在DUT-OMRON(Dalian University of Technology-OMRON)数据集上,F-measure指标相比于排名第2的显著性检测模型提高了1.9%,MAE(mean absolute error)指标降低了1.9%。同时,网络具有不错的速度表现,达到实时效果。结论本文提出的显著性检测模型能够准确地分割出显著目标区域,并提供清晰的局部细节。相似文献

16.

基于多尺度融合CNN的图像超分辨率重建

下载免费PDF全文

祝旭阳于俊洋郝艳艳《计算机系统应用》2022,31(7):217-223

针对FSRCNN模型中存在的特征提取不充分和反卷积带来的人工冗余信息的问题, 本文提出了一种基于多尺度融合卷积神经网络的图像超分辨率重建算法. 首先设计了一种多尺度融合的特征提取通道, 解决对图像不同尺寸信息利用不充分问题; 其次在图像重建部分, 采用子像素卷积进行上采样, 抑制反卷积层带来的人工冗余信息. 与FSRCNN模型相比, 在Set5和Set14数据集中, 2倍放大因子下的PSNR值和SSIM值平均提高了0.14 dB、0.001 0, 在3倍放大因子下平均提高0.48 dB、0.009 1. 实验结果表明, 本文算法可以更大程度的保留图像纹理细节, 提升图像整体重建效果. 相似文献

17.

基于分组卷积与双注意力机制的河流水面污染图像分类

下载免费PDF全文

宋一格王宁李宏昌武暕《计算机系统应用》2022,31(9):250-256

河流水面污染物是危害河流资源的重要污染物,及时发现并处理水面污染物可以有效地保护河流环境以及水资源,能进一步实现减污降碳,提升生态系统碳汇能力.随着智能化的大范围推广,传统的河流水面污染物的监测处理方法已经不能满足当今的需求.针对辽河流域水面污染问题,本文将计算机视觉技术应用到了河流水面污染分类上,提出了基于分组卷积与双注意力机制的河流水面污染图像分类算法模块(grouped convolution dual attention,GCDA),在分组卷积的基础上引入简化的双注意力机制,使用较少的参数量增强了网络对图像的特征提取能力,进一步提升图像分类效果.通过固定位截取图像的方式对辽河流域中的温泉城水站取水口、王营河入细河、高台子断面、津源污水排口和清源污水处理厂溢流口5个河流监控摄像图像做了预处理工作并建立了一个河流水面污染物数据集,图像分为污染和未污染两类,通过实验证明在此数据集上,添加使用GCDA模块的网络相较于原网络以及分别添加空间、通道注意力机制的网络在河流水面污染物图像的二分类任务中效果有明显提升. 相似文献

18.

基于注意力感知和语义感知的RGB-D室内图像语义分割算法 总被引：1，自引：0，他引：1

段立娟孙启超乔元华陈军成崔国勤《计算机学报》2021,44(2):275-291

近年来,全卷积神经网络有效提升了语义分割任务的准确率.然而,由于室内环境的复杂性,室内场景语义分割仍然是一个具有挑战性的问题.随着深度传感器的出现,人们开始考虑利用深度信息提升语义分割效果.以往的研究大多简单地使用等权值的拼接或求和操作来融合RGB特征和深度特征,未能充分利用RGB特征与深度特征之间的互补信息.本文提出... 相似文献

19.

基于Transformer的跨尺度交互学习伪装目标检测

下载免费PDF全文

李建东王岩曲海成《计算机系统应用》2024,33(2):115-124

伪装目标检测(COD)旨在精确且高效地检测出与背景高度相似的伪装物体,其方法可为物种保护、医学病患检测和军事监测等领域提供助力,具有较高的实用价值.近年来,采用深度学习方法进行伪装目标检测成为一个比较新兴的研究方向.但现有大多数COD算法都是以卷积神经网络(CNN)作为特征提取网络,并且在结合多层次特征时,忽略了特征表示和融合方法对检测性能的影响.针对基于卷积神经网络的伪装目标检测模型对被检测目标的全局特征提取能力较弱问题,提出一种基于Transformer的跨尺度交互学习伪装目标检测方法.该模型首先提出了双分支特征融合模块,将经过迭代注意力的特征进行融合,更好地融合高低层特征;其次引入了多尺度全局上下文信息模块,充分联系上下文信息增强特征;最后提出了多通道池化模块,能够聚焦被检测物体的局部信息,提高伪装目标检测准确率.在CHAMELEON、CAMO以及COD10K数据集上的实验结果表明,与当前主流的伪装物体检测算法相比较,该方法生成的预测图更加清晰,伪装目标检测模型能取得更高精度. 相似文献

20.

深度迭代融合的脑部磁共振图像颅骨去除网络

下载免费PDF全文

姚发展李智王丽会程欣宇张健《中国图象图形学报》2020,25(10):2171-2181

目的去除颅骨是脑部磁共振图像处理和分析中的重要环节。由于脑部组织结构复杂以及采集设备噪声的影响导致现有方法不能准确分割出脑部区域,为此提出一种深度迭代融合的卷积神经网络模型实现颅骨的准确去除。方法本文DIFNet（deep iteration fusion net）模型的主体结构由编码器和解码器组成,中间的跳跃连接方式由多个上采样迭代融合构成。其中编码器由残差卷积组成,以便浅层语义信息更容易流入深层网络,避免出现梯度消失的现象。解码器网络由双路上采样模块构成,通过具有不同感受野的反卷积操作,将输出的特征图相加后作为模块输出,有效还原更多细节上的特征。引入带有L2正则的Dice损失函数训练网络模型,同时采用内部数据增强方法,有效提高模型的鲁棒性和泛化能力。结果为了验证本文模型的分割性能,分别利用两组数据集与传统分割算法和主流的深度学习分割模型进行对比。在训练数据集同源的NFBS（neurofeedback skull-stripped）测试数据集上,本文方法获得了最高的平均Dice值和灵敏度,分别为99.12%和99.22%。将在NFBS数据集上训练好的模型直接应用于LPBA40（loni probabilistic brain atlas 40）数据集,本文模型的Dice值可达98.16%。结论本文提出的DIFNet模型可以快速、准确地去除颅骨,相比于主流的颅骨分割模型,精度有较高提升,并且模型具有较好的鲁棒性和泛化能力。相似文献