期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

首页 | 本学科首页

官方微博 | 高级检索

相似文献

共查询到20条相似文献，搜索用时 218 毫秒

1.

有限色彩空间下的线稿上色

下载免费PDF全文

陈缘赵洋张效娟刘晓平《中国图象图形学报》2024,29(4):978-988

目的线稿上色是由线条构成的黑白线稿草图涂上颜色变为彩色图像的过程,在卡通动画制作和艺术绘画等领域中是非常关键的步骤。全自动线稿上色方法可以减轻绘制过程中烦琐耗时的手工上色的工作量,然而自动理解线稿中的稀疏线条并选取合适的颜色仍较为困难。方法依据现实场景中特定绘画类型常有固定用色风格偏好这一先验,本文聚焦于有限色彩空间下的线稿自动上色,通过约束色彩空间,不仅可以降低语义理解的难度,还可以避免不合理的用色。具体地,本文提出一种两阶段线稿自动上色方法。在第1阶段,设计一个灰度图生成器,对输入的稀疏线稿补充线条和细节,以生成稠密像素的灰度图像。在第2阶段,首先设计色彩推理模块,从输入的颜色先验中推理得到适合该线稿的色彩子空间,再提出一种多尺度的渐进融合颜色信息的生成网络以逐步生成高质量的彩色图像。结果实验在3个数据集上与4种线稿自动上色方法进行对比,在上色结果的客观质量对比中,所提方法取得了更高的峰值信噪比（peak signal to noise ratio,PSNR）和结构相似性（structural similarity index measure,SSIM）值以及更低的均方误差;在上色结果的色彩指标对比中,所提方法取得了最高的色彩丰富度分数;在主观评价和用户调查中,所提方法也取得了与人的主观审美感受更一致的结果。此外,消融实验结果也表明了本文所使用的模型结构及色彩空间限制有益于上色性能的提升。结论实验结果表明,本文提出的有限色彩空间下的线稿自动上色方法可以有效地完成多类线稿的自动上色,并且可以简单地通过调整颜色先验以获得更多样的彩色图像。相似文献

2.

对抗型半监督光伏面板故障检测

下载免费PDF全文

卢芳芳牛然杜海舟杨振辰陈菁菁《中国图象图形学报》2022,27(10):3031-3042

目的传统的光伏面板故障检测主要依靠人工巡检,效率低下且误检率很高,而流行的基于机器视觉的智能检测方法又面临缺少大量负样例造成故障检测模型准确性偏低的问题。针对上述问题,本文提出一种基于对抗训练的半监督异常检测模型,通过应用梯度中心化（gradient centralization,GC）和Smooth L1损失函数,使模型具有更好的准确性和鲁棒性。方法通过构建半监督异常检测模型并定义目标函数,将正常的光伏面板图像作为正样例原图输入半监督异常检测模型进行模型训练。然后将待测光伏面板图像输入到训练好的半监督异常检测模型,生成该待测图像对应的重建图像。最后通过计算待测原图像与其重建图像隐空间向量之间的误差来判断该待测光伏面板是否存在异常。结果本文以浙江某光伏电站采集的光伏面板为实验对象,将本文方法与Pre-trained VGG16（Visual Geometry Group 16-layer network）、AnoGAN （anomaly generative adversarial network）、GANomaly等方法进行比较,AUC （area under curve）分别提高了0.12、0.052和0.033。结论实验结果证明,本文提出的基于生成对抗网络的半监督异常检测模型大幅提高了光伏面板故障检测的准确率。相似文献

3.

含多级通道注意力机制的CGAN遥感图像建筑物分割

下载免费PDF全文

余帅汪西莉《中国图象图形学报》2021,26(3):686-699

目的遥感图像建筑物分割是图像处理中的一项重要应用,卷积神经网络在遥感图像建筑物分割中展现出优秀性能,但仍存在建筑物漏分、错分,尤其是小建筑物漏分以及建筑物边缘不平滑等问题。针对上述问题,本文提出一种含多级通道注意力机制的条件生成对抗网络（conditional generative adversarial network,CGAN）模型Ra-CGAN,用于分割遥感图像建筑物。方法首先构建一个具有多级通道注意力机制的生成模型G,通过融合包含注意力机制的深层语义与浅层细节信息,使网络提取丰富的上下文信息,更好地应对建筑物的尺度变化,改善小建筑物漏分问题。其次,构建一个判别网络D,通过矫正真实标签图与生成模型生成的分割图之间的差异来改善分割结果。最后,通过带有条件约束的G和D之间的对抗训练,学习高阶数据分布特征,使建筑物空间连续性更强,提升分割结果的边界准确性及平滑性。结果在WHU Building Dataset和Satellite Dataset II数据集上进行实验,并与优秀方法对比。在WHU数据集中,分割性能相对于未加入通道注意力机制和对抗训练的模型明显提高,且在复杂建筑物的空间连续性、小建筑物完整性以及建筑物边缘准确和平滑性上表现更好;相比性能第2的模型,交并比（intersection over union,IOU）值提高了1.1%,F₁-score提高了1.1%。在Satellite数据集中,相比其他模型,准确率更高,尤其是在数据样本不充足的条件下,得益于生成对抗训练,分割效果得到了大幅提升;相比性能第2的模型,IOU值提高了1.7%,F₁-score提高了1.6%。结论本文提出的含多级通道注意力机制的CGAN遥感图像建筑物分割模型,综合了多级通道注意力机制生成模型与条件生成对抗网络的优点,在不同数据集上均获得了更精确的遥感图像建筑物分割结果。相似文献

4.

结合GAN的轻量级模糊车牌识别算法

下载免费PDF全文

段宾符祥江毅曾接贤《中国图象图形学报》2020,25(9):1813-1824

目的模糊车牌识别是车牌识别领域的难题,针对模糊车牌图像收集困难、车牌识别算法模型太大、不适用于移动或嵌入式设备等不足,本文提出了一种轻量级的模糊车牌识别方法,使用深度卷积生成对抗网络生成模糊车牌图像,用于解决现实场景中模糊车牌难以收集的问题,在提升算法识别准确性的同时提升了部署泛化能力。方法该算法主要包含两部分,即基于优化卷积生成对抗网络的模糊车牌图像生成和基于深度可分离卷积网络与双向长短时记忆（long short-term memory,LSTM）的轻量级车牌识别。首先,使用Wasserstein距离优化卷积生成对抗网络的损失函数,提高生成车牌图像的多样性和稳定性;其次,在卷积循环神经网络的基础上,结合深度可分离卷积设计了一个轻量级的车牌识别模型,深度可分离卷积网络在减少识别算法计算量的同时,能对训练样本进行有效的特征学习,将特征图转换为特征序列后输入到双向LSTM网络中,进行序列学习与标注。结果实验表明,增加生成对抗网络生成的车牌图像,能有效提高本文算法、传统车牌识别和基于深度学习的车牌识别方法的识别率,为进一步提高各类算法的识别率提供了一种可行方案。结合深度可分离卷积的轻量级车牌识别模型,识别率与基于标准循环卷积神经网络（convolutional recurrent neural network,CRNN）的车牌识别方法经本文生成图像提高后的识别率相当,但在模型的大小和识别速度上都优于标准的CRNN模型,本文算法的模型大小为45 MB,识别速度为12.5帧/s,标准CRNN模型大小是82 MB,识别速度只有7帧/s。结论使用生成对抗网络生成图像,可有效解决模糊车牌图像样本不足的问题;结合深度可分离卷积的轻量级车牌识别模型,具有良好的识别准确性和较好的部署泛化能力。相似文献

5.

结合门循环单元和生成对抗网络的图像文字去除

下载免费PDF全文

王超群全卫泽侯诗玉张晓鹏严冬明《中国图象图形学报》2022,27(4):1264-1276

目的图像文本信息在日常生活中无处不在,其在传递信息的同时,也带来了信息泄露问题,而图像文字去除算法很好地解决了这个问题,但存在文字去除不干净以及文字去除后的区域填充结果视觉感受不佳等问题。为此,本文提出了一种基于门循环单元(gate recurrent unit,GRU)的图像文字去除模型,可以高质量和高效地去除图像中的文字。方法通过由门循环单元组成的笔画级二值掩膜检测模块精确地获得输入图像的笔画级二值掩膜;将得到的笔画级二值掩膜作为辅助信息,输入到基于生成对抗网络的文字去除模块中进行文字的去除和背景颜色的回填,并使用本文提出的文字损失函数和亮度损失函数提升文字去除的效果,以实现对文字高质量去除,同时使用逆残差块代替普通卷积,以实现高效率的文字去除。结果在1 080组通过人工处理得到的真实数据集和使用文字合成方法合成的1 000组合成数据集上,与其他3种文字去除方法进行了对比实验,实验结果表明,在峰值信噪比和结构相似性等图像质量指标以及视觉效果上,本文方法均取得了更好的性能。结论本文提出的基于门循环单元的图像文字去除模型,与对比方法相比,不仅能够有效解决图像文字去除不干净以及文字去除后的区域与背景不一致问题,并能有效地减少模型的参数量和计算量,最终整体计算量降低了72.0%。相似文献

6.

CGAN样本生成的遥感图像飞机识别

下载免费PDF全文

王耀领王宏琦许滔《中国图象图形学报》2021,26(3):663-673

目的基于深度学习的飞机目标识别方法在遥感图像解译领域取得了很大进步,但其泛化能力依赖于大规模数据集。条件生成对抗网络（conditional generative adversarial network,CGAN）可用于产生逼真的生成样本以扩充真实数据集,但对复杂遥感场景的建模能力有限,生成样本质量低。针对这些问题,提出了一种结合CGAN样本生成的飞机识别框架。方法改进条件生成对抗网络,利用感知损失提高生成器对遥感图像的建模能力,提出了基于掩膜的结构相似性（structural similarity,SSIM）度量损失函数（masked-SSIM loss）以提高生成样本中飞机区域的图像质量,该损失函数与飞机的掩膜相结合以保证只作用于图像中的飞机区域而不影响背景区域。选取一个基于残差网络的识别模型,与改进后的生成模型结合,构成飞机识别框架,训练过程中利用生成样本代替真实的卫星图像,降低了对实际卫星数据规模的需求。结果采用生成样本与真实样本训练的识别模型在真实样本上的进行实验,前者的准确率比后者低0.33%;对于生成模型,在加入感知损失后,生成样本的峰值信噪比（peak signal to noise ratio,PSNR）提高了0.79 dB,SSIM提高了0.094;在加入基于掩膜的结构相似性度量损失函数后,生成样本的PSNR提高了0.09 dB,SSIM提高了0.252。结论本文提出的基于样本生成的飞机识别框架生成了质量更高的样本,这些样本可以替代真实样本对识别模型进行训练,有效地解决了飞机识别任务中的样本不足问题。相似文献

7.

条件生成对抗网络的低照度图像增强方法

下载免费PDF全文

黄鐄陶海军王海峰《中国图象图形学报》2019,24(12):2149-2158

目的在日常的图像采集工作中,由于场景光照条件差或设备的补光能力不足,容易产生低照度图像。为了解决低照度图像视觉感受差、信噪比低和使用价值低（难以分辨图像内容）等问题,本文提出一种基于条件生成对抗网络的低照度图像增强方法。方法本文设计一个具备编解码功能的卷积神经网络（CNN）模型作为生成模型,同时加入具备二分类功能的CNN作为判别模型,组成生成对抗网络。在模型训练的过程中,以真实的亮图像为条件,依靠判别模型监督生成模型以及结合判别模型与生成模型间的相互博弈,使得本文网络模型具备更好的低照度图像增强能力。在本文方法使用过程中,无需人工调节参数,图像输入模型后端到端处理并输出结果。结果将本文方法与现有方法进行比较,利用本文方法增强的图像在亮度、清晰度以及颜色还原度等方面有了较大的提升。在峰值信噪比、直方图相似度和结构相似性等图像质量评价指标方面,本文方法比其他方法的最优值分别提高了0.7 dB、3.9%和8.2%。在处理时间上,本文方法处理图像的速度远远超过现有的传统方法,可达到实时增强的要求。结论通过实验比较了本文方法与现有方法对于低照度图像的处理效果,表明本文方法具有更优的处理效果,同时具有更快的处理速度。相似文献

8.

场景线稿动漫效果的自动上色算法

朱松陈昭炯叶东毅《模式识别与人工智能》2020,33(8):671-680

场景线稿具有线条语义多样化的特点,直接应用现有的人像线稿图自动上色算法对其着色容易出现上色错误或棋盘效应等结果失真的现象.针对上述问题,文中提出动漫效果自动上色算法.基于条件生成对抗网络,改进和增强人像线稿图自动上色算法中常用的U型网络(U-Net)生成器的结构,设计双层信息抽取的生成器网络(DIEU-Net),自动完成场景线稿到动漫效果的上色.DIEU-Net设计用于抽取场景线稿浅层显著信息的双卷积子模块(IESS).构建双层IESS与残差结构的集成模块,插入生成器的不同阶段,增强网络在与线稿关联的颜色、位置等重要特征上的全域学习能力,缓和网络加深带来的梯度消失等网络退化问题.同时采用"卷积+上采样"操作替换U-Net生成器中原有的反卷积操作,抑制生成结果中棋盘效应的发生.实验表明,文中算法能较好地克服结果失真的问题,上色效果合理、自然,具有较好的应用推广性,可应用于多种类型景物线稿图的动漫上色. 相似文献

9.

密集连接卷积网络图像去模糊

下载免费PDF全文

吴迪赵洪田郑世宝《中国图象图形学报》2020,25(5):890-899

目的非均匀盲去运动模糊是图像处理和计算机视觉中的基础课题之一。传统去模糊算法有处理模糊种类单一、耗费时间两大缺点,且一直未能有效解决。随着神经网络在图像生成领域的出色表现,本文把去运动模糊视为图像生成的一种特殊问题,提出一种基于神经网络的快速去模糊方法。方法首先,将图像分类方向表现优异的密集连接卷积网络（dense connected convolutional network, DenseNets）应用到去模糊领域,该网络能充分利用中间层的有用信息。在损失函数方面,采用更符合去模糊目的的感知损失（perceptual loss）,保证生成图像和清晰图像在内容上的一致性。采用生成对抗网络（generative adversarial network,GAN）,使生成的图像在感官上与清晰图像更加接近。结果通过测试生成图像相对于清晰图像的峰值信噪比（peak signal to noise ratio,PSNR）,结构相似性（structural similarity,SSIM）和复原时间来评价算法性能的优劣。相比DeblurGAN（blind motion deblurring using conditional adversarial networks）,本文算法在GOPRO测试集上的平均PSNR提高了0.91,复原时间缩短了0.32 s,能成功恢复出因运动模糊而丢失的细节信息。在Kohler数据集上的性能也优于当前主流算法,能够处理不同的模糊核,鲁棒性强。结论本文算法网络结构简单,复原效果好,生成图像的速度也明显快于其他方法。同时,该算法鲁棒性强,适合处理各种因运动模糊而导致的图像退化问题。相似文献

10.

条件生成对抗遥感图像时空融合

下载免费PDF全文

李昌洁宋慧慧张开华张晓露刘青山《中国图象图形学报》2021,26(3):714-726

目的卫星遥感技术在硬件方面的局限导致获取的遥感图像在时间与空间分辨率之间存在矛盾,而时空融合提供了一种高效、低成本的方式来融合具有时空互补性的两类遥感图像数据（典型代表是Landsat和MODIS （moderate-resolution imaging spectroradiometer）图像）,生成同时具有高时空分辨率的融合数据,解决该问题。方法提出了一种基于条件生成对抗网络的时空融合方法,可高效处理实际应用中的大量遥感数据。与现有的学习模型相比,该模型具有以下优点：1）通过学习一个非线性映射关系来显式地关联MODIS图像和Landsat图像;2）自动学习有效的图像特征;3）将特征提取、非线性映射和图像重建统一到一个框架下进行优化。在训练阶段,使用条件生成对抗网络建立降采样Landsat和MODIS图像之间的非线性映射,然后在原始Landsat和降采样Landsat之间训练多尺度超分条件生成对抗网络。预测过程包含两层：每层均包括基于条件生成对抗网络的预测和融合模型。分别实现从MODIS到降采样Landsat数据之间的非线性映射以及降采样Landsat与原始Landsat之间的超分辨率首建。结果在基准数据集CIA （coleam bally irrigation area）和LGC （lower Gwydir catchment）上的结果表明,条件生成对抗网络的方法在4种评测指标上均达到领先结果,例如在CIA数据集上,RMSE （root mean squared error）、SAM （spectral angle mapper）、SSIM （structural similarity）和ERGAS （erreur relative global adimensionnelle desynthese）分别平均提高了0.001、0.15、0.008和0.065;在LGC数据集上分别平均提高了0.001 2、0.7、0.018和0.008 9。明显优于现有基于稀疏表示的方法与基于卷积神经网络的方法。结论本文提出的条件生成对抗融合模型,能够充分学习Landsat和MODIS图像之间复杂的非线性映射,产生更加准确的融合结果。相似文献

11.

粉笔画艺术风格模拟

下载免费PDF全文

钱文华徐丹官铮普园媛喻扬涛杨萌《中国图象图形学报》2017,22(5):622-630

目的对不同艺术风格的模拟和绘制是非真实感绘制技术的主要任务之一,目前非真实感绘制技术已对油画、水彩画、中国书法等国内外艺术风格进行了模拟,然而对粉笔化艺术风格的模拟方法并不多见。本文提出了一种基于滤波扩散和线积分卷积（LIC）的粉笔画艺术风格绘制技术。方法首先输入2维目标图像,通过对目标图像二值化处理、边缘提取操作,获得连续、光滑的边缘信息,并采用滤波扩散技术对边缘图像进行扩散处理,模拟粉笔画中笔划的毛糙效果,同时通过采用图像增强方法增强了笔划的细节信息;其次,由于真实粉笔画在创作时,粉笔颜料黏附在图像局部区域,形成具有方向的笔刷纹理效果,算法通过在目标图像中添加白噪声,基于线积分卷积LIC产生具有方向的粉笔画笔刷纹理,并通过形态学膨胀处理获得粉笔画的笔划纹理,模拟出粉笔画中笔划的笔触特征。再次,真实的粉笔画艺术效果往往在黑板、木材等材质中创作,算法将产生的笔刷纹理图像、色彩信息以及边缘图像通过图层映射方法,映射到黑板材质等输入背景图像中,产生最终的粉笔画艺术效果图像。结果通过对输入2维图像进行实验,模拟出具有粉笔画艺术效果的结果图像,突出了粉笔画的线条细节信息和笔划艺术特征。结论提出了一种粉笔画艺术效果模拟算法,非真实感绘制领域的有效补充,算法简单有效,能模拟出真实的粉笔画艺术效果,增强了艺术表现力。相似文献

12.

多尺度双通道卷积神经网络下的刺绣模拟

下载免费PDF全文

李宗彦钱文华徐丹普园媛《中国图象图形学报》2020,25(2):343-353

目的针对现有刺绣模拟算法中针线感不强、针线轨迹方向单一等问题,提出了一种基于多尺度双通道卷积神经网络的刺绣模拟算法。方法 1）搭建多尺度双通道网络,选取一幅刺绣艺术作品作为风格图像,将MSCOCO（microsoft common objects in context）数据集作为训练集,输入网络得到VGG（visual geometry group）网络损失和拉普拉斯损失;2）将总损失值传回到网络,通过梯度下降法更新网络参数,并且重复更新参数直到指定的训练次数完成网络训练;3）选取一幅目标图像作为刺绣模拟的内容图像,输入训练完成的网络,获得具有刺绣艺术风格的结果图像;4）使用掩模图像将得到的结果图像与绣布图像进行图像融合,即完成目标图像的刺绣模拟。结果本文算法能产生明显的针线感和多方向的针线轨迹,增强了刺绣模拟绘制艺术作品的表现力。结论本文将输入图像经过多尺度双通道卷积神经网络进行前向传播,并使用VGG19、VGG16和拉普拉斯模块作为损失网络进行刺绣模拟。实验结果表明,与现有卷积神经网络风格模拟算法对比,本文提出的网络能够学习到刺绣艺术风格图像的针线特征,得到的图像贴近真实刺绣艺术作品。相似文献

13.

多尺度密集残差网络的单幅图像超分辨率重建

下载免费PDF全文

应自炉龙祥《中国图象图形学报》2019,24(3):410-419

目的近几年应用在单幅图像超分辨率重建上的深度学习算法都是使用单种尺度的卷积核提取低分辨率图像的特征信息,这样很容易造成细节信息的遗漏。另外,为了获得更好的图像超分辨率重建效果,网络模型也不断被加深,伴随而来的梯度消失问题会使得训练时间延长,难度加大。针对当前存在的超分辨率重建中的问题,本文结合GoogleNet思想、残差网络思想和密集型卷积网络思想,提出一种多尺度密集残差网络模型。方法本文使用3种不同尺度卷积核对输入的低分辨率图像进行卷积处理,采集不同卷积核下的底层特征,这样可以较多地提取低分辨率图像中的细节信息,有利于图像恢复。再将采集的特征信息输入残差块中,每个残差块都包含了多个由卷积层和激活层构成的特征提取单元。另外,每个特征提取单元的输出都会通过短路径连接到下一个特征提取单元。短路径连接可以有效地缓解梯度消失现象,加强特征传播,促进特征再利用。接下来,融合3种卷积核提取的特征信息,经过降维处理后与3×3像素的卷积核提取的特征信息相加形成全局残差学习。最后经过重建层,得到清晰的高分辨率图像。整个训练过程中,一幅输入的低分辨率图像对应着一幅高分辨率图像标签,这种端到端的学习方法使得训练更加迅速。结果本文使用两个客观评价标准PSNR（peak signal-to-noise ratio）和SSIM（structural similarity index）对实验的效果图进行测试,并与其他主流的方法进行对比。最终的结果显示,本文算法在Set5等多个测试数据集中的表现相比于插值法和SRCNN算法,在放大3倍时效果提升约3.4 dB和1.1 dB,在放大4倍时提升约3.5 dB和1.4 dB。结论实验数据以及效果图证明本文算法能够较好地恢复低分辨率图像的边缘和纹理信息。相似文献

14.

RGB-D语义分割：深度信息的选择使用

下载免费PDF全文

赵经阳余昌黔桑农《中国图象图形学报》2022,27(8):2473-2486

目的在室内场景语义分割任务中,深度信息会在一定程度上提高分割精度。但是如何更有效地利用深度信息仍是一个开放性问题。当前方法大都引入全部深度信息,然而将全部深度信息和视觉特征组合在一起可能对模型产生干扰,原因是仅依靠视觉特征网络模型就能区分的不同物体,在引入深度信息后可能产生错误判断。此外,卷积核固有的几何结构限制了卷积神经网络的建模能力,可变形卷积(deformable convolution, DC)在一定程度上缓解了这个问题。但是可变形卷积中产生位置偏移的视觉特征空间深度信息相对不足,限制了进一步发展。基于上述问题,本文提出一种深度信息引导的特征提取(depth guided feature extraction, DFE)模块。方法深度信息引导的特征提取模块包括深度信息引导的特征选择模块(depth guided feature selection, DFS)和深度信息嵌入的可变形卷积模块(depth embedded deformable convolution, DDC)。DFS可以筛选出关键的深度信息,自适应地调整深度信息引入视觉特征的比例,在网络模型需要时将深度信息嵌... 相似文献

15.

基于边缘融合的多图像直线提取算法 总被引：2，自引：0，他引：2

佘二永王润生《计算机学报》2005,28(1):142-144,F003

该文提出了一种新的基于边缘融合的多图像直线提取算法，该算法首先对所有多图像分别提取边缘，然后通过将多图像对应的梯度方向相似的、相邻近的边缘编组，以形成融合的直线支持区域，最后基于最小二乘的方法从直线支持区域拟合出直线段，并提取直线属性．该文提出的算法把边缘的相位信息作为融合要素，能够从复杂的图像中提取出相当低对比度的直线，并且通过分析多图像边缘之间的特性，提出相位压缩和融合编组方案，不仅可以充分融合互补信息还有效降低了算法复杂度．真实的遥感图像直线提取结果表明了该文算法的有效性．相似文献

16.

双核压缩激活神经网络艺术图像分类

下载免费PDF全文

杨秀芹张华熊《中国图象图形学报》2020,25(5):967-976

目的为了充分提取版画、中国画、油画、水彩画和水粉画等艺术图像的整体风格和局部细节特征,实现计算机自动分类检索艺术图像的需求,提出通过双核压缩激活模块（double kernel squeeze-and-excitation,DKSE）和深度可分离卷积搭建卷积神经网络对艺术图像进行分类。方法根据SKNet（selective kernel networks）自适应调节感受野提取图像整体与细节特征的结构特点和SENet（squeeze-and-excitation networks）增强通道特征的特点构建DKSE模块,利用DKSE模块分支上的卷积核提取输入图像的整体特征与局部细节特征;将分支上的特征图进行特征融合,并对融合后的特征图进行特征压缩和激活处理;将处理后的特征加权映射到不同分支的特征图上并进行特征融合;通过DKSE模块与深度可分离卷积搭建卷积神经网络对艺术图像进行分类。结果使用本文网络模型对有无数据增强（5类艺术图像数据增强后共25 634幅）处理的数据分类,数据增强后的分类准确率比未增强处理的准确率高9.21%。将本文方法与其他网络模型和传统分类方法相比,本文方法的分类准确率达到86.55%,比传统分类方法高26.35%。当DKSE模块分支上的卷积核为1×1和5×5,且放在本文网络模型第3个深度可分离卷积后,分类准确率达到87.58%。结论 DKSE模块可以有效提高模型分类性能,充分提取艺术图像的整体与局部细节特征,比传统网络模型具有更好的分类准确率。相似文献

17.

多层次感知残差卷积网络的单幅图像超分重建

下载免费PDF全文

何蕾程佳豪占志钰杨雯博刘沛然《中国图象图形学报》2021,26(4):776-786

目的单幅图像超分辨率重建的深度学习算法中,大多数网络都采用了单一尺度的卷积核来提取特征（如3×3的卷积核）,往往忽略了不同卷积核尺寸带来的不同大小感受域的问题,而不同大小的感受域会使网络注意到不同程度的特征,因此只采用单一尺度的卷积核会使网络忽略了不同特征图之间的宏观联系。针对上述问题,本文提出了多层次感知残差卷积网络（multi-level perception residual convolutional network,MLP-Net,用于单幅图像超分辨率重建）。方法通过特征提取模块提取图像低频特征作为输入。输入部分由密集连接的多个多层次感知模块组成,其中多层次感知模块分为浅层多层次特征提取和深层多层次特征提取,以确保网络既能注意到图像的低级特征,又能注意到高级特征,同时也能保证特征之间的宏观联系。结果实验结果采用客观评价的峰值信噪比（peak signal to noise ratio,PSNR）和结构相似性（structural similarity,SSIM）两个指标,将本文算法其他超分辨率算法进行了对比。最终结果表明本文算法在4个基准测试集上（Set5、Set14、Urban100和BSD100（Berkeley Segmentation Dataset））放大2倍的平均峰值信噪比分别为37.851 1 dB,33.933 8 dB,32.219 1 dB,32.148 9 dB,均高于其他几种算法的结果。结论本文提出的卷积网络采用多尺度卷积充分提取分层特征中的不同层次特征,同时利用低分辨率图像本身的结构信息完成重建,并取得不错的重建效果。相似文献

18.

一种基于彩色边缘综合特征的图像检索算法

王向阳陈景伟于永健《模式识别与人工智能》2010,23(2):216-221

图像特征的提取与表达是基于内容的图像检索技术基础。边缘是重要的视觉感知信息,也是图像最基本的特征之一,其在图像分析和理解中有重要价值。文中以视觉重要的图像边缘轮廓为基础,提出一种基于彩色边缘综合特征的图像检索算法。该算法首先利用Canny检测算子提取出原始图像的彩色边缘轮廓。然后构造出能全面反映边缘轮廓内容的3种直方图,即加权颜色直方图、角度直方图和梯度方向直方图。最后综合利用上述3种彩色边缘直方图计算图像间的内容相似度,并进行彩色图像检索。仿真实验表明,该算法能够准确和高效地查找出用户所需内容的彩色图像,并且具有较好的查准率和查全率。相似文献

19.

新的基于GAN的局部写实感漫画图像风格迁移

下载免费PDF全文

孙天鹏周宁宁黄国方《计算机工程与应用》2022,58(14):167-176

利用生成对抗网络对图像进行风格迁移,将真实世界的图像直接转换为高品质动漫风格,是当今计算机视觉的研究热点之一。针对目前流行的AnimeGAN和CartoonGAN漫画生成对抗网络在图像迁移中存在细节丢失严重、色彩失真等问题。通过引入SE-Residual Block（挤压激励残差块）、漫画脸部检测机制并优化损失函数提出全新的ExpressionGAN解决了AnimeGAN迁移图像细节丢失严重的问题。通过加入DSConv（分布偏移卷积）提出SceneryGAN 加快了训练速度并消除了CartoonGAN迁移图像中的歧义像素块。通过卷积优化了图像的融合边界。同时,提出了一种新的对原始图像人物和环境分别处理并融合的局部写实主义漫画模型。实验结果表明,与AnimeGAN和CartoonGAN相比,该方法在训练速度、漫画图像生成质量和图像局部写实感方面都有了明显的提升。相似文献

20.

高分辨率遥感影像的边缘损失增强地物分割

下载免费PDF全文

陈琴朱磊吕燧栋吴谨《中国图象图形学报》2021,26(3):674-685

目的针对高分辨率遥感影像语义分割中普遍存在的分割精度不高、目标边界模糊等问题,提出一种综合利用边界信息和网络多尺度特征的边缘损失增强语义分割方法。方法对单幅高分辨率遥感影像,首先通过对VGG-16（visual geometry group 16-layer net）网络引入侧边输出结构,提取到图像丰富的特征细节;然后使用深度监督的短连接结构将从深层到浅层的侧边输出组合起来,实现多层次和多尺度特征融合;最后添加边缘损失增强结构,用以获得较为清晰的目标边界,提高分割结果的准确性和完整性。结果为了验证所提方法的有效性,选取中国北方种植大棚遥感影像和Google Earth上的光伏板组件遥感影像进行人工标注,并制作实验数据集。在这两个数据集上,将所提方法与几种常用的语义分割方法进行对比实验。实验结果表明,所提方法的精度在召回率为00.9之间时均在0.8以上,在2个数据集上的平均绝对误差分别为0.079 1和0.036 2。同时,通过消融实验分析了各个功能模块对最终结果的贡献。结论与当前先进方法相比,本文提出的边缘损失增强地物分割方法能够更加精确地从遥感影像的复杂背景中提取目标区域,使分割时提取到的目标拥有更加清晰的边缘。相似文献

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司京ICP备09084417号