期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

周伟强韩军《电光与控制》2022,(2):67-71

针对目前的无监督学习方法在单目图像深度估计中存在深度估计不准确、边缘模糊的问题,提出了一种融合多尺度特征信息和语义信息的无监督单目深度估计网络。该网络不仅引入了从编码器到解码器的跳层连接来实现不同尺度特征的提取和融合,还在编码器和解码器之间引入多个空洞卷积并行的语义层来增加感受野,使得结果更加准确。最后在KITTI数据集上进行了训练和测试,误差指标均低于目前的无监督学习方法,图像预测的准确率在3个比例阈值下分别达到了91%,96.8%和98.7%,超过了所有的监督和无监督的方法,使场景中各目标的边缘更清晰,层次也更分明。相似文献

2.

基于DRF-MAP模型的单目图像深度估计的改进算法

张蓓蕾孙韶媛武江伟谷小婧《红外技术》2009,31(12)

图像深度信息获取是机器视觉领域的活跃研究课题之一.将图像深度估计问题归结为模式识别问题,以单目图像深度为模式类,在多尺度下从图像块中提取绝对和相对深度特征,并选择表征上下文关系的DRF(Discriminative Random Field)方法来表述某图像块的深度和其邻域深度之间的关系,从而构建起基于DRF-MAP(Maximum a posteriori)的单目图像深度估计模型.通过实验,得到了一类单目图像对应的深度图像,从而证明了单目图像深度估计模型对应的改进算法的有效性. 相似文献

3.

基于语义导向的光场图像深度估计

邓慧萍盛志超向森吴谨《电子与信息学报》2022,44(8):2940-2948

光场图像的深度估计是3维重建、自动驾驶、对象跟踪等应用中的关键技术。然而,现有的深度学习方法忽略了光场图像的几何特性,在边缘、弱纹理等区域表现出较差的学习能力,导致深度图像细节的缺失。该文提出了一种基于语义导向的光场图像深度估计网络,利用上下文信息来解决复杂区域的不适应问题。设计了语义感知模块的编解码结构来重构空间信息以更好地捕捉物体边界,空间金字塔池化结构利用空洞卷积增大感受野,挖掘多尺度的上下文内容信息;通过无降维的自适应特征注意力模块局部跨通道交互,消除信息冗余的同时有效融合多路特征;最后引入堆叠沙漏串联多个沙漏模块,通过编解码结构得到更加丰富的上下文信息。在HCI4D光场数据集上的实验结果表明,该方法表现出较高的准确性和泛化能力,优于所比较的深度估计的方法,且保留较好的边缘细节。相似文献

4.

基于深度多级小波变换的图像盲去模糊算法

陈书贞曹世鹏崔美玥练秋生《电子与信息学报》2021,43(1):154-161

近年来卷积神经网络广泛应用于单幅图像去模糊问题,卷积神经网络的感受野大小、网络深度等会影响图像去模糊算法性能。为了增大感受野以提高图像去模糊算法的性能,该文提出一种基于深度多级小波变换的图像盲去模糊算法。将小波变换嵌入编-解码结构中,在增大感受野的同时加强图像特征的稀疏性。为在小波域重构高质量图像,该文利用多尺度扩张稠密块提取图像的多尺度信息,同时引入特征融合块以自适应地融合编-解码之间的特征。此外,由于小波域和空间域对图像信息的表示存在差异,为融合这些不同的特征表示,该文利用空间域重建模块在空间域进一步提高重构图像的质量。实验结果表明该文方法在结构相似度(SSIM)和峰值信噪比(PSNR)上具有更好的性能,而且在真实模糊图像上具有更好的视觉效果。相似文献

5.

基于深度多级小波变换的图像盲去模糊算法

陈书贞曹世鹏崔美玥练秋生《电子与信息学报》2022,43(1):154-161

近年来卷积神经网络广泛应用于单幅图像去模糊问题,卷积神经网络的感受野大小、网络深度等会影响图像去模糊算法性能.为了增大感受野以提高图像去模糊算法的性能,该文提出一种基于深度多级小波变换的图像盲去模糊算法.将小波变换嵌入编-解码结构中,在增大感受野的同时加强图像特征的稀疏性.为在小波域重构高质量图像,该文利用多尺度扩张稠密块提取图像的多尺度信息,同时引入特征融合块以自适应地融合编-解码之间的特征.此外,由于小波域和空间域对图像信息的表示存在差异,为融合这些不同的特征表示,该文利用空间域重建模块在空间域进一步提高重构图像的质量.实验结果表明该文方法在结构相似度(SSIM)和峰值信噪比(PSNR)上具有更好的性能,而且在真实模糊图像上具有更好的视觉效果. 相似文献

6.

基于自注意力机制的多阶段无监督单目深度估计网络

下载免费PDF全文

刘香凝赵洋王荣刚《信号处理》2020,36(9):1450-1456

单幅图像的深度估计是场景几何理解过程中的一个重要步骤,但由于尺度模糊,也被计算机视觉领域普遍认为是一个典型的不适定问题。近年来,尽管监督学习方法在单目深度估计中取得了基本令人满意的效果,但需要对数据集进行大量真实深度值的标记,这是一项成本较高的工作。此外,由于物体的运动、遮挡、光照等常见问题,单目深度估计的表现并不尽如人意,尤其是在物体边缘和弱纹理区域。为了解决这些问题,本文提出了一种基于自注意力的多阶段无监督单目深度估计网络。该方法具有以下特点:1)多阶段网络结构对训练过程中的深度估计具有较强的约束和监督作用;2)通过掩模加权重构损失和左右视差一致性损失对网络进行优化;3)采用自注意力机制捕捉更多上下文信息,进而提升预测结果。实验结果表明,该方法在KITTI数据集上的深度估计效果达到甚至超过了已有方法。相似文献

7.

基于局部注意力和位姿迭代优化的自监督单目深度估计算法

下载免费PDF全文

赵霖赵滟靳捷《信号处理》2022,38(5):1088-1097

自监督单目深度估计在自动驾驶、智能制造等领域有着广泛的应用。然而由于自监督训练存在大量训练噪声,其估计精度受到了极大限制。针对自监督单目深度估计算法中深度估计精度有限的问题,本文提出了一种基于局部注意力机制和迭代调优的自监督单目深度估计框架。首先,对于深度估计网络,基于局部像素间深度值的高度相关性,本文设计了一种局部注意力机制来融合高分辨率特征图的局部特征,提升深度估计的准确性;其次,对于位姿估计网络,本文设计了一种迭代调优的位姿估计结构,利用残差优化的方式降低位姿估计难度,提升位姿估计的准确性进而提升深度估计网络的性能。实验表明,本文提出的改进自监督单目深度估计算法有效提升了深度估计的精度。相似文献

8.

采用KPCA和BP神经网络的单目车载红外图像深度估计

下载免费PDF全文

孙韶媛李琳娜赵海涛《红外与激光工程》2013,42(9):2348-2352

提出一种基于监督学习得到深度估计模型的单目车载红外图像深度估计方法。首先用核主成分分析法（KPCA）筛选红外图像特征。将最初提取的红外图像特征用核函数非线性映射到一个线性可分的高维特征空间,再完成主成分分析（PCA）,得到降维后的红外图像特征。然后以BP神经网络为模型基础,对红外图像特征和深度值进行训练,训练后的深度估计模型可对单目车载红外图像的深度分布进行估计。实验结果证明,利用该模型估计的单目车载红外图像的深度信息与原红外图像的深度信息一致。相似文献

9.

多尺度注意力机制的电子元器件深度迁移识别方法

夏玉果丁晟赵力《无线电工程》2023,(9):2174-2181

电子元器件的识别对于现代电子产品的智能生产和制造具有重要的作用,为了进一步获取电子元器件图像的关键特征,提升图像细粒度表达能力,提出一种基于多尺度注意力机制深度迁移识别方法。以Xception为主干网络架构,引入多尺度池化通道注意力和多尺度空间注意力模块,结合空间金字塔池化的思想,对特征图的每个通道进行不同尺度的最大池化和均值池化,获取通道方向上不同尺度的特征信息;在空间层面上进行不同尺度的空洞卷积,增大特征图的感受野,获取更加全面的空间特征信息;通过深度迁移学习,实现特征参数共享,进一步提高模型的泛化能力。在5种常见的电子元器件数据集上进行实验,结果表明,所提方法能有效获取图像不同尺度的显著特征信息,提升识别效果。相似文献

10.

基于SVM模型的单目红外图像深度估计

席林孙韶媛李琳娜邹芳喻《激光与红外》2012,42(11):1311-1315

提出一种通过非线性学习模型来估计单目红外图像深度的算法。该算法首先通过逐步线性回归和独立成分分析(ICA)寻找对于红外图像深度相关性较强的特征,然后以具有核函数的非线性支持向量机(SVM)为模型基础,采用监督学习的方法对红外图像深度特征进行回归分析并训练,在训练过程中通过已知数据回归后的最小均方误差对模型参数进行修正,训练后的模型可对单目红外图像的深度分布进行估计。实验结果证明,利用该模型能较一致地估计单目红外图像的深度信息。相似文献

11.

基于CBAM的深度序数回归方法

高永彬王慧星黄勃《智能计算机与应用》2021,11(5):19-25

本文针对单目深度估计模型深度序数回归算法中全图像编码器易丢失较大像素值像素特征信息和位置信息的缺点,提出一种基于CBAM的深度序数回归方法.首先,将CBAM嵌入到深度序数回归算法中作为全图像编码器,依次采用通道注意力机制和空间注意力机制来捕获图像完整的特征信息和位置信息,通过获得的注意力图重新调整原始特征;其次,对像素的深度值进行离散,将深度估计重新转化为序数回归问题;最后,使用回归损失函数对网络进行训练.实验结果表明,相比于其他有监督学习、半监督学习和无监督学习的方法,该方法在KITTI数据集上取得更好的效果. 相似文献

12.

多遮挡场景的光场深度优化估计

白烨尹晶曹正杜丽萍迟金阳沙彦福《激光与红外》2022,52(9):1411-1416

光场相机可以同时从多个视点记录场景的方向和光强信息,因此,光场图像具有更大的信息量及更强的可塑性。随着光场技术的发展,针对光场图像的深度估计逐渐成为研究热点,但多遮挡是尚未得到解决的技术难点问题。为此,提出了一种多遮挡场景的光场图像深度优化估计方法。该方法使用优化的高低阈值比的Canny边缘检测算法提取遮挡区域的边缘,在传统的AP聚类算法中引入了迭代加权更新的带加速算子,有效地提高了聚类的精度,较好地解决光场深度估计中的多遮挡问题。采用匹配成本估计初始深度,使用马尔科夫随机场对初始深度结果进行优化处理,得到最终的深度估计结果。实验结果表明,与现有的基于光场图像的深度估计方法相比,本方法不仅抗多遮挡效果显著,而且获得了更低的MSE值,得到了更好的深度估计结果。相似文献

13.

单光子激光雷达的时间相关多深度估计

下载免费PDF全文

邬淼陆俣冒添逸何伟基陈钱《红外与激光工程》2022,51(2):20210885-1-20210885-9

单光子激光雷达广泛应用于获得三维场景的深度和强度信息。对于多表面目标,如激光经过半透明表面上时,一个像素上探测到的回波信号可能包含多个峰。传统方法在低光子或相对较高的背景噪声水平下无法准确估计多深度图像。因此,提出了一种单光子激光雷达时间相关多深度估计方法。该方法利用信号响应的时间相关性,对点云数据进行多深度快速去噪,能够从背景噪声中识别每个像素上来自多个表面的信号响应。并基于该信号响应集合的泊松分布模型,通过全变分正则化引入像素之间的空间相关性,建立多深度估计成本函数。使用快速收敛的交替方向乘子算法从成本函数中估计深度图像。实验结果表明,所提方法在距离约为1 km处的多深度目标上,相较于常规方法估计深度图像的均方根误差减少了至少27.05%,信号重建误差比提高了至少18.39%,同时数据量减少至原来的4%。证明该方法能够以更小的内存需求和计算复杂度提高单光子激光雷达的多深度图像估计性能。相似文献

14.

基于多级残差融合的复杂纹理光场图像深度估计

赵以赵娟宁孙连山《智能计算机与应用》2024,(2):100-105

光场的深度信息可以通过深度学习的光场深度估计算法计算,在图像视差、光场图像边缘以及光场图像的复杂纹理区域,获取高精度深度值仍然具有一定局限性。本文提出了一种用于光场图像深度估计的多级残差融合网络,通过组合残差模块提取多层次的残差特征,在保持网络深度的同时提升了网络对特征的表征能力。利用多级残差融合模块对多层次的残差特征进行融合,以获得包含浅层纹理信息和深层语义信息的融合特征。利用本文方法对HCI4D光场数据集进行处理,图像深度估计的均方误差指标达到1.471,不良像素率指标达到4.208,该实验结果表明本文方法在处理具有复杂遮挡的光场图像区域方面具有良好的处理效果。相似文献

15.

基于自注意力深度网络的图像超分辨率重建方法

陈子涵吴浩博裴浩东陈榕胡佳新时亨通《激光与光电子学进展》2021,58(4):191-198

针对现有图像超分辨重建方法难以充分重建图像的细节信息且易出现重建的图像缺乏层次的问题,提出一种基于自注意力深度网络的图像超分辨重建方法。以深度神经网络为基础,通过提取低分辨率图像特征,建立低分辨率图像特征到高分辨率图像特征的非线性映射,重建高分辨率图像。在进行非线性映射时,引入自注意力机制,获取图像中全部像素间的依赖关系,利用图像的全局特征指导图像重建,增强图像层次。在训练深度神经网络时,使用图像像素级损失和感知损失作为损失函数,以强化网络对图像细节信息的重建能力。在3类数据集上的对比测试结果表明,所提方法能够提升图像超分辨重建结果的细节信息,且重建图像的视觉效果更好。相似文献

16.

基于深度传感器图像分割技术的研究

赵志平陈雷月《信息技术》2014,(1):109-112

首先详细介绍了深度传感器获取深度信息的工作原理,并利用深度传感器获取到用户的深度图像信息。然后,对深度图像进行校正,具体包括深度距离与实际距离的转换、深度图像到空间三维坐标的转换、深度图像到RGB图像的配准。最后,利用最优阈值法实现了将预处理后的深度信息中人体与背景的分割。实验结果表明,此方案可以比较完整的提取出人体区域。相似文献

17.

基于深度传感器图像分割技术的研究 总被引：1，自引：0，他引：1

赵志平陈雷月《黑龙江电子技术》2014,(1):109-112

首先详细介绍了深度传感器获取深度信息的工作原理,并利用深度传感器获取到用户的深度图像信息.然后,对深度图像进行校正,具体包括深度距离与实际距离的转换、深度图像到空间三维坐标的转换、深度图像到RGB图像的配准.最后,利用最优阈值法实现了将预处理后的深度信息中人体与背景的分割.实验结果表明,此方案可以比较完整的提取出人体区域. 相似文献

18.

基于通道注意力机制的单目深度估计

下载免费PDF全文

张聪马燕新万建伟许可徐国权《信号处理》2022,38(11):2332-2341

现有单目深度估计（Monocular depth estimation）算法存在细节估计不准确、同一平面距离估计错误的问题。深度信息是通过图像像素的三通道信息估计出来的,目前已有的算法中很少考虑特征图通道之间的相互关系对深度信息的影响。因此本文提出了一种SE-DenseDepth网络,在网络的编码器中嵌入通道注意力机制,依据不同通道对深度信息的贡献度差异,对通道进行编码,提高编码器对图像特征的表征能力。为了获得图像精细的深度信息,网络建立编码器到解码器的跳连接,引入了更多的低层信息。本文在通用室内数据集NYU-Depth V2上训练,并在真实数据上测试。实验结果表明,本文提出的方法在深度突然变化的细节区域表现更好,在远距离大平面的情况下不会出现深度的断层,与其他主流算法相比可以获得较好的深度估计性能。相似文献

19.

基于光场结构特性与多视点匹配的深度估计

下载免费PDF全文

范晓婷李奕罗晓维张凝韩梦芯雷建军《红外与激光工程》2019,48(5):524001-0524001(8)

针对现有光场图像深度估计技术无法均衡地对主要对象和背景进行深度估计的问题,提出了一种基于光场结构特性与多视点匹配的深度估计方法。该方法在光场结构特性引导的深度估计的基础上,为了实现光场图像深度变化区域的平滑过渡,同时又考虑光场图像具有多视点子孔径图像阵列的特点,采用多视点匹配优化光场图像深度估计。在马尔可夫随机域中,基于光场结构特性构建深度估计平滑项,同时联合多视点匹配构建深度估计数据项,并进行全局深度迭代优化,从而有效平衡对象深度边界和背景深度估计,提高光场图像深度估计的性能。实验结果表明,所提出的方法能够得到更加清晰的深度边界,同时可以修正背景中不准确的深度值,获得高质量的深度估计结果。相似文献

20.

基于RFB和超网络的跨尺度多层次真实失真图像质量评价方法

周怀博贾惠珍王同罕《现代电子技术》2024,(9):47-52

为了能在真实失真图像质量领域实现高效的跨尺度学习,提出一种双分支特征提取方法。首先,利用对比学习方法自监督地提取跨尺度、跨颜色空间的图像内容感知特征;随后,采用基于扩张感受野和超网络的策略,将多层次特征信息与跨尺度信息进行循环交互融合,以获取更贴近人类感知的图像质量特征。基于公开真实失真数据库的实验结果表明,所提算法在真实失真图像质量评价上取得了优越性能,而且,通过两个尺度的实验结果展示了该算法实现了更高效的跨尺度学习,从而为图像多尺度深度网络的应用提供了较好基础。相似文献