共查询到20条相似文献,搜索用时 46 毫秒
1.
现有单目深度估计(Monocular depth estimation)算法存在细节估计不准确、同一平面距离估计错误的问题。深度信息是通过图像像素的三通道信息估计出来的,目前已有的算法中很少考虑特征图通道之间的相互关系对深度信息的影响。因此本文提出了一种SE-DenseDepth网络,在网络的编码器中嵌入通道注意力机制,依据不同通道对深度信息的贡献度差异,对通道进行编码,提高编码器对图像特征的表征能力。为了获得图像精细的深度信息,网络建立编码器到解码器的跳连接,引入了更多的低层信息。本文在通用室内数据集NYU-Depth V2上训练,并在真实数据上测试。实验结果表明,本文提出的方法在深度突然变化的细节区域表现更好,在远距离大平面的情况下不会出现深度的断层,与其他主流算法相比可以获得较好的深度估计性能。 相似文献
2.
从热红外图像对比度低、细节信息不足等特点出发,提出了一种面向热红外图像的景深估计方法。首先,设计了一种红外特征聚合模块,提高了对目标物边缘和小目标的全方位深度信息获取能力;其次,在特征融合模块中引入了通道注意力机制,进一步融合通道间的交互信息;在此基础上,建立了一种深度估计网络,实现热红外图像的像素级景深估计。消融实验与对比实验的结果表明,该方法在热红外图像像素级景深估计中性能优于其他代表性方法。 相似文献
3.
针对从单目视觉图像中估计深度信息时存在的预测精度不够准确的问题,该文提出一种基于金字塔池化网络的道路场景深度估计方法。该方法利用4个残差网络块的组合提取道路场景图像特征,然后通过上采样将特征图逐渐恢复到原始图像尺寸,多个残差网络块的加入增加网络模型的深度;考虑到上采样过程中不同尺度信息的多样性,将提取特征过程中各种尺寸的特征图与上采样过程中相同尺寸的特征图进行融合,从而提高深度估计的精确度。此外,对4个残差网络块提取的高级特征采用金字塔池化网络块进行场景解析,最后将金字塔池化网络块输出的特征图恢复到原始图像尺寸并与上采样模块的输出一同输入预测层。通过在KITTI数据集上进行实验,结果表明该文所提的基于金字塔池化网络的道路场景深度估计方法优于现有的估计方法。 相似文献
4.
针对当前视线估计方法准确率不高的问题,提出了一种基于残差网络与注意力机制相结合的视线估计模型。首先,预处理阶段对人脸图像进行关键点定位、剪裁及归一化;然后,将归一化后的图像连续通过残差网络与CBAM(convolutional block attention module)注意力模块,进行人脸特征提取;最后,将神经网络输出的二维视线方向向量转换为三维视线方向向量,得到最终结果。实验结果表明,本模型在公共数据集MPIIFaceGaze上的视线误差角度为4.48o,与其他视线估计系统模型进行对比,本文所提出的模型可以更准确地估计视线方向。 相似文献
5.
单幅图像的深度估计是场景几何理解过程中的一个重要步骤,但由于尺度模糊,也被计算机视觉领域普遍认为是一个典型的不适定问题。近年来,尽管监督学习方法在单目深度估计中取得了基本令人满意的效果,但需要对数据集进行大量真实深度值的标记,这是一项成本较高的工作。此外,由于物体的运动、遮挡、光照等常见问题,单目深度估计的表现并不尽如人意,尤其是在物体边缘和弱纹理区域。为了解决这些问题,本文提出了一种基于自注意力的多阶段无监督单目深度估计网络。该方法具有以下特点:1)多阶段网络结构对训练过程中的深度估计具有较强的约束和监督作用;2)通过掩模加权重构损失和左右视差一致性损失对网络进行优化;3)采用自注意力机制捕捉更多上下文信息,进而提升预测结果。实验结果表明,该方法在KITTI数据集上的深度估计效果达到甚至超过了已有方法。 相似文献
6.
基于计算机视觉的深度估计方法 总被引:2,自引:0,他引:2
深度估计方法可分为主动视觉和被动视觉两类.介绍了被动视觉测距中的五种深度估计方法,包括立体视觉、运动测距、描影法、聚焦法和散焦法,分析了各自的成像原理、数学模型和测量方法.最后,对基于计算机视觉的深度估计方法进行总结,分析了现有测量方法各自的局限性,提出算法进一步改进的方向是应用计算机视觉系统中需要的不同模板,联合依赖... 相似文献
7.
8.
9.
自监督单目深度估计在自动驾驶、智能制造等领域有着广泛的应用。然而由于自监督训练存在大量训练噪声,其估计精度受到了极大限制。针对自监督单目深度估计算法中深度估计精度有限的问题,本文提出了一种基于局部注意力机制和迭代调优的自监督单目深度估计框架。首先,对于深度估计网络,基于局部像素间深度值的高度相关性,本文设计了一种局部注意力机制来融合高分辨率特征图的局部特征,提升深度估计的准确性;其次,对于位姿估计网络,本文设计了一种迭代调优的位姿估计结构,利用残差优化的方式降低位姿估计难度,提升位姿估计的准确性进而提升深度估计网络的性能。实验表明,本文提出的改进自监督单目深度估计算法有效提升了深度估计的精度。 相似文献
10.
11.
针对深度学习模型所需的海量参数及强大的计算资源而导致其不能很便捷地应用于嵌入式设备或移动端的问题,在Lasso(Least Absolute Shrinkage and Selection Operator)回归通道挑选法的基础上,提出了Lasso+奇异值分解(Singular Value Decomposition,SVD)的融合压缩法。使用VGG-16为初始模型,分别在不同的小型数据集上进行迁移学习,使用迁移学习后的模型在不同的加速率下进行测试。实验结果表明,相对于传统的模型压缩算法,Lasso+SVD的融合压缩法实现了在加速和参数压缩两方面的优势,进而以目标检测为应用方向,在保证准确率的同时不仅降低了模型存储需求,而且也较大提升了模型的实时性。 相似文献
12.
本文通过比较分析序数加减运算和整数加减运算的溢出检测,提出一种序数和整数能混合运算的实现方法,并且对方法的正确性进行了校举证明.按照这种实现方法,不仅精简了指令集合,而且能通过扩大中间运算结果的有限表示范围,减少溢出情况的发生,从而提高了运算的精度. 相似文献
13.
14.
随着社交媒体的大力发展,互联网不再只是人们获取信息的工具,同时还是人们分享信息的渠道.用户生成内容使得人们面临着信息过载,大量真正有价值的信息难以被发现.个性化推荐系统凭借其较低的用户参与度被认为是当前解决信息过载最有潜力的方法之一.然而,目前最成熟、应用最广的协同过滤推荐方法正面临着数据稀疏性、多样性等问题,其推荐效果不甚理想.本文提出了一种基于线性回归的推荐方法,利用用户或物品的评分频次信息,建立了线性回归模型,以此预测用户对未评分物品的评分.该方法具有低复杂性、可增量更新、高准确性等优点. 相似文献
15.
针对语音识别错误导致口语理解系统性能下降的问题,提出一种易于训练且解码快速的鉴别式口语理解方法。首先为每个语义要素建立一个二类逻辑回归模型,随后根据领域中的限制关系建立联合概率模型。在英语公开数据集DSTC2上的实验结果表明,该方法优于人工规则方法和语义元组分类器模型。 相似文献
16.
The Edgeworth (1887) algorithm for minimizing absolute error is known to suffer from convergence problems when the data contains degeneracies. In this paper, it is shown that for the particular problem of fitting a line to a set of uniformly sampled data, the problem of degeneracy may be easily avoided by utilizing a stable sorter for the weighted median operation needed in Edgeworth's method. Proof of convergence is based on establishing an equivalence between the use of a stable sorting routine and perturbing the original data in such a way that no degeneracies exist. In addition, it will be shown that the data set size may be selected so that the minimum error fit is unique 相似文献
17.
通过实验,研究了720℃时通过化学气相沉积(CVD)法在Si基板上得到的大面积垂直排列的有序多壁碳纳米管(MWNTs)的光电响应特性。实验表明,激光诱导所产生的光电流是光强度和偏置电压的线性函数,其大小取决于所产生的光子载体的漂移速度。 相似文献
18.
19.
基于深度学习的低照度图像增强方法 总被引:1,自引:0,他引:1
在低照度环境下采集的图像往往亮度不足,导致在后续视觉任务中难以有效利用.针对这一问题,过去的低照度图像增强方法大多在极度低光场景中表现失败,甚至放大了图像中的底层噪声.为了解决这一难题,本文提出了 一种新的基于深度学习的端到端神经网络,该网络主要通过空间和通道双重注意力机制来抑制色差和噪声,其中空间注意力模块利用图像的... 相似文献
20.
机器阅读理解是直接以理解文字为目标的任务,通过机器回答与指定原文相关的问题的准确程度来衡量机器对文字的理解能力.本文提出了一个基于深度学习的模型,来应用到片段抽取型的机器阅读理解,使用循环神经网络对原文和问题进行编码,再通过注意力机制进行信息交互,最后通过基于指针的方法来预测答案在原文中的起始与终止位置.实验表明,本文提出的模型超过了传统方法的效果,在测试集上取得了53.1%的F1值和39.6%的EM值. 相似文献