首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 278 毫秒
1.
海量视频数据推动了基于数据驱动的单目图像深度估计研究.针对现有方法存在不同对象深度分配层次感不够的问题,在相似场景具有相似深度的假设前提下,提出一种基于语义级分割和深度迁移的单目图像2D转3D的方法.首先使用分割迁移模型将输入图像的像素进行语义级分类;然后通过语义级分类结果对场景匹配进行约束;再次利用SIFT流建立输入图像和匹配图像间像素级对应关系,并由此将匹配图像的深度迁移到输入图像上;最后通过语义级分割约束的最优化深度融合模型为不同对象区域分配深度值.Make3D测试数据的实验结果表明,该方法估计的深度质量比现有深度迁移方法更高,与最优化融合深度迁移算法相比,平均对数误差和平均相对误差分别降低0.03和0.02个点.  相似文献   

2.
针对当前基于深度学习的点云分割技术对点级别标注训练数据的依赖问题,提出一种基于伪标签生成与噪声标签学习的弱监督点云分割框架.首先,利用点云具有非局部相似性的特点,基于局部-非局部图对点云数据进行建模;其次,基于关系图卷积网络,以半监督的方式为稀疏标注的点云训练集数据生成高质量的伪标签;最后,针对生成的伪标签中存在噪声标签的问题,设计一种利用含噪声标签数据准确训练现有点云分割网络的渐进式噪声鲁棒损失函数.在ShapeNet Part与S3DIS等公开点云分割数据集上的实验结果表明,该框架在推理阶段不增加模型额外运算量的情况下,当使用10%的标签时,在ShapeNet Part数据集上的分割精度与全监督方法相差0.1%;当使用1%的标签时,在S3DIS数据集上的分割精度与全监督方法相差5.2%.  相似文献   

3.
目的使用单幅RGB图像引导稀疏激光雷达(light detection and ranging,LiDAR)点云构建稠密深度图已逐渐成为研究热点,然而现有方法在构建场景深度信息时,目标边缘处的深度依然存在模糊的问题,影响3维重建与摄影测量的准确性。为此,本文提出一种基于多阶段指导网络的稠密深度图构建方法。方法多阶段指导网络由指导信息引导路径和RGB信息引导路径构成。在指导信息引导路径上,通过ERF(efficient residual factorized)网络融合稀疏激光雷达点云和RGB数据提取前期指导信息,采用指导信息处理模块融合稀疏深度和前期指导信息,并将融合后的信息通过双线性插值的方式构建出表面法线,将多模态信息融合指导模块提取的中期指导信息和表面法线信息输入到ERF网络中,提取可用于引导稀疏深度稠密化的后期指导信息,以此构建该路径上的稠密深度图;在RGB信息引导路径上,通过前期指导信息引导融合稀疏深度与RGB信息,通过多模态信息融合指导模块获得该路径上的稠密深度图,采用精细化模块减少该稠密深度图中的误差信息。融合上述两条路径得到的结果,获得最终稠密深度图。结果通过KITTI(...  相似文献   

4.
以生活常见的水果作为研究对象,结合SFM对图像序列的深度估计以及神经网络重建三维结构的优点,提出SFM算法融合深度学习三维重建的水果体积测量算法。对单目相机采集的水果多视角图像进行研究,分析图像重建以及估计大小的方法,搭建快速、便捷估计水果实际体积算法框架。使用神经网络快速推理水果结构,解决三维重建构建稠密点云耗时长的缺点,利用多视角图像获取稀疏点云,估计目标尺寸,提高采样的便利性。实验结果表明,该算法能快速重建水果三维模型,实现简单、快速、较精确的水果体积测量。  相似文献   

5.
林琴      李卫军      董肖莉      宁欣      陈鹏     《智能系统学报》2018,13(4):534-542
基于双目立体匹配算法PatchMatch算法,提出了一种获取人脸三维点云的算法。该算法对局部立体匹配算法PatchMatch进行了优化。该方法既不需要昂贵的设备,也不需要通用的人脸三维模型,而是结合了人脸的拓扑结构信息以及立体视觉局部优化算法。此方法采用非接触式的双目视觉采集技术获取左右视角的人脸图像,利用回归树集合(ensemble of regression trees,ERT)算法对人脸图像进行关键点定位,恢复人脸稀疏的视差估计,运用线性插值方法初步估计脸部的稠密视差值,并结合局部立体匹配算法对得到的视差结果进行平滑处理,重建人脸的三维点云信息。实验结果表明,这种算法能够还原出光滑的稠密人脸三维点云信息,在人脸Bosphorus数据库上取得了更加准确的人脸重建结果。  相似文献   

6.
单目图像的深度估计可以从相似图像及其对应的深度信息中获得。然而,图像匹 配歧义和估计深度的不均匀性问题制约了这类算法的性能。为此,提出了一种基于卷积神经网 络(CNN)特征提取和加权深度迁移的单目图像深度估计算法。首先提取 CNN 特征计算输入图像 在数据集中的近邻图像;然后获得各候选近邻图像和输入图像间的像素级稠密空间形变函数; 再将形变函数迁移至候选深度图像集,同时引入基于 SIFT 的迁移权重 SSW,并通过对加权迁 移后的候选深度图进行优化获得最终的深度信息。实验结果表明,该方法显著降低了估计深度 图的平均误差,改善了深度估计的质量。  相似文献   

7.
基于图像的三维重建硬件约束小、成本低、灵活度高,在实际中得到广泛应用,但物体各部分之间存在遮挡,导致由图像生成的三维点云数据稀疏和密度不均等问题,一直是处理的难点和热点.文中提出一种基于遮罩的稀疏点云滤波算法.首先计算点云的包围盒,并在包围盒中根据点云的稀疏度自适应地划分栅格;其次,利用深度优先搜索,递归求出所有由栅格...  相似文献   

8.
针对纹理稀疏区域重建效果差的问题,本文提出一种基于像素插值的改进稠密重建算法.基于面片的多视图稠密重建方法(PMVS)能够自动忽略外部点和障碍点,相比较于其他三维稠密重建算法该算法更准确,简单,高效.但是在纹理稀疏的区域会出现孔洞残缺等问题,且现有的匹配候选点选取策略会使得局部细节失真边缘残缺.本文针对这些问题提出了一种基于像素插值的特征点选取方法,增加纹理稀疏区域的特征点,使特征点分布均匀,提出一种更合理的候选点选取策略,减少错误匹配.实验表明本文提出的方法不仅能保证纹理稀疏区域的重建效果,还能有效剔除误匹配点,提高重建精度.  相似文献   

9.
陈震  张道文  张聪炫  汪洋 《自动化学报》2022,48(9):2316-2326
针对非刚性大位移运动场景的光流计算准确性与鲁棒性问题,提出一种基于深度匹配的由稀疏到稠密大位移运动光流估计方法.首先利用深度匹配模型计算图像序列相邻帧的初始稀疏运动场;其次采用网格化邻域支持优化模型筛选具有较高置信度的图像网格和匹配像素点,获得鲁棒的稀疏运动场;然后对稀疏运动场进行边缘保护稠密插值,并设计全局能量泛函优化求解稠密光流场.最后分别利用MPI-Sintel和KITTI数据库提供的测试图像集对本文方法和Classic+NL,DeepFlow, EpicFlow以及FlowNetS等变分模型、匹配策略和深度学习光流计算方法进行综合对比与分析,实验结果表明本文方法相对于其他方法具有更高的光流计算精度,尤其在非刚性大位移和运动遮挡区域具有更好的鲁棒性与可靠性.  相似文献   

10.
基于像素级的交互式图像分割算法对初始种子位置和噪声敏感,同时仅基于超像素的分割方法无法保留图像细节经常导致分割结果出现欠分割问题。针对上述问题,提出超像素/像素约束和稀疏表示的图像分割模型。该方法利用高斯函数分别对像素和超像素构造了相互约束的代价函数,引入了稀疏分解对模型进行优化以提升模型对图像噪声的鲁棒性,最后利用联合优化策略对代价函数求解估计出目标和背景标记实现目标提取。实验结果表明,与现有的分割方法相比,提出的方法能获得较好的分割效果,对高斯噪声和椒盐噪声具有较强的鲁棒性。  相似文献   

11.
针对室内场景地面信息提取问题,提出了一种基于平面和空间信息统计分析的室内稠密点云地面提取方法。首先,对输入的稠密点云进行预处理,实现数据降噪及抽稀;其次,利用区域生长分割平面结构,并根据平面位置关系进行合并与分组;然后,采用平面数量、投影面积、天花板与地面、空间距离等多个室内空间信息分析实现地面初提取;最后,采用图像映射、轮廓提取、孔洞填充、点云映射对初提取的地面点云进行优化,得到最终的地面点云。实验表明,该方法可实现不依赖传感器校正坐标系信息,仅使用稠密点云数据作为输入,准确有效地提取地面,准确率达到90%以上,并在一定程度上降低稠密点云的冗余度。  相似文献   

12.
针对无人机在航拍大场景对象进行三维重建时因抖动产生的图像模糊现象,以及二维图像序列经运动恢复结构SFM后得到的点云较为稀疏,可视化差等不足,采用去抖动模糊算法恢复模糊图像的原始图像信息,然后在运动恢复结构的基础上进行基于点云的稠密三维重建,最后对稠密重建后的点云进行泊松表面重建以得到表面致密、均匀的三维模型。实验结果表明,去抖动模糊算法可以有效地提高图像的质量,大场景对象经过基于点云的稠密三维重建后得到的重建效果逼真,可视化强。  相似文献   

13.
王伟  余淼  胡占义 《自动化学报》2014,40(12):2782-2796
提出一种高精度的基于匹配扩散的稠密深度图估计算法. 算法分为像素级与区域级两阶段的匹配扩散过程.前者主要对视图间的稀疏特征点匹配进行扩散以获取相对稠密的初始深度图; 而后者则在多幅初始深度图的基础上, 根据场景分段平滑的假设, 在能量函数最小化框架下利用平面拟合及多方向平面扫描等方法解决存在匹配多义性问题区域(如弱纹理区域)的深度推断问题. 在标准数据集及真实数据集上的实验表明, 本文算法对视图中的光照变化、透视畸变等因素具有较强的适应性, 并能有效地对弱纹理区域的深度信息进行推断, 从而可以获得高精度、稠密的深度图.  相似文献   

14.
为了保证算法的实时性,在激光SLAM算法(Simultaneous Localization and Mapping,SLAM)中通常使用滤波算法使激光点云地图保持稀疏的状态以减少运算复杂度。在多传感器融合的SLAM算法中,激光点云为图像像素提供深度信息,最终输出携带色彩信息的点云地图,此时由滤波算法引起的点云稀疏性将影响融合效果,出现无法清晰辨别物体轮廓或颜色信息的情况。本文基于LOAM(Lidar Odometry and Mapping in Real-time)算法,使用体素栅格滤波算法处理激光点云,在不考虑计算实时性的前提下,通过配置体素栅格的大小提高点云密度,为更多数量的图像像素提供深度信息。在室内、走廊、室外三种场景下的实验表明,通过减小的体素大小,点云密度最大可以增加54.87倍,达到了丰富激光点云图的目的,且此方法在室内、走廊等小场景中更加适用。经融合算法处理,将体素滤波处理后的激光点云深度信息与图像像素融合,生成携带色彩信息的点云地图,使环境结构及颜色信息能够清晰辨识。  相似文献   

15.
目的 激光雷达在自动驾驶中具有重要意义,但其价格昂贵,且产生的激光线束数量仍然较少,造成采集的点云密度较稀疏。为了更好地感知周围环境,本文提出一种激光雷达数据增强算法,由双目图像生成伪点云并对伪点云进行坐标修正,进而实现激光雷达点云的稠密化处理,提高3D目标检测精度。此算法不针对特定的3D目标检测网络结构,是一种通用的点云稠密化方法。方法 首先利用双目RGB图像生成深度图像,根据先验的相机参数和深度信息计算出每个像素点在雷达坐标系下的粗略3维坐标,即伪点云。为了更好地分割地面,本文提出了循环RANSAC (random sample consensus)算法,引入了一个分离平面型非地面点云的暂存器,改进复杂场景下的地面分割效果。然后将原始点云进行地面分割后插入KDTree (k-dimensional tree),以伪点云中的每个点为中心在KDTree中搜索若干近邻点,基于这些近邻点进行曲面重建。根据曲面重建结果,设计一种计算几何方法导出伪点云修正后的精确坐标。最后,将修正后的伪点云与原始激光雷达点云融合得到稠密化点云。结果 实验结果表明,稠密化的点云在视觉上具有较好的质量,物体具有更加完整的形状和轮廓,并且在KITTI (Karlsruhe Institute of Technology and Toyota Technological Institute)数据集上提升了3D目标检测精度。在使用该数据增强方法后,KITTI数据集下AVOD (aggregate view object detection)检测方法的AP3D-Easy (average precision of 3D object detection on easy setting)提升了8.25%,AVOD-FPN (aggregate view object detection with feature pyramid network)检测方法的APBEV-Hard (average precision of bird’s eye view on hard setting)提升了7.14%。结论 本文提出的激光雷达数据增强算法,实现了点云的稠密化处理,并使3D目标检测结果更加精确。  相似文献   

16.
为了提高对雕塑点稀疏图像的点云三维重建的分析能力,提出一种基于稀疏图像序列的雕塑点自动云三维重构方法,基于稀疏散乱点三维重建和锐化模板特征匹配方法进行图像三维重建。采用三维角点检测和边缘轮廓特征提取方法,进行雕塑点稀疏图像三维点云特征检测,对检测的雕塑点稀疏图像点云数据进行信息融合处理,采用梯度运算方法进行特征分解,实现对雕塑点稀疏图像的信息增强和融合滤波。结合局部均值降噪方法进行图像的提纯处理,提高雕塑点稀疏图像轮廓重建能力,采用锐化模板特征匹配和块分割技术,实现雕塑点自动云三维重构。仿真结果表明,采用该方法进行雕塑点自动云三维重构的准确性较高,图像匹配能力较好,且重构输出信噪比较高。  相似文献   

17.
单幅图像深度估计是计算机视觉中的经典问题,对场景的3维重建、增强现实中的遮挡及光照处理具有重要意义。本文回顾了单幅图像深度估计技术的相关工作,介绍了单幅图像深度估计常用的数据集及模型方法。根据场景类型的不同,数据集可分为室内数据集、室外数据集与虚拟场景数据集。按照数学模型的不同,单目深度估计方法可分为基于传统机器学习的方法与基于深度学习的方法。基于传统机器学习的单目深度估计方法一般使用马尔可夫随机场(MRF)或条件随机场(CRF)对深度关系进行建模,在最大后验概率框架下,通过能量函数最小化求解深度。依据模型是否包含参数,该方法又可进一步分为参数学习方法与非参数学习方法,前者假定模型包含未知参数,训练过程即是对未知参数进行求解;后者使用现有的数据集进行相似性检索推测深度,不需要通过学习来获得参数。对于基于深度学习的单目深度估计方法本文详细阐述了国内外研究现状及优缺点,同时依据不同的分类标准,自底向上逐层级将其归类。第1层级为仅预测深度的单任务方法与同时预测深度及语义等信息的多任务方法。图片的深度和语义等信息关联密切,因此有部分工作研究多任务的联合预测方法。第2层级为绝对深度预测方法与相对深度关系预测方法。绝对深度是指场景中的物体到摄像机的实际距离,而相对深度关注图片中物体的相对远近关系。给定任意图片,人的视觉更擅于判断场景中物体的相对远近关系。第3层级包含有监督回归方法、有监督分类方法及无监督方法。对于单张图片深度估计任务,大部分工作都关注绝对深度的预测,而早期的大多数方法采用有监督回归模型,即模型训练数据带有标签,且对连续的深度值进行回归拟合。考虑到场景由远及近的特性,也有用分类的思想解决深度估计问题的方法。有监督学习方法要求每幅RGB图像都有其对应的深度标签,而深度标签的采集通常需要深度相机或激光雷达,前者范围受限,后者成本昂贵。而且采集的原始深度标签通常是一些稀疏的点,不能与原图很好地匹配。因此不用深度标签的无监督估计方法是研究趋势,其基本思路是利用左右视图,结合对极几何与自动编码机的思想求解深度。  相似文献   

18.
陈宗海  洪洋  王纪凯  葛振华 《机器人》2019,41(2):147-155
提出了一种基于卷积长短期记忆(LSTM)网络和卷积神经网络(CNN)的单目视觉里程计方法,命名为LSTMVO(LSTM visual odometry).LSTMVO采用无监督的端到端深度学习框架,对单目相机的6-DoF位姿以及场景深度进行同步估计.整个网络框架包含位姿估计网络以及深度估计网络,其中位姿估计网络是以端到端方式实现单目位姿估计的深度循环卷积神经网络(RCNN),由基于卷积神经网络的特征提取和基于循环神经网络(RNN)的时序建模组成,深度估计网络主要基于编码器和解码器架构生成稠密的深度图.同时本文还提出了一种新的损失函数进行网络训练,该损失函数由图像序列之间的时序损失、深度平滑度损失和前后一致性损失组成.基于KITTI数据集的实验结果表明,通过在原始单目RGB图像上进行训练,LSTMVO在位姿估计精度以及深度估计精度方面优于现有的主流单目视觉里程计方法,验证了本文提出的深度学习框架的有效性.  相似文献   

19.
环境感知是自动驾驶汽车落地的关键技术之一,它对于提高自动驾驶汽车的安全性和可靠性至关重要.三维目标检测是其中的一项核心任务,旨在识别和定位三维空间中的物体,为后续决策提供重要的信息.点云和图像是该任务最常用的输入数据,点云由三维空间中不规则分布的点组成,而图像则是由二维空间上规则分布的像素组成.因此,点云和图像之间难以进行有效的融合.而伪点云作为一种点云表征的图像信息,近几年受到了该领域学者的广泛关注.现阶段基于伪点云的三维目标检测方法还存在伪点云特征提取粗糙和相应感兴趣区域(Region-of-Intersts, Ro I)特征表征能力差的问题.本文针对上述问题开展研究,分别提出细粒度注意力卷积和多尺度分组稀疏卷积.细粒度注意力卷积将规则图像处理中常用的深度可分离卷积引入不规则点云的处理流程,并在此基础上嵌入通道和分组注意力机制,进行精细的特征提取,增强伪点云特征;多尺度分组稀疏卷积将格网池化后的Ro I特征分组,进行差异化特征学习,获取不同尺度的Ro I特征,增强伪点云Ro I格网特征的表征能力.基于此,本文在SFD(Sparse Fuse Dense)网络的伪点云特征提取流程中引...  相似文献   

20.
针对当前基于深度信息的虚实遮挡处理技术面临的实时性差和精度低的问题,提出一种基于局部区域深度估计和基于patch相似性噪声点投票融合的实时虚实遮挡处理算法.该算法将真实场景视频序列作为输入,首先利用局部区域深度估计算法通过稀疏重建估算出稀疏关键点的深度信息,对稀疏深度施加目标区域的约束限制深度向周围像素的传播,从而快速...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号