共查询到20条相似文献,搜索用时 15 毫秒
1.
基于单幅图像的物体三维重建是计算机视觉领域的一个重要问题,近几十年来得到了广泛的关注.随着深度学习的不断发展,近年来基于单幅图像的物体三维重建取得了显著进展.本文对深度学习在基于单幅图像的物体三维重建领域的研究进展及具体应用进行了综述.首先介绍了基于单幅图像的三维重建的研究背景及其传统方法的研究现状,其次简要介绍了深度学习并详细综述了深度学习在基于单幅图像的物体三维重建中的应用,随后简要概述了三维物体重建的常用公共数据集,最后进行了分析与总结,指出了目前存在的问题及未来的研究方向. 相似文献
2.
深度估计是一种从单张或者多张图像预测场景深度信息的技术,是计算机视觉领域非常热门的研究方向,在三维重建、场景理解、环境感知等任务中起到了关键作用.当前深度估计技术可以分为多目深度估计和单目深度估计.因为单目摄像头具有成本低、设备较普及、图像获取方便等优点,与多目深度估计技术相比,从单目图像估计深度信息是当前更为热门和更具挑战的技术.近年来,随着深度学习的迅速发展,基于深度学习的单目深度估计方法被广泛研究.本文对基于深度估计的单目深度估计方法进行综述,首先给出单目深度估计问题的定义、介绍常用于训练的数据集与模型评价指标,然后根据不同的训练方式对国内外相关技术进行分析总结,将现有方法分为基于监督学习、无监督学习和半监督学习三大类,对每种类型方法的产生思路、优缺点进行详细分析,最后梳理、总结该技术的发展趋势与关键技术. 相似文献
3.
多视角图像生成即基于某个视角图像生成其他多个视角图像, 是多视角展示和虚拟现实目标建模等领域的基本问题, 已引起研究人员的广泛关注. 近年来, 生成对抗网络(Generative adversarial network, GAN)在多视角图像生成任务上取得了不错的成绩, 但目前的主流方法局限于固定领域, 很难迁移至其他场景, 且生成的图像存在模糊、失真等弊病. 为此本文提出了一种基于混合对抗生成网络的多视角图像生成模型ViewGAN, 它包括多个生成器和一个多类别判别器, 可灵活迁移至多视角生成的多个场景. 在ViewGAN中, 多个生成器被同时训练, 旨在生成不同视角的图像. 此外, 本文提出了一种基于蒙特卡洛搜索的惩罚机制来促使每个生成器生成高质量的图像, 使得每个生成器更专注于指定视角图像的生成. 在DeepFashion, Dayton, ICG Lab6数据集上的大量实验证明: 我们的模型在Inception score和Top-k accuracy上的性能优于目前的主流模型, 并且在结构相似性(Structural similarity, SSIM)上的分数提升了32.29%, 峰值信噪比(Peak signal-to-noise ratio, PSNR)分数提升了14.32%, SD (Sharpness difference)分数提升了10.18%. 相似文献
4.
计算机视觉是计算机领域研究的热门方向,而三维重建在计算机视觉方面具有很高的研究价值.近年来,随着深度学习、人工智能不断的发展,基于深度学习的单视图三维重建工作受到大量学者的关注.介绍了基于深度学习的单视图三维重建的三种常用方法、三维重建工作常用数据集和其具体的应用领域,并对基于深度学习的单视图三维重建进行了小结与展望. 相似文献
5.
视觉跟踪是计算机视觉的重要研究领域之一。传统的视觉跟踪算法难以很好地解决复杂背景中的跟踪问题,如光线变化、目标发生较大的尺寸和姿态变化或目标被遮挡等。而深度学习的引入为视觉跟踪研究开辟了新的途径。但目前国内外基于深度学习的视觉跟踪研究文献相对较少,为 吸引更多视觉跟踪领域研究者对深度学习进行探索和讨论,并推动视觉跟踪算法的研究,简要介绍了视觉跟踪和深度学习的研究现状,重点分析了基于深度学习的视觉跟踪算法的相关文献,讨论了各算法的优缺点,最后提出了进一步研究的方向以及对基于深度学习的视觉跟踪算法的展望。 相似文献
6.
医学影像分割是计算机视觉在医学影像处理中的一个重要应用领域,其目标是从医学影像中分割出目标区域,为后续的疾病诊断和治疗提供有效的帮助.近年来深度学习技术在图像处理方面取得了巨大进展,基于深度学习的医学影像分割算法逐渐成为该领域研究的重点和热点.叙述了计算机视觉下的医学影像分割任务及其难点,重点综述了基于深度学习的医学影... 相似文献
7.
双目立体匹配是计算机视觉领域的经典问题,在自动驾驶、遥感、机器人感知等诸多任务中得到广泛应用。双目立体匹配的主要目标是寻找双目图像对中同名点的对应关系,并利用三角测量原理恢复图像深度信息。近年来,基于深度学习的立体匹配方法在匹配精度和匹配效率上均取得了远超传统方法的性能表现。将现有基于深度学习的立体匹配方法分为非端到端方法和端到端方法。基于深度学习的非端到端方法利用深度神经网络取代传统立体匹配方法中的某一步骤,根据被取代步骤的不同,该类方法被分为基于代价计算网络、基于代价聚合网络和基于视差优化网络的3类方法。基于深度学习的端到端方法根据代价体维度的不同可分为基于3D代价体和基于4D代价体的方法。从匹配精度、时间复杂度、应用场景等多个角度对非端到端和端到端方法中的代表性成果进行分析,并归纳各类方法的优点以及存在的局限性。在此基础上,总结基于深度学习的立体匹配方法当前面临的主要挑战并展望该领域未来的研究方向。 相似文献
8.
单幅图像超分辨率(Single image super-resolution, SISR)重建是计算机视觉领域上的一个重要问题, 在安防视频监控、飞机航拍以及卫星遥感等方面具有重要的研究意义和应用价值. 近年来, 深度学习在图像分类、检测、识别等诸多领域中取得了突破性进展, 也推动着图像超分辨率重建技术的发展. 本文首先介绍单幅图像超分辨率重建的常用公共图像数据集; 然后, 重点阐述基于深度学习的单幅图像超分辨率重建方向的创新与进展; 最后, 讨论了单幅图像超分辨率重建方向上存在的困难和挑战, 并对未来的发展趋势进行了思考与展望. 相似文献
9.
弱光图像增强旨在使隐藏在黑暗中的信息可见,以提高图像质量,在夜间目标检测和行为识别等计算机视觉任务中广泛应用。首先,从有监督和无监督两个角度出发,梳理了基于深度学习的弱光图像增强代表性算法,结合实现原理分析了其优缺点。其次,总结了常用的训练数据集和测试数据集。最后,讨论了目前已有算法存在的问题和未来可能的发展趋势。 相似文献
10.
基于SFM算法的三维人脸模型重建 总被引:5,自引:0,他引:5
提出了一种根据两幅正面人脸图像和一幅侧面图像重建人脸三维模型的算法,该算法主要包括4个步骤:寻找匹配点;采用SFM算法计算出特征点的三维坐标,并组成稀疏的三维网格结构;采用分步紧支撑径向基函数进行三维插值,得到三维模型;最后根据多分辨图像拼接算法生成纹理图像并将其映射到三维模型上,从而增强真实感,与其它算法相比,该算法最大的不同之处在于匹配点的寻找,匹配点的准确与否直接影响SFM算法结果的正确性,许多寻找匹配点的算法如角点匹配算法,在处理人脸图像时得到的结果并不稳定,这是因为人脸图像上包含了许多低纹理和重复纹理区域,大多数算法将代表人脸结构基本特征的基准模型运用在重建过程的最后一步,通过三维逼近运算,得到最终的重建模型,而该算法将反映人脸共性特征的几何对称性和规律性运用到匹配点的寻找中,能够快速准确地找出SFM算法需要的匹配点,用户使用普通照相机拍摄到的图像经本算法的处理后就可以得到相应的三维人脸结构。 相似文献
11.
基于景物散焦图像的距离测量 总被引:2,自引:0,他引:2
计算机视觉中,景物三维重建的关键是从景物的图像中计算出景物目标到摄像机的距离,提出了一种基于散焦图像计算景物距离的新方法。该方法利用远心光学镜头拍摄景物图像,通过改变像检测到镜头的距离获得同一景物的两幅散焦程度不同的图像,将获得灰度图像转换成梯度图像。利用矩不变原理计算梯度图像中边缘区的大小与整个图像匹配大小的比Pe,根据两幅图像的Pe值计算出景物的深度。实验结果表明了该方法的有效性,并对该方法产生的误差进行了分析。 相似文献
12.
基于深度学习的目标检测算法研究综述 总被引:1,自引:0,他引:1
传统的目标检测算法主要依赖于人工选取的特征来对物体进行检测。人工提取的特征对主要针对某些特定对象,比如有的特征适合做边缘检测,有的适合做纹理检测,不具有普遍性。近年来,深度学习蓬勃发展,在计算机视觉领域比如图像分类、目标检测、图像语义分割等方面取得了重大的进展。深度学习作为一种特征学习方法能够自动学习到目标的有用特征,避免了人工提取特征,同时能够保证良好的检测效果。本文首先介绍基于深度学习的目标检测算法研究进展,其次总结目标检测算法中常见的难题与解决措施,最后对目标检测算法的可能发展方向进行展望。 相似文献
13.
针对无人机对目标的识别定位与跟踪,本文提出了一种基于深度学习的多旋翼无人机单目视觉目标识别跟踪方法,解决了传统的基于双目摄像机成本过高以及在复杂环境下识别准确率较低的问题。该方法基于深度学习卷积神经网络的目标检测算法,使用该算法对目标进行模型训练,将训练好的模型加载到搭载ROS的机载电脑。机载电脑外接单目摄像机,单目摄像头检测目标后,自动检测出目标在图像中的位置,通过采用一种基于坐标求差的优化算法进行目标位置准确获取,然后将目标位置信息转化为控制无人机飞行的期望速度和高度发送给飞控板,飞控板接收到机载电脑发送的跟踪指令,实现对目标物体的跟踪。试验结果验证了该方法可以很好的进行目标识别并实现目标追踪 相似文献
14.
基于数字轮廓图像的水果体积估计 总被引:1,自引:0,他引:1
在分析比较各种可能的技术方案的基础上,本文提出基于水果轮廓特征的人工神经网络估计方法,并建立了特征库。实验结果表明,该方法优于Miuer和Marchant的方法,并且不同的特征对不同水果的体积估计的影响是不同的。 相似文献
15.
基于深度学习的多目标跟踪算法是目前动态视觉领域的热门研究方向之一,对于动态多目标识别等问题的解决表现出极大的优势.单目标跟踪算法就目前而言相对比较成熟,研究热点逐渐向多目标跟踪,尤其是在线多目标跟踪问题转移.对比介绍传统目标跟踪算法与深度学习多目标跟踪算法,对今后多目标跟踪算法发展的趋势进行思考. 相似文献
16.
深度学习理论在计算机视觉中的应用日趋广泛,在目标分类、检测领域取得了令人瞩目的成果,但是深度学习理论在目标跟踪领域的早期应用中,由于存在跟踪时只有目标为正样本,缺乏数据支持,对位置信息依赖程度高等问题,因而应用效果并不理想,传统方法仍占据主流地位.近年来,随着技术的不断发展,深度学习在目标跟踪方向取得了长足的进步.本文首先介绍了目标跟踪技术的基本概念和主要方法,然后针对深度学习在目标跟踪领域的发展现状,从基于深度特征的目标跟踪和基于深度网络的目标跟踪两方面重点阐述了深度学习在该领域的应用方法,并对近期较为流行的基于孪生网络的目标跟踪进行了详细介绍.最后对近年来深度学习在目标跟踪领域取得的成果,以及未来的发展方向作了总结和展望. 相似文献
17.
针对复杂场景中的驾驶安全问题,文章为了能解决这一问题提出一种方法研究,运用深度学习的相关理论知识为研究背景,对驾驶车辆前方的车辆通过测量其速度和距离的方法进行智能危险监控。在研究过程中,首先,结合YOLOv5和DeepSort算法在Pytorch框架上进行训练,其中,本文针对DeepSort算法进行改进,改进主要针对ReID模块的结构网络层进行加深,训练效果的过拟合度有明显改善,并且也有效解决了遮挡问题,使得对前方车辆的检测和跟踪效果更佳,获得了较为准确的空间位置信息,此外,文章还运用单目视觉这一测量方法,对车辆的距离和速度进行实时的检测,从而有效解决驾驶安全问题。 相似文献
18.
基于深度学习的目标检测算法综述 总被引:2,自引:0,他引:2
传统目标检测算法大多基于滑动窗口和人工特征提取,存在计算复杂度高和在复杂场景下鲁棒性差的缺点。近年来,研究人员将深度学习技术应用于目标检测领域,显著提高了算法性能。相比传统算法,基于深度学习的目标检测算法具有速度快、准确性高和在复杂条件下鲁棒性强的优点。从评价指标、公开数据集、传统算法框架等方面对目标检测任务进行阐述,按照是否存在显式的区域建议和是否定义先验锚框两种分类标准,对现有基于深度学习的目标检测算法进行分类,分别介绍算法的演进路线并总结算法机制、优势、局限性及适用场景。在此基础上,分析对比代表性算法在公开数据集中的表现,并对基于深度学习的目标检测的未来研究方向进行展望。 相似文献
19.
单目深度估计是从单幅图像中获取场景深度信息的重要技术,在智能汽车和机器人定位等领域应用广泛,具有重要的研究价值。随着深度学习技术的发展,涌现出许多基于深度学习的单目深度估计研究,单目深度估计性能也取得了很大进展。本文按照单目深度估计模型采用的训练数据的类型,从3个方面综述了近年来基于深度学习的单目深度估计方法:基于单图像训练的模型、基于多图像训练的模型和基于辅助信息优化训练的单目深度估计模型。同时,本文在综述了单目深度估计研究常用数据集和性能指标基础上,对经典的单目深度估计模型进行了性能比较分析。以单幅图像作为训练数据的模型具有网络结构简单的特点,但泛化性能较差。采用多图像训练的深度估计网络有更强的泛化性,但网络的参数量大、网络收敛速度慢、训练耗时长。引入辅助信息的深度估计网络的深度估计精度得到了进一步提升,但辅助信息的引入会造成网络结构复杂、收敛速度慢等问题。单目深度估计研究还存在许多的难题和挑战。利用多图像输入中包含的潜在信息和特定领域的约束信息,来提高单目深度估计的性能,逐渐成为了单目深度估计研究的趋势。 相似文献
20.
随着人工智能技术的发展,深度学习技术在人脸识别、行人检测、无人驾驶等领域得到了广泛的应用.而目标检测作为机器视觉中最基本、最具有挑战性的问题之一,近年来受到了广泛的关注.针对目标检测特别是小目标检测问题,归纳了常用的数据集和性能评价指标,并对各类常见数据集的特点、优势及检测难度进行对比,系统性地总结了常用的目标检测方法... 相似文献