首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
深度估计是一种从单张或者多张图像预测场景深度信息的技术,是计算机视觉领域非常热门的研究方向,在三维重建、场景理解、环境感知等任务中起到了关键作用.当前深度估计技术可以分为多目深度估计和单目深度估计.因为单目摄像头具有成本低、设备较普及、图像获取方便等优点,与多目深度估计技术相比,从单目图像估计深度信息是当前更为热门和更具挑战的技术.近年来,随着深度学习的迅速发展,基于深度学习的单目深度估计方法被广泛研究.本文对基于深度估计的单目深度估计方法进行综述,首先给出单目深度估计问题的定义、介绍常用于训练的数据集与模型评价指标,然后根据不同的训练方式对国内外相关技术进行分析总结,将现有方法分为基于监督学习、无监督学习和半监督学习三大类,对每种类型方法的产生思路、优缺点进行详细分析,最后梳理、总结该技术的发展趋势与关键技术.  相似文献   

2.
针对无人机对目标的识别定位与跟踪,本文提出了一种基于深度学习的多旋翼无人机单目视觉目标识别跟踪方法,解决了传统的基于双目摄像机成本过高以及在复杂环境下识别准确率较低的问题。该方法基于深度学习卷积神经网络的目标检测算法,使用该算法对目标进行模型训练,将训练好的模型加载到搭载ROS的机载电脑。机载电脑外接单目摄像机,单目摄像头检测目标后,自动检测出目标在图像中的位置,通过采用一种基于坐标求差的优化算法进行目标位置准确获取,然后将目标位置信息转化为控制无人机飞行的期望速度和高度发送给飞控板,飞控板接收到机载电脑发送的跟踪指令,实现对目标物体的跟踪。试验结果验证了该方法可以很好的进行目标识别并实现目标追踪  相似文献   

3.
针对复杂场景中的驾驶安全问题,文章为了能解决这一问题提出一种方法研究,运用深度学习的相关理论知识为研究背景,对驾驶车辆前方的车辆通过测量其速度和距离的方法进行智能危险监控。在研究过程中,首先,结合YOLOv5和DeepSort算法在Pytorch框架上进行训练,其中,本文针对DeepSort算法进行改进,改进主要针对ReID模块的结构网络层进行加深,训练效果的过拟合度有明显改善,并且也有效解决了遮挡问题,使得对前方车辆的检测和跟踪效果更佳,获得了较为准确的空间位置信息,此外,文章还运用单目视觉这一测量方法,对车辆的距离和速度进行实时的检测,从而有效解决驾驶安全问题。  相似文献   

4.
王艺均  冯勇  刘明  刘念伯 《软件学报》2024,35(3):1485-1501
高效的移动充电调度是构建长生命期、可持续运行的无线可充电传感器网络(WRSN)的关键之一.现有基于强化学习的充电策略只考虑了移动充电调度问题的一个维度,即移动充电器(MC)的路径规划,而忽略了充电调度问题中的另一维度,即充电时长调整,因而仍然存在性能限制.提出一种基于深度强化学习的WRSN动态时空充电调度方法(SCSD),建立充电序列调度和充电时长动态调整的深度强化学习模型.针对移动充电调度中离散的充电序列规划和连续的充电时长调整问题,使用DQN为待充电节点优化充电序列,并基于DDPG计算并动态调整序列中待充电节点的充电时长.通过分别从空间和时间两个维度的优化,在避免节点缺电失效的同时,所提出的SCSD可实现充电性能的有效提高.大量仿真实验结果表明,SCSD与现有的几种有代表性的充电方案相比,其充电性能具有明显的优势.  相似文献   

5.
深度学习单目深度估计研究进展   总被引:1,自引:0,他引:1       下载免费PDF全文
单目深度估计是从单幅图像中获取场景深度信息的重要技术,在智能汽车和机器人定位等领域应用广泛,具有重要的研究价值。随着深度学习技术的发展,涌现出许多基于深度学习的单目深度估计研究,单目深度估计性能也取得了很大进展。本文按照单目深度估计模型采用的训练数据的类型,从3个方面综述了近年来基于深度学习的单目深度估计方法:基于单图像训练的模型、基于多图像训练的模型和基于辅助信息优化训练的单目深度估计模型。同时,本文在综述了单目深度估计研究常用数据集和性能指标基础上,对经典的单目深度估计模型进行了性能比较分析。以单幅图像作为训练数据的模型具有网络结构简单的特点,但泛化性能较差。采用多图像训练的深度估计网络有更强的泛化性,但网络的参数量大、网络收敛速度慢、训练耗时长。引入辅助信息的深度估计网络的深度估计精度得到了进一步提升,但辅助信息的引入会造成网络结构复杂、收敛速度慢等问题。单目深度估计研究还存在许多的难题和挑战。利用多图像输入中包含的潜在信息和特定领域的约束信息,来提高单目深度估计的性能,逐渐成为了单目深度估计研究的趋势。  相似文献   

6.
张午阳  章伟  宋芳  龙林 《计算机应用》2019,39(4):1001-1005
针对无人机避障问题,提出一种基于深度学习的四旋翼无人机单目视觉避障方法。首先通过目标检测框选出目标在图像中的位置,并通过计算目标选框上下边距的长度,以此来估量出障碍物到无人机之间的距离;然后通过协同计算机判断是否执行避障动作;最后使用基于Pixhawk搭建的飞行实验平台进行实验。实验结果表明,该方法可用于无人机低速飞行条件下避障。该方法所用到的传感器只有一块单目摄像头,而且相对于传统的主动式传感器避障方法,所占用无人机的体积大幅减小。该方法鲁棒性较好,能够准确识别不同姿态的人,实现对人避障。  相似文献   

7.
针对电动汽车充电口视觉定位系统存在的配置成本高、图像处理算法复杂、环境适应性差等问题,提出了一种基于超声波测距的充电口位姿测量系统。首先对基于超声波的充电口位姿的测量技术进行了研究,然后对充电口的超声位姿重构进行了分析,采用了多点位超声融合的关键技术,最终实现了电动汽车充电口位姿的测量。实验结果表明测距模块在300~1200mm范围内测距精度可达±0.2959mm,位姿测量系统定位精度可达±1.5mm、±2.4°。经实际应用发现该系统具有较强的鲁棒性,达到了传统视觉定位装置的效果,满足了电动汽车充电口位姿测量的工程需求。  相似文献   

8.
人工智能和自动驾驶的发展如火如荼,人工智能技术在自动驾驶技术中的应用也越来越多、越来越深入,因此本文提出一种基于深度强化学习的单目视觉自动驾驶决策系统,可以让自动驾驶车辆通过相机作为传感器输入,实现端到端的自动驾驶决策,并且通过设置奖励函数和训练使得车辆的学习效率越来越高,可以在车道内保持直线行驶。  相似文献   

9.
场景的深度估计问题是计算机视觉领域中的经典问题之一,也是3维重建和图像合成等应用中的一个重要环节。基于深度学习的单目深度估计技术高速发展,各种网络结构相继提出。本文对基于深度学习的单目深度估计技术最新进展进行了综述,回顾了基于监督学习和基于无监督学习方法的发展历程。重点关注单目深度估计的优化思路及其在深度学习网络结构中的表现,将监督学习方法分为多尺度特征融合的方法、结合条件随机场(conditional random field,CRF)的方法、基于序数关系的方法、结合多元图像信息的方法和其他方法等5类;将无监督学习方法分为基于立体视觉的方法、基于运动恢复结构(structure from motion,SfM)的方法、结合对抗性网络的方法、基于序数关系的方法和结合不确定性的方法等5类。此外,还介绍了单目深度估计任务中常用的数据集和评价指标,并对目前基于深度学习的单目深度估计技术在精确度、泛化性、应用场景和无监督网络中不确定性研究等方面的现状和面临的挑战进行了讨论,为相关领域的研究人员提供一个比较全面的参考。  相似文献   

10.
自主驾驶矿井机车需要实时检测和定位行驶前方的巷道行人,激光雷达等非视觉类方法成本高昂,而传统基于特征提取视觉类方法无法解决井下光照差且光线不均匀的问题。提出一种基于深度学习的井下巷道行人视觉定位算法。首先给出基于深度学习网络的系统整体结构;其次,搭建目标检测多层卷积神经网络(CNN),生成自主驾驶机车前方视野范围内行人的二维坐标及边界框的尺寸;再次,通过多项式拟合计算出图像中行人到机车之间的第三维距离;最后通过真实样本集实施模型训练、验证与测试。实验结果表明,所提算法的检测准确率达94%,速度达每秒25帧,测距误差小于4%,实现了实时高效的巷道行人视觉定位。  相似文献   

11.
视觉目标检测旨在定位和识别图像中存在的物体,属于计算机视觉领域的经典任务之一,也是许多计算机视觉任务的前提与基础,在自动驾驶、视频监控等领域具有重要的应用价值,受到研究人员的广泛关注。随着深度学习技术的飞速发展,目标检测取得了巨大的进展。首先,本文总结了深度目标检测在训练和测试过程中的基本流程。训练阶段包括数据预处理、检测网络、标签分配与损失函数计算等过程,测试阶段使用经过训练的检测器生成检测结果并对检测结果进行后处理。然后,回顾基于单目相机的视觉目标检测方法,主要包括基于锚点框的方法、无锚点框的方法和端到端预测的方法等。同时,总结了目标检测中一些常见的子模块设计方法。在基于单目相机的视觉目标检测方法之后,介绍了基于双目相机的视觉目标检测方法。在此基础上,分别对比了单目目标检测和双目目标检测的国内外研究进展情况,并展望了视觉目标检测技术发展趋势。通过总结和分析,希望能够为相关研究人员进行视觉目标检测相关研究提供参考。  相似文献   

12.
姚红革  张玮  杨浩琪  喻钧 《自动化学报》2023,49(5):1089-1098
为了模拟人眼的视觉注意机制, 快速、高效地搜索和定位图像目标, 提出了一种基于循环神经网络(Recurrent neural network, RNN)的联合回归深度强化学习目标定位模型. 该模型将历史观测信息与当前时刻的观测信息融合, 并做出综合分析, 以训练智能体快速定位目标, 并联合回归器对智能体所定位的目标包围框进行精细调整. 实验结果表明, 该模型能够在少数时间步内快速、准确地定位目标.  相似文献   

13.
本文提出了一种新的基于深度负相关学习的WiFi室内定位模型.通过负相关学习约束,多个学习器能学习到不同的表征特性,从而有效降低模型的过拟合,并极大地提升其泛化能力.同时该模型将负相关学习方法应用到去噪自编码器和回归预测器上,并利用深度学习方法使其很好地适应随环境和时间变化的RSSI信号,提高了在长时间间隔内的定位性能.利用负相关学习方法使定位模型在初始时候的平均定位误差从1.57 m下降为0.77 m,60 d平均定位误差也仅为0.89 m,误差仅仅只增加0.12 m,验证了负相关学习能够削弱环境变化对定位的影响.  相似文献   

14.
针对人体运动目标的实时检测与定位问题,采用深度学习的方法进行研究.在Caffe框架下,采用SSD (Single Shot multibox Detector)检测方法.以VGG16作为基础网络模型,增加额外特征卷积层,提取多尺度的卷积特征.然后对实验数据集进行迭代训练,得到运动目标检测模型.利用训练好的模型,通过2路摄像机检测运动目标,并双目视觉定位.实验结果表明,整个系统运行速度可达40 fps,在10 m×10 m的场景下,平均定位误差在6 cm以内,在速度和精度上均有很好的表现,为大中型场景的人体运动实时检测定位问题提供了有效的解决方案.  相似文献   

15.
视觉跟踪是计算机视觉的重要研究领域之一。传统的视觉跟踪算法难以很好地解决复杂背景中的跟踪问题,如光线变化、目标发生较大的尺寸和姿态变化或目标被遮挡等。而深度学习的引入为视觉跟踪研究开辟了新的途径。但目前国内外基于深度学习的视觉跟踪研究文献相对较少,为 吸引更多视觉跟踪领域研究者对深度学习进行探索和讨论,并推动视觉跟踪算法的研究,简要介绍了视觉跟踪和深度学习的研究现状,重点分析了基于深度学习的视觉跟踪算法的相关文献,讨论了各算法的优缺点,最后提出了进一步研究的方向以及对基于深度学习的视觉跟踪算法的展望。  相似文献   

16.
针对现有的基于车牌字符分割的车牌识别方法,在光照,阴暗等特定自然场景下存在无法定位且车牌字符无法正确分割,直接影响车牌字符识别效果的问题,提出一种基于深度学习的车牌定位和识别方法.首先采用深度学习FasterR-CNN算法进行车牌定位,利用k-means++算法来选择最佳车牌区域尺寸,解决现有车牌定位方法在某些自然场景下无法正确定位车牌的问题;然后在AlexNet网络模型的基础上进行改进和重新构建,提出一种增强的卷积神经网络模型AlexNet-L,该模型是一种针对车牌字符识别的端对端网络模型,可提高车牌识别准确率,避免现有的基于车牌字符分割的车牌识别方法中因无法正确分割车牌字符对车牌字符识别的影响.实验结果表明,该方法可以更有效地提高车牌定位和车牌字符识别的准确度和效率.  相似文献   

17.
18.
利用单目深度估计辅助飞行器超低空飞行的制导与控制是一个非常重要的发展方向。基于此在自监督学习框架下研究了一种基于单目图像的超低空景深估计方法:以立体图像对为训练集,采用左右一致性原则,有效提高网络准确率,并通过多尺度统一,改善了深度图中的空洞问题。在KITTI数据集和自制的超低空样本集上的实验结果表明论文所提方法能有效应用于超低空场景下的深度估计。  相似文献   

19.
杨奕  曹桂梅  李海啸 《传感技术学报》2023,36(12):1835-1844
在电动车无线充电系统中,接收线圈位置检测是判断车辆是否进入有效充电区域的关键,而基于传感器的接收线圈位置检测大多会对车辆结构进行二次改造,且存在难以适应各类车型,受限于磁耦合机构,以及影响发射线圈工作等问题。为此,提出一种利用车载系统现有逆变器与接收线圈实现偏移度估算的辅助线圈结构及其定位与方向引导方法。首先,设计3U型辅助线圈结构以适应不同定位高度需求和避免影响发射线圈工作。其次,依据该机构介入下的典型磁耦合器的磁场特性,分析对应等值互感特征轨迹,并提出相应定位与方向引导方法以辅助接收线圈进入有效充电区域。最后,经实验验证,所提出的3U型辅助线圈适用于多种典型磁耦合机构,其定位高度与精度最大值分别为250mm与10mm,且当接收线圈分别为方形和DD型时,最大可识别范围分别达到300mm×400mm和400mm×300mm。  相似文献   

20.
基于视觉的目标定位技术的研究进展   总被引:1,自引:0,他引:1  
赵霞  袁家政  刘宏哲 《计算机科学》2016,43(6):10-16, 43
基于视觉的目标定位是目前计算机视觉领域的研究热点。就现阶段基于视觉的定位技术进行了综述,着重介绍了基于单目视觉定位、基于双目视觉定位和基于全景视觉定位3类定位技术的研究现状,并分析了各自的优缺点。最后就基于视觉定位方法的发展趋势做了简要分析,以期为以后基于视觉定位问题的研究提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号