首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 671 毫秒
1.
席林  孙韶媛  李琳娜  邹芳喻 《激光与红外》2012,42(11):1311-1315
提出一种通过非线性学习模型来估计单目红外图像深度的算法。该算法首先通过逐步线性回归和独立成分分析(ICA)寻找对于红外图像深度相关性较强的特征,然后以具有核函数的非线性支持向量机(SVM)为模型基础,采用监督学习的方法对红外图像深度特征进行回归分析并训练,在训练过程中通过已知数据回归后的最小均方误差对模型参数进行修正,训练后的模型可对单目红外图像的深度分布进行估计。实验结果证明,利用该模型能较一致地估计单目红外图像的深度信息。  相似文献   

2.
图像深度信息获取是机器视觉领域的活跃研究课题之一.将图像深度估计问题归结为模式识别问题,以单目图像深度为模式类,在多尺度下从图像块中提取绝对和相对深度特征,并选择表征上下文关系的DRF(Discriminative Random Field)方法来表述某图像块的深度和其邻域深度之间的关系,从而构建起基于DRF-MAP(Maximum a posteriori)的单目图像深度估计模型.通过实验,得到了一类单目图像对应的深度图像,从而证明了单目图像深度估计模型对应的改进算法的有效性.  相似文献   

3.
速度与方向的决策建议是夜间无人车驾驶研究的关键,针对夜间无人车速度与方向决策,基于红外图像与雷达信息,提出了一种包含深度信息的红外图像多任务分类网络用来给出速度与方向决策.通过红外摄像头及雷达采集的数据训练深度网络,其中雷达采集的深度图像作为训练标签,采用卷积-反卷积神经网络来进行红外图像的深度估计,进而获得深度信息.利用深度信息制作分类网络训练标签,通过AlexNet分类网络得到速度决策建议.再根据红外图像的道路信息训练方向分类网络,将无人车的驾驶决策问题转化为分类模型,并将分类模型与深度估计网络相结合.实验结果表明,网络的角度准确率及速度准确率分别为87.43%和85.89%,并且利用训练得到的模型对图像进行决策的时间为0.04 s/帧,能够达到实时性的要求。  相似文献   

4.
具有深度视觉感的车载红外图像彩色化方法   总被引:1,自引:0,他引:1  
提出了一种实现具有深度视觉感的车载红外图像彩色化的方法,对车载红外图像采用区域生长分割算法进行景物分类,分为天空、树木和道路,再分别对每一景物估计深度,然后根据得出的深度信息再结合景物的色彩先验知识,实现具有深度视觉感的红外图像彩色化。实验结果显示该方法能够得到较接近真实的深度和色彩视觉效果。  相似文献   

5.
本文针对单目深度估计模型深度序数回归算法中全图像编码器易丢失较大像素值像素特征信息和位置信息的缺点,提出一种基于CBAM的深度序数回归方法.首先,将CBAM嵌入到深度序数回归算法中作为全图像编码器,依次采用通道注意力机制和空间注意力机制来捕获图像完整的特征信息和位置信息,通过获得的注意力图重新调整原始特征;其次,对像素的深度值进行离散,将深度估计重新转化为序数回归问题;最后,使用回归损失函数对网络进行训练.实验结果表明,相比于其他有监督学习、半监督学习和无监督学习的方法,该方法在KITTI数据集上取得更好的效果.  相似文献   

6.
张聪  马燕新  万建伟  许可  徐国权 《信号处理》2022,38(11):2332-2341
现有单目深度估计(Monocular depth estimation)算法存在细节估计不准确、同一平面距离估计错误的问题。深度信息是通过图像像素的三通道信息估计出来的,目前已有的算法中很少考虑特征图通道之间的相互关系对深度信息的影响。因此本文提出了一种SE-DenseDepth网络,在网络的编码器中嵌入通道注意力机制,依据不同通道对深度信息的贡献度差异,对通道进行编码,提高编码器对图像特征的表征能力。为了获得图像精细的深度信息,网络建立编码器到解码器的跳连接,引入了更多的低层信息。本文在通用室内数据集NYU-Depth V2上训练,并在真实数据上测试。实验结果表明,本文提出的方法在深度突然变化的细节区域表现更好,在远距离大平面的情况下不会出现深度的断层,与其他主流算法相比可以获得较好的深度估计性能。   相似文献   

7.
深度卷积神经网络(Deep Convolution Neural Network, DCNN)在人脸识别、图像分类和目标检测领域已取得较好效果,并得到广泛应用;但是,在人脸美丽预测中却存在拟合效果欠佳、网络训练难度大等问题。深度PCANet模型,将深度主元分析网络(Principal Component Analysis Network,PCANet)作为特征提取器;采用无监督预训练提取网络参数,具有网络训练时间短、图像特征提取快等特点,能有效避免DCNN存在的问题。为此,本文将深度PCANet引入人脸美丽预测,对训练集图像采用多尺度预处理,训练深度PCANet。该模型可提取人脸图像的结构性全局特征,采用特征增强方法可生成更具表征能力的特征;运用线性支持向量机(Support Vector Machine, SVM)和随机森林(Random Forest, RF)回归器进行训练和预测。基于SCUT-FBP人脸美丽数据库的实验结果表明,深度PCANet模型具有结构简单、特征提取快和无需网络调参优化等特点;选择合适的图像尺度与采用特征增强方法可提高人脸美丽评价结果,证明了所提方法的有效性和可行性。   相似文献   

8.
针对从单目视觉图像中估计深度信息时存在的预测精度不够准确的问题,该文提出一种基于金字塔池化网络的道路场景深度估计方法。该方法利用4个残差网络块的组合提取道路场景图像特征,然后通过上采样将特征图逐渐恢复到原始图像尺寸,多个残差网络块的加入增加网络模型的深度;考虑到上采样过程中不同尺度信息的多样性,将提取特征过程中各种尺寸的特征图与上采样过程中相同尺寸的特征图进行融合,从而提高深度估计的精确度。此外,对4个残差网络块提取的高级特征采用金字塔池化网络块进行场景解析,最后将金字塔池化网络块输出的特征图恢复到原始图像尺寸并与上采样模块的输出一同输入预测层。通过在KITTI数据集上进行实验,结果表明该文所提的基于金字塔池化网络的道路场景深度估计方法优于现有的估计方法。  相似文献   

9.
廖莎莎 《红外与激光工程》2022,51(5):20210372-1-20210372-6
红外成像是现代战场侦察的重要手段,基于红外图像的目标识别技术可为情报解译提供重要支撑。针对红外图像目标识别,提出基于筛选深度特征的方法。设计适当结构的ResNet对红外图像进行特征学习,对于每个卷积层的输出特征图进行矢量化处理,获得相应的特征矢量。针对各个特征图的深度特征矢量,基于斯皮尔曼等级相关系数评价它们与原始图像的相关性。然后,通过门限判决算法选取若干具有高相关性的深度特征。经过筛选得到的深度特征可剔除了不必要的冗余成分,从而提升后续分类的精度和稳健性。采用联合稀疏表示模型对筛选得到的若干深度特征进行表征和分类,最终获取待识别样本的所属类别。因此,方法可有效结合ResNet多层次深度特征的鉴别力,从而提高最终的识别性能。实验在公开的中波红外目标图像数据集(MWIR)开展,利用原始测试样本、模拟噪声样本和模拟遮挡样本对方法性能进行测试和分析。实验结果表明:相比现有的部分红外目标识别方法,提出方法可取得更强的有效性和稳健性。  相似文献   

10.
基于深度学习的红外遥感信息自动提取   总被引:1,自引:0,他引:1  
陈睿敏  孙胜利 《红外》2017,38(8):37-43
为了提高红外遥感图像地物 信息自动提取的精确性,同时避免人工提取遥感 信息的低效性,提出了一种基于UNet深度学习模型 的遥感信息提取算法。该算法用于从红外遥感图像中分割 出5类地物信息(包括道路、建筑、树木、农田和水 体)。首先,对分辨率高但数量较少的训练数 据进行小像幅的随机裁剪,并对其进行相应的数据增 强处理。然后搭建UNet深度学习模型,并用它 自动提取遥感图像的特征信息。采用交叉熵损失函数 以及Adam反向传播优化算法对该模型进行训练,并对测 试样本中的5幅遥感图像进行精确的地物信息提取。最后,运 用Jaccard指数对测试结果进行精度评定。实验结果表明,该 方法对高分辨率红外遥感图像信息和可见光 遥感图像信息进行了充分融合,对于不同种类地物 的定位和分类都取得了较高精度。  相似文献   

11.
热成像能够反映场景的温度分布,对热成像进行深度估计,可以恢复出场景的三维温度场,在故障诊断、夜视导航等领域具有重要意义。本文提出一种面向单目热成像深度估计的非参深度采样方法。为了克服热像纹理缺乏、轮廓模糊的缺点,使用了空间金字塔匹配(Spatial Pyramid Matching,SPM)来进行热像的特征分析。首先,基于SPM特征匹配,从数据库中筛选出与待估计深度的热像具有相似场景的候选热像;然后,采用SIFT Flow变形算法对候选热像的深度图进行采样,并将深度信息传递给待估计的热像。实验结果表明,这种方法能够对单目热像进行有效的深度估计,与同类算法相比具有明显优势。  相似文献   

12.
In recent years, the research method of depth estimation of target images using Convolutional Neural Networks (CNN) has been widely recognized in the fields of artificial intelligence, scene understanding and three-dimensional (3D) reconstruction. The fusion of semantic segmentation information and depth estimation will further improve the quality of acquired depth images. However, how to deeply combine image semantic information with image depth information and use image edge information more accurately to improve the accuracy of depth image is still an urgent problem to be solved. For this purpose, we propose a novel depth estimation model based on semantic segmentation to estimate the depth of monocular images in this paper. Firstly, a shared parameter model of semantic segmentation information and depth estimation information is built, and the semantic segmentation information is used to guide depth acquisition in an auxiliary way. Then, through the multi-scale feature fusion module, the feature information contained in the neural network on different layers is fused, and the local feature information and global feature information are effectively used to generate high-resolution feature maps, so as to achieve the goal of improving the quality of depth image by optimizing the semantic segmentation model. The experimental results show that the model can fully extract and combine the image feature information, which improves the quality of monocular depth vision estimation. Compared with other advanced models, our model has certain advantages.  相似文献   

13.
基于单目视觉的无人机障碍探测算法研究   总被引:1,自引:0,他引:1  
针对低空飞行无人机的避障问题,研究了一种基于单目视觉的障碍物深度提取算法。在无人机前视摄像机获取的图像中,通过Harris角点检测算法提取角点作为特征点,使用归一化互相关算法进行角点的匹配,根据图像序列中特征点间距离的变化和无人机的运动计算障碍物的深度。对用于单个障碍物深度计算方法进行了改进,使用RANSAC算法区分不同深度的障碍物。仿真表明,该算法可以有效发现并区分不同深度的障碍物。  相似文献   

14.
单目图像序列光流三维重建技术研究综述   总被引:2,自引:0,他引:2       下载免费PDF全文
张聪炫  陈震  黎明 《电子学报》2016,44(12):3044-3052
由单目图像序列光流重建物体或场景的三维运动与结构是计算机视觉、图像处理与模式识别等领域的重要研究内容,在机器人视觉、无人机导航、车辆辅助驾驶以及医学影像分析等方面具有重要的应用。本文首先从精度与鲁棒性等方面对单目图像序列光流计算及三维重建技术近年来取得的进展进行综述与分析。然后采用Middlebury测试图像序列对HS、LDOF、CLG-TV、SOF、AOFSCNN 和 Classic +NL 等典型光流算法以及 Adiv、RMROF、Sekkati 和DMDPOF等基于光流的间接与直接重建方法进行实验对比分析,指出各对比方法的优点与不足,归纳各类方法的性能特点与适用范围。最后对利用分数阶微分模型、非局部约束、立体视觉以及深度线索解决亮度突变、非刚性运动、运动遮挡与模糊情况下光流计算及重建模型的局限性与鲁棒性问题进行总结与展望。  相似文献   

15.
赵霖  赵滟  靳捷 《信号处理》2022,38(5):1088-1097
自监督单目深度估计在自动驾驶、智能制造等领域有着广泛的应用。然而由于自监督训练存在大量训练噪声,其估计精度受到了极大限制。针对自监督单目深度估计算法中深度估计精度有限的问题,本文提出了一种基于局部注意力机制和迭代调优的自监督单目深度估计框架。首先,对于深度估计网络,基于局部像素间深度值的高度相关性,本文设计了一种局部注意力机制来融合高分辨率特征图的局部特征,提升深度估计的准确性;其次,对于位姿估计网络,本文设计了一种迭代调优的位姿估计结构,利用残差优化的方式降低位姿估计难度,提升位姿估计的准确性进而提升深度估计网络的性能。实验表明,本文提出的改进自监督单目深度估计算法有效提升了深度估计的精度。   相似文献   

16.
光在水下传播时由于受到水体吸收和散射作用的影响,导致水下图像质量严重退化。为了有效去除色偏和模糊,改善水下图像质量,该文提出一种基于背景光修正成像模型的水下图像复原方法。该方法基于对雾天图像的观察,提出了水下图像背景光偏移假设,并基于此建立背景光修正成像模型;随后使用单目深度估计网络获得场景深度的估计,并结合背景光修正的水下成像模型,利用非线性最小二乘拟合获得水下偏移分量的估计值从而实现水下图像去水;最后优化去水后的含雾图像的透射率,并结合修正后的背景光实现图像复原。实验结果表明,该文方法在恢复水下图像颜色和去除散射光方面效果良好。  相似文献   

17.
以空间非合作飞行器视觉位姿测量为背景,针对近距离及超近距离情况下由于成像空间小、像机视场等限制,位姿测量所用的视觉特征将不能在单像机中完整成像而无法完成定位的问题,提出一种多像机非共视场的非合作飞行器位姿测量方法。首先将多个像机配置成非共视场的形式,标定各个像机之间的位置关系;然后利用多个像机对目标上的不同特征成像,来自不同像机的底层信息既有冗余又有互补,为位姿测量提供足够的视觉特征和几何特征;最后结合像机之间的位置关系将各个像机中的特征信息进行融合,进而以闭式解法计算目标位姿。实验结果验证了该方法的有效性以及在大目标近距离位姿测量应用中的优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号