Transformer与多尺度注意力的自监督单目图像深度估计 |
| |
引用本文: | 梁水波,刘紫燕,孙昊堃,袁浩,梁静.Transformer与多尺度注意力的自监督单目图像深度估计[J].小型微型计算机系统,2023(4):825-831. |
| |
作者姓名: | 梁水波 刘紫燕 孙昊堃 袁浩 梁静 |
| |
作者单位: | 贵州大学大数据与信息工程学院 |
| |
基金项目: | 贵州省科学技术基金项目(黔科合基础[2016]1054)资助;;贵州省科技计划项目(黔科合SY字[2011]3111)资助; |
| |
摘 要: | 针对现有自监督学习的单目图像深度估计在分辨率较大情况下存在边缘模糊、物体轮廓不清晰等问题,本文提出一种结合视觉Transformer的多尺度通道注意力融合单目图像深度估计网络.首先,设计编码器-解码器模型,将视觉Transformer结构作为编码器在多个尺度上提取特征.其次,设计残差通道注意力融合的解码器,优化提取到的多尺度特征并实现上下级特征融合以提高上下文信息的利用率.最后,在多个尺度下对单目图像进行深度估计.本文提出的算法在KITTI数据集上进行实验.实验结果表明,所提出算法的深度图像质量和物体轮廓信息均高于现有算法,其绝对相对误差、平方相对误差和均方根误差分别达到了0.119、0.857和4.571,在不同阈值下的准确度达到了0.959、0.995和0.999,验证了所提算法的正确性和有效性.
|
关 键 词: | 深度学习 单目图像深度估计 Transformer 自监督学习 通道注意力 |
|
|