首页 | 本学科首页   官方微博 | 高级检索  
     

基于循环神经网络的双目视觉物体6D位姿估计
引用本文:杨恒,李卓,康忠元,田兵,董青.基于循环神经网络的双目视觉物体6D位姿估计[J].浙江大学学报(自然科学版 ),2023(11):2179-2187.
作者姓名:杨恒  李卓  康忠元  田兵  董青
作者单位:1. 太原科技大学机械工程学院;2. 重庆市农业机械化学校机械工程学院
摘    要:针对当前物体6D位姿估计任务准确率较低的问题,提出双目数据集制作方法及物体6D位姿估计网络Binocular-RNN.将YCB-Video Dataset中已有图像作为双目相机左摄像头捕获内容,利用Open GL将YCB-Video Dataset中相应三维物体模型进行导入,输入各物体相关参数,由虚拟双目相机右摄像头捕获合成图片.利用单目预测网络分别对双目数据集中左、右图像的几何特征进行提取.经过循环神经网络对几何特征进行融合,并预测物体6D位姿.以模型点平均距离(ADD)、平均最近点距离(ADDS)、平移误差和角度误差作为评价指标,对Binocular-RNN与其他位姿估计方法进行对比.结果表明,在利用单一物体对网络进行训练时,Binocular-RNN的ADD或ADDS指标得分分别为PoseCNN、GDR-Net的2.66、1.15倍.利用基于物理的实时渲染(Real+PBR)方式训练的Binocular-RNN的性能超过基于深度神经网络的迭代6D姿态匹配的方法 (DeepIM).

关 键 词:6D位姿  单目视觉  主动视觉  循环神经网络  YCB-Video数据集
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号