首页 | 本学科首页   官方微博 | 高级检索  
     

融合 CNN 和 Transformer 的机器人室内场景识别
引用本文:刘 铁,段 勇.融合 CNN 和 Transformer 的机器人室内场景识别[J].电子测量与仪器学报,2023,37(5):223-229.
作者姓名:刘 铁  段 勇
作者单位:1.沈阳工业大学信息科学与工程学院
基金项目:辽宁省高等学校优秀科技人才支持计划(LR15045)、辽宁省教育厅科学研究经费面上项目(LJKZ0139)资助
摘    要:为了提高机器人在复杂的室内环境中场景识别的准确率,本文提出一种融合卷积神经网络(convolutional neural network, CNN)和视觉Transformer结构的机器人室内场景识别模型。本文模型利用CNN提取场景局部特征,然后使用视觉Transformer结构捕捉特征中远距离依赖关系,其中提出的视觉Transformer结构包括3个部分,分别是特征编码结构(Attention Embedding)、Encoder结构和一个将高层语义特征转化成像素级特征的结构(Attention Project)。本文研究的机器人场景识别模型利用CNN提高视觉Transformer局部细节特征的描述能力,同时通过视觉Transformer帮助CNN构建远距离特征的依赖关系,从而能够有效的表征和利用机器人工作场景图像的视觉特征。最后,通过机器人在实际工作环境中采集的数据集和开源的COLD数据集进行实验,验证了本文研究模型的有效性,场景识别精度更高。

关 键 词:CNN  Transformer  机器人  场景识别  局部特征

Robot indoor scene recognition based on fusion of CNN and Transformer
Liu Tie,Duan Yong.Robot indoor scene recognition based on fusion of CNN and Transformer[J].Journal of Electronic Measurement and Instrument,2023,37(5):223-229.
Authors:Liu Tie  Duan Yong
Affiliation:1.School of Information Science and Engineering, Shenyang University of Technology
Abstract:
Keywords:CNN  Transformer  robot  scene recognition  local feature
点击此处可从《电子测量与仪器学报》浏览原始摘要信息
点击此处可从《电子测量与仪器学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号