融合 CNN 和 Transformer 的机器人室内场景识别 Robot indoor scene recognition based on fusion of CNN and Transformer期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

融合 CNN 和 Transformer 的机器人室内场景识别

引用本文：	刘铁,段勇.融合 CNN 和 Transformer 的机器人室内场景识别[J].电子测量与仪器学报,2023,37(5):223-229.

作者姓名：	刘铁段勇

作者单位：	1.沈阳工业大学信息科学与工程学院

基金项目：	辽宁省高等学校优秀科技人才支持计划(LR15045)、辽宁省教育厅科学研究经费面上项目(LJKZ0139)资助

摘要：	为了提高机器人在复杂的室内环境中场景识别的准确率，本文提出一种融合卷积神经网络(convolutional neural network, CNN)和视觉Transformer结构的机器人室内场景识别模型。本文模型利用CNN提取场景局部特征，然后使用视觉Transformer结构捕捉特征中远距离依赖关系，其中提出的视觉Transformer结构包括3个部分，分别是特征编码结构(Attention Embedding)、Encoder结构和一个将高层语义特征转化成像素级特征的结构(Attention Project)。本文研究的机器人场景识别模型利用CNN提高视觉Transformer局部细节特征的描述能力，同时通过视觉Transformer帮助CNN构建远距离特征的依赖关系，从而能够有效的表征和利用机器人工作场景图像的视觉特征。最后，通过机器人在实际工作环境中采集的数据集和开源的COLD数据集进行实验，验证了本文研究模型的有效性，场景识别精度更高。
关键词：	CNN Transformer 机器人场景识别局部特征
Robot indoor scene recognition based on fusion of CNN and Transformer

Liu Tie,Duan Yong.Robot indoor scene recognition based on fusion of CNN and Transformer[J].Journal of Electronic Measurement and Instrument,2023,37(5):223-229.

Authors:	Liu Tie Duan Yong

Affiliation:	1.School of Information Science and Engineering, Shenyang University of Technology

Abstract:

Keywords:	CNN Transformer robot scene recognition local feature

	点击此处可从《电子测量与仪器学报》浏览原始摘要信息
	点击此处可从《电子测量与仪器学报》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏