首页 | 本学科首页   官方微博 | 高级检索  
     

基于Transformer的多尺度物体检测
引用本文:侯越千,张丽红.基于Transformer的多尺度物体检测[J].测试技术学报,2023(4):342-347.
作者姓名:侯越千  张丽红
作者单位:山西大学物理电子工程学院
摘    要:目前,Transformer基本模型对同一场景内不同尺寸物体的检测能力不足,其主要原因为各层等尺度的输入嵌入无法提取跨尺度特征,导致网络不具备在不同尺度的特征之间建立交互的能力。基于此,提出一种基于Transformer的多尺度物体检测网络,该网络采用跨尺度嵌入层初步对图像特征进行嵌入处理;利用多分支空洞卷积对输入进行下采样,通过调整并行分支的膨胀率使该结构具有多样的感受野;然后,由残差自注意力模块对输出嵌入结果进行处理,为特征图的局部和全局信息构建联系,使注意力计算融入有效的多尺度语义信息,最终实现多尺度物体检测。模型在COCO等数据集上进行训练,实验结果表明该方法与其他物体检测方法相比具有显著优势。

关 键 词:物体检测  多尺度  Transformer  注意力机制  空洞卷积
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号