位置敏感Transformer航拍图像目标检测模型期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

位置敏感Transformer航拍图像目标检测模型

引用本文：	李大湘,辛嘉妮,刘颖.位置敏感Transformer航拍图像目标检测模型[J].光学精密工程,2024,32(05):727-739.DOI：10.37188/OPE.20243205.0727

作者姓名：	李大湘辛嘉妮刘颖

作者单位：	.西安邮电大学通信与信息工程学院,陕西西安 710121

基金项目：	国家自然科学基金资助项目（No.62071379）;;陕西省自然科学基金资助项目（No.2019JM-604）;

摘要：	针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测（PS-TOD）模型。设计了一个基于位置通道嵌入三维注意力（PCE3DA）的多尺度特征融合（MSFF）模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力（PSSA）机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型（DETR）相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。
关键词：	目标检测无人机图像位置敏感Transformer 多尺度特征融合注意力机制
收稿时间：	2023-05-30
修稿时间：	2023-07-15

	点击此处可从《光学精密工程》浏览原始摘要信息
	点击此处可从《光学精密工程》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏