面向道路场景语义分割的移动窗口变换神经网络设计 |
| |
引用本文: | 杭昊,黄影平,张栩瑞,罗鑫.面向道路场景语义分割的移动窗口变换神经网络设计[J].光电工程,2024(1):108-121. |
| |
作者姓名: | 杭昊 黄影平 张栩瑞 罗鑫 |
| |
作者单位: | 上海理工大学光电信息与计算机工程学院 |
| |
基金项目: | 国家自然科学基金资助项目(62276167)~~; |
| |
摘 要: | 道路场景语义分割是自动驾驶环境感知的一项重要任务。近年来,变换神经网络(Transformer)在计算机视觉领域开始应用并取得了很好的效果。针对复杂场景图像语义分割精度低、细小目标识别能力不足等问题,本文提出了一种基于移动窗口Transformer的多尺度特征融合的道路场景语义分割算法。该网络采用编码-解码结构,编码器使用改进后的移动窗口Transformer特征提取器对道路场景图像进行特征提取,解码器由注意力融合模块和特征金字塔网络构成,充分融合多尺度的语义特征。在Cityscapes城市道路场景数据集上进行验证测试,实验结果表明,与多种现有的语义分割算法进行对比,本文方法在分割精度方面有较大的提升。
|
关 键 词: | 语义分割 移动窗口变换神经网络 注意力机制 自动驾驶 深度学习 |
|
|