基于改进的YOLOv4模型的行人检测算法 |
| |
引用本文: | 巨志勇,李玉明,薛永杰,叶雨新,赖颖.基于改进的YOLOv4模型的行人检测算法[J].控制工程,2023(10):1912-1926. |
| |
作者姓名: | 巨志勇 李玉明 薛永杰 叶雨新 赖颖 |
| |
作者单位: | 上海理工大学光电信息与计算机工程学院 |
| |
基金项目: | 国家自然科学基金资助项目(81101116); |
| |
摘 要: | 为提高行人检测算法在实际应用中的准确率,提出在YOLOv4模型中融合Vision Transformer模型与深度可分离卷积的vit-YOLOv4模型。该模型将Vision Transformer模型加入YOLOv4模型的主干特征提取网络与空间金字塔池化层中,充分发挥该模型的多头注意力机制对图像特征进行预处理的能力;同时,用深度可分离卷积替换路径聚合网络中堆叠后的常规卷积,以便模型在后续的特征提取中能够提取出更多有用的特征。实验结果表明,vit-YOLOv4模型提高了行人检测的准确率,降低了漏检率,综合性能较优。
|
关 键 词: | 行人检测 YOLOv4 Vision Transformer 深度可分离卷积 多头注意力机制 |
|
|