基于改进的YOLOv4模型的行人检测算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于改进的YOLOv4模型的行人检测算法

引用本文：	巨志勇,李玉明,薛永杰,叶雨新,赖颖.基于改进的YOLOv4模型的行人检测算法[J].控制工程,2023(10):1912-1926.

作者姓名：	巨志勇李玉明薛永杰叶雨新赖颖

作者单位：	上海理工大学光电信息与计算机工程学院

基金项目：	国家自然科学基金资助项目(81101116)；

摘要：	为提高行人检测算法在实际应用中的准确率，提出在YOLOv4模型中融合Vision Transformer模型与深度可分离卷积的vit-YOLOv4模型。该模型将Vision Transformer模型加入YOLOv4模型的主干特征提取网络与空间金字塔池化层中，充分发挥该模型的多头注意力机制对图像特征进行预处理的能力；同时，用深度可分离卷积替换路径聚合网络中堆叠后的常规卷积，以便模型在后续的特征提取中能够提取出更多有用的特征。实验结果表明，vit-YOLOv4模型提高了行人检测的准确率，降低了漏检率，综合性能较优。
关键词：	行人检测 YOLOv4 Vision Transformer 深度可分离卷积多头注意力机制