基于YOLOv8的煤矿井下人员不安全动作检测算法 |
| |
引用本文: | 陈 伟,江志成,田子建,等. 基于YOLOv8的煤矿井下人员不安全动作检测算法[J]. 煤炭科学技术,2024,52(S2):267−283. DOI: 10.12438/cst.2023-1772 |
| |
作者姓名: | 陈伟 江志成 田子建 张帆 刘毅 |
| |
作者单位: | 1.中国矿业大学(北京) 人工智能学院, 北京 100083;2.煤矿智能化与机器人创新应用应急管理部重点实验, 北京 100083;3.中国矿业大学 计算机科学与技术学院, 江苏 徐州, 221116 |
| |
基金项目: | 国家自然基金资助项目(52274160);国家自然科学基金委员会-山西省人民政府煤基低碳联合基金资助项目(U1510115) |
| |
摘 要: |  煤矿井下复杂环境中存在干扰信息、低照明度以及机械设备遮挡等问题,使得现有的目标检测算法在进行人员异常动作检测任务时,算法的速度和精度都存在一系列挑战。为解决现有的目标检测模型计算复杂、参数量大、推理时间长以及特征提取困难等问题,提出了1种改进的YOLOv8l方法,称为MAC-YOLO。MAC-YOLO模型通过替换原有基线模型中的卷积为感受野注意卷积(RFAConv),允许模型可以根据输入数据复杂性和重要性动态调整感受野权重,解决标准卷积运算中的参数共享问题,使得网络可以更有效地捕捉和利用图像中的信息。同时在基线模型中引入了高效多尺度注意力(EMA)模块,能够融合不同尺度的上下文信息,且在卷积运算时不进行通道降维的情况下学习到有效的通道描述,使模型能够对高级特征图产生更好的像素级关注。该模型也能捕获跨维度交互并建立维度之间的依赖关系,使得神经元巨大的局部感受野能高效获得更清晰的多尺度特征,降低了图像中干扰因素的影响,进一步提升了模型对目标特征的聚焦能力,有助于模型高效地进行卷积操作提取煤矿井下人员的异常动作,提高模型的检测精度。 此外,引入边界框回归的损失函数(${L_{{\mathrm{MPDIoU}}}}$),直接最小化预测框和真实框左上点和右下点之间的距离,解决了原有损失函数存在预测框和真实框长宽比相同(值不同)时模型无法有效优化的问题,加快了模型的收敛速度同时提升定位精度。在降低模型计算复杂性、网络结构复杂性以及增强网络灵活性方面,使用了slim-neck设计范式对基线模型的颈部进行改造,通过GSbottleneck模块增强网络处理特征的能力,利用 GSConv模块堆叠提高模型的学习能力,其中的VoV-GSCSP模块提高了特征利用效率和网络性能。实验结果显示,在特定场景的煤矿工人动作数据集(MACD)上,相比基线模型YOLOv8l,MAC-YOLO的mAP@0.5和mAP@0.5:0.95分别提升了1.9%和3.6%,且FPS值为81 ms。这表明MAC-YOLO模型在保持良好检测精度的同时,也满足了实时性和轻量化模型的需求,展示了高灵活性、准确性和效率。此外,还通过消融实验证明了各个改进模块对提升模型性能的有效性。

|
关 键 词: | 人员异常动作检测 YOLOv8l 模型轻量化 EMA MPDIoU损失 |
收稿时间: | 2023-11-23 |
|
| 点击此处可从《煤炭科学技术》浏览原始摘要信息 |
|
点击此处可从《煤炭科学技术》下载全文 |
|