首页 | 本学科首页   官方微博 | 高级检索  
     

基于知识蒸馏的目标检测模型增量深度学习方法
引用本文:方维维,陈爱方,孟娜,程虎威,王清立. 基于知识蒸馏的目标检测模型增量深度学习方法[J]. 四川大学学报(工程科学版), 2022, 54(6): 59-66
作者姓名:方维维  陈爱方  孟娜  程虎威  王清立
作者单位:北京交通大学,北京交通大学,北京交通大学,北京交通大学,北京交通大学
基金项目:国家自然科学基金(62172031);北京市自然科学基金-丰台轨道交通前沿研究联合基金资助项目(L191019)
摘    要:随着万物互联时代的到来,具备目标检测能力的物联网设备数量呈爆炸式增长。基于此,网络边缘产生了海量的实时数据,具有低时延、低带宽成本和高安全性特点的边缘计算随之成为一种新兴的计算模式。传统的深度学习方法通常假定在模型训练前所有数据已完全具备,然而实际的边缘计算场景中大量的新数据及类别往往随时间逐渐产生和获得。为了在训练数据成批积累和更新的条件下在资源有限的边缘设备上高效率地完成目标检测任务,本文提出了基于多中间层知识蒸馏的增量学习方法(Incremental Learning method based on knowledge distillation of Multiple Intermediate Layers,ILMIL)。首先为了能够适当地保留原有数据中的知识,提出了包含多个网络中间层知识的蒸馏指标(Multi-layer Feature map、RPN and RCN Knowledge,MFRRK)。ILMIL将教师模型和学生模型的中间层特征的差异加入模型训练,相比于现有的基于知识蒸馏方法的增量学习,采用ILMIL方法训练的学生模型可以从教师模型的中间层学习到更多的旧类信息来缓解遗忘;其次ILMIL利用MFRRK蒸馏知识完成现有模型的增量训练,避免训练使用多个独立模型带来的资源开销;为进一步降低模型复杂度以高效地在边缘设备上部署推理,可在知识蒸馏前进行剪枝操作来压缩现有模型。通过在不同场景和条件下的实验对比,本文方法可在有效降低模型计算和存储开销的前提下,缓解已有知识的灾难性遗忘现象,并维持可接受的推理精度。

关 键 词:目标检测  边缘计算  增量学习  知识蒸馏  模型压缩
收稿时间:2021-09-14
修稿时间:2022-11-02

Incremental Deep Learning Method for Object Detection Model Based on Knowledge Distillation
FANG Weiwei,CHEN Aifang,MENG N,CHENG Huwei,WANG Qingli. Incremental Deep Learning Method for Object Detection Model Based on Knowledge Distillation[J]. Journal of Sichuan University (Engineering Science Edition), 2022, 54(6): 59-66
Authors:FANG Weiwei  CHEN Aifang  MENG N  CHENG Huwei  WANG Qingli
Affiliation:School of Computer and Information Technology,Beijing Jiaotong Univ.,School of Computer and Information Technology,Beijing Jiaotong Univ.,School of Computer and Information Technology,Beijing Jiaotong Univ.,School of Computer and Information Technology,Beijing Jiaotong Univ.,School of Computer and Information Technology,Beijing Jiaotong Univ.
Abstract:
Keywords:object detection  edge computing  incremental learning  knowledge distillation  model compression
点击此处可从《四川大学学报(工程科学版)》浏览原始摘要信息
点击此处可从《四川大学学报(工程科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号