基于FPGA的深度学习目标检测系统的设计与实现 |
| |
引用本文: | 陈辰,严伟,夏珺,柴志雷.基于FPGA的深度学习目标检测系统的设计与实现[J].电子技术应用,2019,45(8). |
| |
作者姓名: | 陈辰 严伟 夏珺 柴志雷 |
| |
作者单位: | 江南大学物联网工程学院,江苏无锡,214122;北京大学软件与微电子学院,北京,102600 |
| |
摘 要: | 针对当前深度学习目标检测算法计算复杂度高和内存需求大等问题,设计并实现了一种基于FPGA的深度学习目标检测系统。设计对应YOLOv2-Tiny目标检测算法的硬件加速器,对加速器各模块的处理时延建模,给出卷积计算模块的详细设计。实验结果表明,与CPU相比,CPU+FPGA的异构系统是双核ARM-A9能效的67.5倍,Xeon的94.6倍;速度是双核ARM-A9的84.4倍,Xeon的5.5倍左右。并且,当前设计在性能上超过之前的工作。
|
关 键 词: | 深度学习 目标检测 FPGA 硬件加速器 |
Design and implementation of FPGA-based deep learning object detection system |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|