首页 | 本学科首页   官方微博 | 高级检索  
     

基于FPGA的Skynet网络结构优化及高时效实现
作者姓名:唐维伟  钟胜  卢金仪  颜露新  谭富中  邹旭  徐文辉
作者单位:华中科技大学人工智能与自动化学院,湖北武汉430074;华中科技大学多谱信息处理技术国家级重点实验室,湖北武汉430074
基金项目:国家自然科学基金(No.61806081);;国防基础科研计划资助(No.JCKY2018204B068)~~;
摘    要:基于卷积神经网络(Convolutional Neural Network,CNN)的目标检测算法有着鲁棒性强、准确度高等优点,被广泛用于计算机视觉任务领域.然而,CNN参数量大、计算量大的特性使得其难以在边缘计算平台实时实现,为此,本文针对目标检测网络Skynet进行结构优化,并基于高效的层内并行流水的加速架构,在现场可编程门阵列(Field Programmable Gate Array,FPGA)上对其进行实时实现.该方法对Skynet进行剪枝,合并其卷积层与归一化层,利用(Kullback-Leibler,KL)相对熵及极大值量化方法对权重及特征图进行8 bit定点量化,同时将偏置参数及缩放系数定点化,并合并激活操作与饱和截断操作,在减少存储量和计算量的同时,加快前向推理速度.此外,以滑窗操作为基础,采用通道及像素并行计算,设计深度可分离卷积的流水策略,将串行的前向推理结构优化为并行流水的结构,极大减少了前向推理的时间.实验表明,在UA-DETRAC数据集上,本文实现的系统识别精度为0.752,在160×160的图像分辨率上,速度达到115FPS,与CPU相比,提速11倍,达到...

关 键 词:目标检测网络  定点量化  现场可编程门阵列  流水计算  skynet
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号