首页 | 本学科首页   官方微博 | 高级检索  
     

基于FPGA的卷积神经网络加速器
作者单位:;1.浙江大学电气工程学院;2.杭州电子科技大学电子信息学院
摘    要:现有软件实现方案难以满足卷积神经网络对运算性能与功耗的要求。为此,设计一种基于现场可编程门阵列(FPGA)的卷积神经网络加速器。在粗粒度并行层面对卷积运算单元进行并行化加速,并使用流水线实现完整单层运算过程,使单个时钟周期能够完成20次乘累加,从而提升运算效率。针对MNIST手写数字字符识别的实验结果表明,在75 MHz的工作频率下,该加速器可使FPGA峰值运算速度达到0.676 GMAC/s,相较通用CPU平台实现4倍加速,而功耗仅为其2.68%。

关 键 词:卷积神经网络  现场可编程门阵列  加速器  流水线  并行化

FPGA-based Accelerator for Convolutional Neural Network
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号