基于FPGA的卷积神经网络加速器 FPGA-based Accelerator for Convolutional Neural Network期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于FPGA的卷积神经网络加速器

作者单位：	;1.浙江大学电气工程学院;2.杭州电子科技大学电子信息学院

摘要：	现有软件实现方案难以满足卷积神经网络对运算性能与功耗的要求。为此,设计一种基于现场可编程门阵列(FPGA)的卷积神经网络加速器。在粗粒度并行层面对卷积运算单元进行并行化加速,并使用流水线实现完整单层运算过程,使单个时钟周期能够完成20次乘累加,从而提升运算效率。针对MNIST手写数字字符识别的实验结果表明,在75 MHz的工作频率下,该加速器可使FPGA峰值运算速度达到0.676 GMAC/s,相较通用CPU平台实现4倍加速,而功耗仅为其2.68%。
关键词：	卷积神经网络现场可编程门阵列加速器流水线并行化
FPGA-based Accelerator for Convolutional Neural Network

Abstract:

Keywords: