基于ZCU102 DSP的CNN卷积运算加速方法 |
| |
引用本文: | 苗鑫,周欢欢,陆栋洵.基于ZCU102 DSP的CNN卷积运算加速方法[J].自动化技术与应用,2022(12):64-67. |
| |
作者姓名: | 苗鑫 周欢欢 陆栋洵 |
| |
摘 要: | 本文提出设计了一种在ZCU102平台上加速卷积神经网络(CNN)卷积运算的方法,使用1个DSP IP实现卷积操作中1个int8类型或者unit8类型输入特征图像数据和2个int8类型卷积核参数的乘法运算。卷积运算是卷积神经网络的基本操作,提高卷积运算并行度可使卷积运算速率提升一倍。8-bit卷积神经网络量化技术是设计实现的基础,减少了处理器(PS)数据传输带宽需求。ZCU102 MPSoC的可编程逻辑(PL)资源较少,充分利用DSP IP资源可降低逻辑资源需求,提升逻辑资源利用率,增加SoC系统设计灵活性。
|
关 键 词: | ZCU102 DSP IP 人工智能 卷积神经网络 8-bit量化 |
|
|