用于深度学习训练加速的自适应框架设计 Template-Based Adaptive Training Acceleration Framework for Deep Learning Algorithms期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

用于深度学习训练加速的自适应框架设计

引用本文：	范涛,樊平,成元庆.用于深度学习训练加速的自适应框架设计[J].计算机辅助设计与图形学学报,2021,33(6):974-982.

作者姓名：	范涛樊平成元庆

作者单位：	北京航空航天大学集成电路科学与工程学院北京 100191;北京深维科技有限公司北京 100191

摘要：	用FPGA加速深度学习算法的训练过程通常需要较长的开发周期和丰富的硬件设计经验.为了应对这一挑战,设计了一种基于自适应模板技术的深度学习算法训练加速框架,在应用规模、并行调度策略、资源使用和功能扩展上进行了深入的研究并提出了相应的优化策略.采用CPU-FPGA异构加速模板技术,提出了自适应的上层模型编译框架实现与不同硬件加速资源的适配.这种基于定制模板的软硬件协同设计可以很好地适配不同的FPGA芯片并支持算法的快速迭代.用图神经网络算法数据进行加速对比实验,实现了与CPU相比7～41倍的速度提升.
关键词：	深度学习图神经网络异构加速器现场可编程门阵列
Template-Based Adaptive Training Acceleration Framework for Deep Learning Algorithms

Fan Tao,Fan Ping,Cheng Yuanqing.Template-Based Adaptive Training Acceleration Framework for Deep Learning Algorithms[J].Journal of Computer-Aided Design & Computer Graphics,2021,33(6):974-982.

Authors:	Fan Tao Fan Ping Cheng Yuanqing

Abstract:

Keywords:
本文献已被 CNKI 万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏