首页 | 本学科首页   官方微博 | 高级检索  
     

用于深度学习训练加速的自适应框架设计
引用本文:范涛,樊平,成元庆.用于深度学习训练加速的自适应框架设计[J].计算机辅助设计与图形学学报,2021,33(6):974-982.
作者姓名:范涛  樊平  成元庆
作者单位:北京航空航天大学集成电路科学与工程学院 北京 100191;北京深维科技有限公司 北京 100191
摘    要:用FPGA加速深度学习算法的训练过程通常需要较长的开发周期和丰富的硬件设计经验.为了应对这一挑战,设计了一种基于自适应模板技术的深度学习算法训练加速框架,在应用规模、并行调度策略、资源使用和功能扩展上进行了深入的研究并提出了相应的优化策略.采用CPU-FPGA异构加速模板技术,提出了自适应的上层模型编译框架实现与不同硬件加速资源的适配.这种基于定制模板的软硬件协同设计可以很好地适配不同的FPGA芯片并支持算法的快速迭代.用图神经网络算法数据进行加速对比实验,实现了与CPU相比7~41倍的速度提升.

关 键 词:深度学习  图神经网络  异构加速器  现场可编程门阵列

Template-Based Adaptive Training Acceleration Framework for Deep Learning Algorithms
Fan Tao,Fan Ping,Cheng Yuanqing.Template-Based Adaptive Training Acceleration Framework for Deep Learning Algorithms[J].Journal of Computer-Aided Design & Computer Graphics,2021,33(6):974-982.
Authors:Fan Tao  Fan Ping  Cheng Yuanqing
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号