首页 | 本学科首页   官方微博 | 高级检索  
     

基于FPGA的CNN应用加速技术
作者单位:;1.华北计算技术研究所
摘    要:FPGA(现场可编程门阵列)作为人工智能应用的新加速载体,可替GPU对人工智能应用推理阶段进行加速。文中提出了一种新的人工智能应用加速方案,利用定点、矩阵压缩等方法对卷积神经网络(CNN)模型进行处理,优化CNN网络模型,并设计开发一套驱动软件框架以适配国产平台。该技术在飞腾1500A国产服务器上对卷积神经网络中的人脸识别与目标检测应用进行加速,运算性能较目前国产服务器运算能力提升30倍以上,实现自主可控的人工智能应用加速。

关 键 词:计算机应用技术  深度学习  国产服务器  现场可编程门阵列  卷积神经网络

An acceleration technique for CNN application based on FPGA
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号