基于BWDSP众核的CNN计算任务划分优化 |
| |
作者姓名: | 王改 郑启龙 邓文齐 杨江平 卢茂辉 |
| |
作者单位: | 中国科学技术大学 计算机科学与技术学院,合肥,230027;中国科学技术大学 计算机科学与技术学院,合肥,230027;中国科学技术大学 计算机科学与技术学院,合肥,230027;中国科学技术大学 计算机科学与技术学院,合肥,230027;中国科学技术大学 计算机科学与技术学院,合肥,230027 |
| |
基金项目: | 国家核高基重大专项(2012ZX01034-001-001) |
| |
摘 要: | 作为深度学习算法之一的卷积神经网络在多个领域有着重要的应用.因为其网络模型的规模和结构比较复杂,数据量较大,故需要考虑降低其对计算资源的要求.一般地,对于大数据量的计算任务,需要使用数据并行的方法进行任务的划分计算,而仅使用数据并行而对计算的任务的特点不加以结合,其数据传输量较高.因此需要通过对CNN网络结构及其计算特性的分析,设计合理的计算任务划分策略,减少数据的传输量.本文首先介绍了深度学习加速器中对计算任务的优化处理,接着介绍BWDSP的众核深度学习加速器的体系架构,并设计计算划分策略,基于VGGNet-16网络模型进行实验对比分析.实验结果表明该优化算法可以显著的提高数据传输的性能,降低数据的传输量.
|
关 键 词: | BWDSP众核架构 数据并行 卷积神经网络 计算任务划分 |
收稿时间: | 2019-02-28 |
修稿时间: | 2019-03-14 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《计算机系统应用》浏览原始摘要信息 |
|
点击此处可从《计算机系统应用》下载免费的PDF全文 |
|