基于Octave卷积的混合精度神经网络量化方法 |
| |
作者姓名: | 张文烨 尚方信 郭浩 |
| |
作者单位: | 1. 中国人民大学 信息学院, 北京 100872;2. 山西虚拟现实产业技术研究院有限公司, 太原 030024;3. 太原理工大学 信息与计算机学院, 太原 030024 |
| |
基金项目: | 国家自然科学基金资助项目(61672374)。 |
| |
摘 要: | 浮点数位宽的深度神经网络需要大量的运算资源,这导致大型深度神经网络难以在低算力场景(如边缘计算)上部署.为解决这一问题,提出一种即插即用的神经网络量化方法,以压缩大型神经网络的运算成本,并保持模型性能指标不显著下降.首先,基于Octave卷积将输入特征图的高频和低频成分进行分离;其次,分别对高低频分量应用不同位宽的卷积...
|
关 键 词: | 深度神经网络 模型量化 模型压缩 卷积神经网络 深度学习 |
收稿时间: | 2020-07-27 |
修稿时间: | 2020-09-18 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《计算机应用》浏览原始摘要信息 |
|
点击此处可从《计算机应用》下载全文 |
|