期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郭子博高瑛珂胡航天弓铎刘凯吴宪云《计算机工程与应用》2022,58(6):88-94

具有优越性能的卷积神经网络算法已得到广泛应用,但其参数量大、计算复杂、层间独立性高等特点也使其难以高效地部署在较低功耗和较少资源的边缘场景.为此结合该种算法的特点提出了一种基于混合架构的卷积神经网络计算加速方法,该方法选用CPU加FPGA的混合架构,对网络模型进行了压缩优化;在FPGA上通过指令控制数据流的DSP阵列结... 相似文献

2.

基于误差限制的神经网络混合精度量化方法（特邀）

下载免费PDF全文

李奕铎郭子博刘凯孙逍遥《红外与激光工程》2022,51(4):20220166-1-20220166-8

基于卷积神经网络的深度学习算法展现出卓越性能的同时也带来了冗杂的数据量和计算量,大量的存储与计算开销也成了该类算法在硬件平台部署过程中的最大阻碍。而神经网络模型量化使用低精度定点数代替原始模型中的高精度浮点数,在损失较小精度的前提下可有效压缩模型大小,减少硬件资源开销,提高模型推理速度。现有的量化方法大多将模型各层数据量化至相同精度,混合精度量化则根据不同层的数据分布设置不同的量化精度,旨在相同压缩比下达到更高的模型准确率,但寻找合适的混合精度量化策略仍十分困难。因此,提出一种基于误差限制的混合精度量化策略,通过对神经网络卷积层中的放缩因子进行统一等比限制,确定各层的量化精度,并使用截断方法线性量化权重和激活至低精度定点数,在相同压缩比下,相比统一精度量化方法有更高的准确率。其次,将卷积神经网络的经典目标检测算法YOLOV5s作为基准模型,测试了方法的效果。在COCO数据集和VOC数据集上,该方法与统一精度量化相比,压缩到5位的模型平均精度均值（mean Average Precision, mAP）分别提高了6%和24.9%。相似文献

3.

舰船训练虚拟系统的设计研究

林涛张利郭子博李林橙《计算机仿真》2012,29(1):277-280

在建立虚拟舰船仿真系统的研究中,由于舰船的船舱仪表数量多,船体操控复杂,目前还没有舰船虚拟训练系统。针对舰船训练实际需求,提出一种虚拟仪表和游戏引擎相结合的舰船虚拟训练系统设计思想。借助于Ogre、ODE及数据手套、数据头盔和定位器等虚拟现实设备,建立仿真数据模型,解决了场景中的虚拟手交互、碰撞检测等关键技术问题,完成虚拟手对舰船的实时控制。实验结果表明,仿真系统在保证真实性和快速性的同时,还易于操控等特点,能使用户快速掌握舰船驾驶和仪表操作的基本方法,训练周期缩短60%,大大降低了训练成本。相似文献

4.

一种微指令序列调度数据流的星载卷积神经网络FPGA加速器

郭子博刘凯胡航天李奕铎璩泽旭《计算机学报》2022,(10):2047-2064

卷积神经网络(Convolutional Neural Network,CNN)是目前主流视觉算法不可或缺的关键部分.为提高CNN模型推理速度,学界提出了众多异构加速方法以满足不同场景下的多元加速需求.但如何在资源与能耗受限的在轨卫星上稳定高效地加速CNN仍是极具挑战的课题.为此,本文通过软硬件协同设计,着力优化微指令编码、指令级并行和运算级并行3个加速器设计的关键部分,在星上常见的Xilinx VX690T FPGA芯片上设计实现了一种微指令序列调度数据流的CNN加速器.在软件层面,本文提出一种可扩展的微指令编码格式及相应的编译方法.通过卷积循环分块和算子融合策略实现图级别优化,生成加速器可执行的微指令序列.在硬件层面,本文设计实现了一个由微控制器与逻辑运算器组成的RTL级CNN加速器.微控制器通过粗粒度流水线实现各类指令的并行执行.逻辑运算器通过DSP48E1计算资源级联所构建的计算阵列实现卷积算子的细粒度并行运算.实验结果表明,加速器设计功耗10.68W,在加速YOLOV3Tiny算法时,峰值吞吐率(Runtime Max Throughput,RMT)达到378.63 GOP/... 相似文献