首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
宋庆增  顾军华 《计算机工程》2011,37(23):214-216
针对传统的通用处理器(GPP)平台上执行稀疏矩阵向量乘计算效率低的问题,提出一种基于可重构计算平台的SpMXV协处理器设计。方案采用二叉树结构高度流水的数据流、IEEE-754的32 bit浮点数数据格式和对角存储格式。数据通路以流水线方式进行组织,能够优化计算性能。仿真结果表明,与GPP平台上的软件实现相比,通过硬件实现的设计能达到最高2.69倍的性能加速。  相似文献   

2.
应用稀疏矩阵压缩存储技术之带行指针向量的链式存储结构,设计基于此链式存储结构的稀疏矩阵的转置算法及相乘算法,以及这些矩阵运算基于C++类模板的具体实现,并对算法的性能进行了分析.  相似文献   

3.
作为Wiedemannn算法的核心部分,稀疏矩阵向量乘是求解二元域上大型稀疏线性方程组的主要步骤。提出了一种基于FPGA的二元域大型稀疏矩阵向量乘的环网硬件系统架构,为解决Wiedemannn算法重复计算稀疏矩阵向量乘,提出了新的并行计算结构。实验分析表明,提出的架构提高了Wiedemannn算法中稀疏矩阵向量乘的并行性,同时充分利用了FPGA的片内存储器和吉比特收发器,与目前性能最好的部分可重构计算PR模型相比,实现了2.65倍的加速性能。  相似文献   

4.
开源指令集架构RISC-V具有高性能、模块化、简易性和易拓展等优势,在物联网、云计算等领域的应用日渐广泛,其向量拓展部分V模块更是很好地支持了矩阵数值计算.稀疏矩阵向量乘法SpM V作为矩阵数值计算的一个重要组成部分,具有深刻的研究意义与价值.利用RISC-V指令集的向量可配置性和寻址特性,分别对基于CSR、ELLPA...  相似文献   

5.
6.
稀疏贝叶斯模型与相关向量机学习研究   总被引:1,自引:0,他引:1  
虽然支持向量机在模式识别的相关领域得到了广泛应用,但它自身固有许多不足之处.相关向量机是在稀疏贝叶斯框架下提出的稀疏模型,模型没有规则化系数,核函数不要求满足Mercer条件.相关向量机不仅具备良好的泛化能力,而且还能够得到具有统计意义的预测结果.首先介绍了稀疏贝叶斯回归和分类模型,通过参数推断过程,将相关向量机学习转化为最大化边缘似然函数估计,并分析了3种估计方法,给出了快速序列稀疏贝叶斯学习算法流程.  相似文献   

7.
稀疏矩阵乘以一个向量(SpM×V)的问题是许多大型应用问题的核心计算问题,文中提出了一种在并行计算机上并行计算SpMXV的负载平衡算法,计算复杂性为O(N)(N为稀疏矩阵的阶),而目前计算此类问题的最优负载平衡算法的计算复杂性为O(N·P)(P为处理机台数)。文章最后给出了并行数值实验。  相似文献   

8.
黄兆伟  王连明 《计算机应用研究》2020,37(9):2762-2765,2771
针对目前采用IEEE 754浮点标准设计的FPGA浮点运算器中吞吐率与资源利用率低等问题,提出一种运算精度与运算器数量可配置的并行浮点向量乘法运算单元。通过浮点运算器的指数、尾数位数可配置化设计,提高系统资源利用率,并将流水线技术与并行结构结合,提高数据吞吐率。以EP4CE115型FPGA为测试平台,当配置10组FP14运算器时,系统的逻辑资源占用约为4.2%,峰值吞吐率可达4.5 GFLOPS。结果表明,提出的浮点向量乘法单元有效提高了FPGA资源利用率与运算吞吐率,同时具有高度的可移植性与通用性,适用于FPGA向量乘法运算的加速。  相似文献   

9.

稀疏矩阵向量乘法(sparse matrix-vector multiplication, SpMV)是广泛应用于科学计算、工业仿真和智能计算等领域的重要算法,是核心的计算行为之一. 在一些应用场景中,需要进行多次的SpMV迭代,以完成精确的数值模拟、线性代数求解和图分析收敛等计算要求. 受限于SpMV本身的高度随机性和稀疏性所导致的数据局部性极差、缓存效率极低、计算模式非常不规则等问题,导致其计算负载成为当前高性能处理器的优化难点和研究热点. 基于现代高性能超标量乱序处理器的架构特征,深入研究SpMV的各类性能瓶颈,并且提出从提升可预测性和降低程序复杂度的角度进行全面的性能优化. 其核心思想是:通过构建串行访问的数据结构,提升数据访问的规律性和局部性,大幅度优化数据预取效率和缓存利用效率;通过构建规则的分支跳转条件,提升程序的分支预测准确率,有效提升程序执行效率;通过灵活运用SIMD指令集,有效提升计算资源利用率. 通过对以上特性的优化,该方法可以显著缓解性能瓶颈,大幅度提升处理器资源、缓存资源和访存带宽的利用率,并且获得与主流商用计算库MKL相比平均2.6倍的加速比,相比于现有最先进算法获得平均1.3倍的加速比.

  相似文献   

10.
大规模稀疏矩阵的主特征向量计算优化方法   总被引:1,自引:0,他引:1  
矩阵主特征向量(principal eigenvectors computing,PEC)的求解是科学与工程计算中的一个重要问题。随着图形处理单元通用计算(general-purpose computing on graphics pro cessing unit,GPGPU)的兴起,利用GPU来优化大规模稀疏矩阵的图形处理单元求解得到了广泛关注。分别从应用特征和GPU体系结构特征两方面分析了PEC运算的性能瓶颈,提出了一种面向GPU的稀疏矩阵存储格式——GPU-ELL和一个针对GPU的线程优化映射策略,并设计了相应的PEC优化执行算法。在ATI HD Radeon5850上的实验结果表明,相对于传统CPU,该方案获得了最多200倍左右的加速,相对于已有GPU上的实现,也获得了2倍的加速。  相似文献   

11.
林晓平  王岷 《计算机学报》1991,14(9):678-685
本文介绍通用图处理系统GGP的设计与实现.该系统提供一般的结构化图表示模型和基于该模型的编辑和语言,构成相当一类基于图的问题的方便表示和有力处理的基础.  相似文献   

12.
SSL VPN是一种新兴的安全远程接入的实现方式,SSL VPN采用SSL协议实现身份认证以及加密通道的建立等网络安全机制,目前正广泛地被企事业单位采用.SSL协议是互联网广泛使用的安全协议,身份认证主要是依靠非对称算法,而加密通道采用的是对称算法.采用复旦大学自主研发的FPGA产品FDK250-Ⅱ实现SSL VPN加速器.一般来说,SSL协议主要采用DES和3DES等对程算法,因此加速器的实现主要是对称算法的加速.数据表明,加密过程的性能是不加密过程性能的50%,而通过采用FDK250,实现了TCP协议超过30%性能的提高.  相似文献   

13.
在充分了解到由于数学类图形绘制的困难性,教师制作数学类课件比较麻烦的基础上,设计了面向数学类图形编辑器。本文给出了其实现框架和其中的技术要点。  相似文献   

14.
网管系统中告警清除信息丢失时,会导致告警无法清除。针对此问题,设计并实现一种告警恢复自动处理系统。该系统接收到网元上报的新告警后,会在索引队列中记录此告警,并依据告警源IP、告警类型和系统预设的检测周期对告警状态进行周期检测,若检测到告警状态为已恢复,则进入告警恢复处理流程。实现了在告警清除信息缺失情况下对告警的自动清除。  相似文献   

15.
本文设计了一个高效的合一和回溯智能加速部件,在实现时我们运用了自己提出的优化线性合一算法超前检查智能回溯策略。经测试和分析表明,采用该加速部件的Prolog实现系统的效率要比软件实现提高十倍以上。  相似文献   

16.
基于压缩感知CS(Compressed Sensing)理论的稀疏磁共振图像MRI(Magnetic Resonance Imaging)重构算法包含大量的浮点运算,重构所花费的时间要远远大于傅里叶正反变换重构算法。针对该问题,利用图形处理器GPU(Graphic Processing Unit)强大的并行处理能力,在NVIDIA CUDA(Compute Unified Device Architecture)的框架上对正交匹配追踪OMP(Orthogonal Matching Pursuit)算法进行并行化的设计与实现。实验结果表明,基于GPU实现的算法具有较高的迭代重构速度,对1 0242大小的磁共振图像的重构仅为1.4秒,是CPU实现的24倍,可以满足实际应用对实时性的要求。  相似文献   

17.
本文介绍了一种交互式Petri网图形系统的设计思想与实现细节,其中包括系统功能;Petri网的数据结构以及其图形的压缩存储/还原算法;从Petri网图形到其矩阵表示的自动转换等。  相似文献   

18.
“多处理机并行处理模拟器”是旨在帮助使用者巩固和加深对典型的并行计算机系统--MIMD多处理机系统--进行并行处理基本工作过程的理解,通过实际编写并行应用程序并对其模拟执行的过程进而引导其进行更为深入研究与开发的计算机辅助教学系统。通过对MIMD多处理机系统体系结构、编译器和操作系统基本牲的模拟,实现了对作业/作业步和DO循环级并行性的显式及隐式开发,依据“单独并行段”和“主动抽取”策略可对并行代  相似文献   

19.
物联网系统是异构系统的融合,其中存在众多不同种类的信息交互,且信息具有类型较多、关联复杂、数据交换和查询频率高等特征。合理地对这些信息进行表达、存储、共享和处理是物联网面临的一大难题。提出一种面向物联网应用的消息处理引擎,依据物联网中数据的特征,抽象出物联网数据表达模型,运用消息处理描述语言MPRL(Message Processing Rule Language)将以描述,并基于MPRL设计和实现了解释执行MPRL的处理引擎。同时给出该消息处理引擎在某集团公司污水处理监控系统中的应用实践。结果证明该方案可行。  相似文献   

20.
本文根据信息处理中的一些共同过程,提出信息处理的通用模型。根据这一模型,设计小型信息处理模板。文中还阐述了信息处理模板的结构;总结该模板的开发经验和模板开发中所用到的技术,包括应用系统的安全性,用户界面的文件标,备份与恢复,栈式窗口技术和联机追踪帮助等等。最后简单地说明该模板的应用情况。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号