首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 546 毫秒
1.
计算二维FFT的MIMD并行算法   总被引:2,自引:0,他引:2  
张德富  盛蓝 《计算机学报》1989,12(7):551-554
1.引言 Mueller提出一种计算信号阵列S(N,N)(设N=2~M)二维FFT的并行算法,它要用N~2/2个处理单元和2N个M立方体网,资源开销巨大,结构复杂,难以实现。而本文提出的两种计算信号阵列S(N,N)二维FFT的并行算法,一种叫宏流水线MIMD并  相似文献   

2.
针对网络丢包条件下的H.264实时解码问题,设计了基于DM6467处理器的自适应的实时错误掩盖算法,该算法根据场景切换和相邻宏块的运动特征分别进行时域错误掩盖和空域错误掩盖,而不增加解码器的时空复杂度。在DM6467处理器上进行了错误掩盖解码并行算法的流水线设计和优化。实验结果表明,与现有方法相比,采用该方法后视频重建图像质量最大提高了1.87 dB,并且可以达到1080P30实时掩盖的效率。  相似文献   

3.
基于同构多核处理器的H.264多粒度并行编码器   总被引:2,自引:0,他引:2  
H.264码率低和视频质量高的优越性能以增加编码计算的复杂度为代价,如何开发适用于多核处理器平台的并行编码算法是提高其编码速度的重要研究内容,对于满足高清视频实时传输和大规模共享具有十分重要的意义.利用H.264开源编码器项目X264,在片级和数据级并行编码算法的基础上,通过分析图像帧之间的参考关系,提出并实现了B帧个数可变的帧级并行算法;根据宏块之间的参考关系,设计了一种类似流水线的宏块级并行方法;基于Intel同构多核平台,提出融合帧级、片级、宏块级和数据级4种不同粒度的并行编码方案,开发了H.264多粒度并行编码器.实验结果表明,在码率增加不大的情况下,H.264多粒度并行编码器可以很好地提升编码加速比,视频编码质量符合高质量的要求.  相似文献   

4.
基于H.264实时编码的多核并行算法   总被引:1,自引:0,他引:1       下载免费PDF全文
冯飞龙  陈耀武 《计算机工程》2010,36(24):226-227
针对H.264多核实时编码架构,根据编码模块的数据依赖关系,提出基于相邻宏块的并行算法,融合Slice级、宏块行级和相邻宏块级并行算法,实现多粒度并行编码算法,加大了数据并行深度。实验结果表明,该并行编码算法在图像质量几乎不变的情况下能有效提高并行加速比。  相似文献   

5.
机器人动力学并行计算   总被引:1,自引:0,他引:1  
盛理彦  陈宁新 《机器人》1989,3(6):58-62
本文综述了并行计算在机器人动力学中的应用.简单介绍了并行计算机的各种结构以及并行算法的一些特点,重点介绍了以牛顿—欧拉方程为动力学初始模型的并行计算任务的调度以及流水线计算,对数递推计算等算法,最后还介绍了一种并行近似计算方法.  相似文献   

6.
纵横加工流水线机不同于通常概念的流水线机。为了能够发挥纵横加工流水线的结构特点,需要给出与之相适应的并行算法。文中引入纵横加工并行算法的概念,并对若干典型计算问题给出了并行计算格式。对于所述并行计算格式的可用性,均附以简单结论。  相似文献   

7.
针对以往效率较低的串行计算CRC16 CCITT校验码的算法,研究了其计算效率低下的原因,并引入了一种通用的并行算法。在Quartus II下使用Verilog HDL实现了该算法并进行了仿真,使用Nios II自定义指令分析了采用并行算法对串行算法的性能改进。最后,通过多级流水线技术对基本并行电路进行改进和仿真,揭示了利用流水线技术提高存在反馈结构的逻辑电路Fmax存在的问题,并提出了应对的方法。仿真的结果表明,采用改进后的多级流水线电路可以大幅提高并行计算电路Fmax,进而提升CRC16 CCITT校验码计算的效率。  相似文献   

8.
流水线算法及其在B+树结构维护方面的应用   总被引:1,自引:0,他引:1  
流水线技术是并行处理中一项非常重要的并行技术,将流水线技术用于B^+树这一数据结构的维护,给出了在B^+树中插入或删除一组元素操作的并行算法,并给出了相应的性能分析。  相似文献   

9.
本文提出了一种不用导数的无约束多维最优化并行算法。它特别适用于在流水线向量机上求解高维最优化问题。  相似文献   

10.
三维激光烧蚀流体界面不稳定性程序的并行化   总被引:1,自引:0,他引:1  
在共享存储并行机和MPP并行机上,基于MPI(MessagePassingInterface)并行编程环境,本文研究三维激光烧蚀界而不稳定性程序(Lared-S)的并行实现.三维激光烧蚀的数值模拟采用分裂方法,其90%以上的计算负载存在于流体方程和热传导方程的求解(流体方程的求解采用分裂显格式,热传导方程的求解采用分裂隐格式).本文给出基于三维分裂格式的交替平面数据通信模式.分裂隐格式的求解转化为三对角方程组的求解,其并行实现采用块流水线并行算法.数值实验结果表明交替平面数据通信策略和块流水线并行算法是有效且可扩展的.在共享存储并行机上,应用64台处理机获得93%以上的并行效率;在MPP并行机上,应用128台处理机获得90%以上的并行效率.  相似文献   

11.
任何高性能科学计算(HPC)课题都是一项复杂的系统工程,其具体的应用效率要受到来自硬件和软件等许多因素,主要如并行算法、流水线技术、层次存储器技术和网络互联结构等的制约,诸因素既互相独立又互相关联.本文从一个典型的高性能科学计算--格点量子色动力学研究模型入手,在分析了HPC所涉硬软件存在的一些共性特征的基础上,总结出一些能够改善高性能科学计算应用效率的方法.通过对这些方法长期的应用实践和专门实验,证明它们是有效的.  相似文献   

12.
逐次松弛迭代算法(SOR)是求解线性方程组的一种常用迭代算法,当系数矩阵正定时,它具有较快的收敛速度。但是,由于每个迭代步内存在数据相关,它难以实现并行计算。目前的SOR并行算法采用数据分解的方法,但由于该法并行区域过小,同步通讯代价大,并行效率低。本文提出了SOR的一种新型并行算法,该算法与传统SOR方法等价,具有相同的收敛性和迭代结果。该并行算法通过矩阵分块增大了可并行计算的区域,并引入流水线技术,利用各处理器间通讯与计算时间的重叠,获得较理想的并行加速效率。通过多核微机以及小规模集群上的数值实验证明,本文提出的SOR并行算法在求解大型稠密线性方程组时具有较好的并行效率。  相似文献   

13.
提出一种基于并行的碰撞检测算法。该算法主要采用并行算法中的分治策略建立环境中每个物体的平衡包围盒树,通过遍历每两棵包围盒树形成对一任务树的遍历,采用并行算法中的流水线技术,利用划分进程遍历任务树从而加速碰撞检测算法。该算法在进程中也应用了多线程技术,因而能运行于单处理机和多处理机上。  相似文献   

14.
容错并行算法的性能分析   总被引:1,自引:1,他引:0  
容错并行算法是一种应用级容错方法,它通过并行复算的方法实现快速的故障恢复.容错并行算法是在并行算法设计的基础上增加了容错设计部分,因此其性能评估必须考虑故障对程序性能的影响.研究了评估故障情况下容错并行算法性能的各种度量,建立了性能模型预测容错并行算法的期望执行时间,以此为基础评估了程序段的运行时间、数据保存开销、故障率以及并行复算加速比等系统参数对容错并行算法性能的影响.  相似文献   

15.
这篇文章研究流水线向量计算机的并行算法,针对文中指出的特定的计算机模型,提出了算法优化的设计原则。并对算术表达式求值(包括向量线性递推)、数值解常微分方程、线代数方程求解及用差分法解变系数椭圆型方程等典型问题,分析了算法,设计了程序内核。并计算出这些程序在流水线计算机上执行的效率,所得结果适用于Crag-1型流水线计算机。  相似文献   

16.
改进并行蚁群算法求解置换流水线调度问题   总被引:2,自引:0,他引:2  
为了解决置换流水线的调度问题,提出了改进的并行蚁群算法.针对置换流水线问题本身的特性,在蚂蚁系统算法(ACS)的基础上,设计出了新的启发式信息算法.在计算大数据量的情况下,通过设计的新规律对数据进行分组,并对分组进行并行计算,然后合并各组最优解来问题的最优解.实验结果表明,该改进方法行之有效,新的启发式信息提高了解的质量,而按数据规律的分组并行不仅缩小查找最优值时间,相比于随机分组的并行算法,更加提高了解的质量.  相似文献   

17.
可重构流水线总线并行机上图像的聚类算法   总被引:2,自引:1,他引:1  
聚类是图像处理中的一个基本操作。对于分为K个簇的N个模式,且每个模式含有M个特征,该文在N个处理器的一维可重构流水线总线并行机上提出了一个时间复杂度为O(M×K)的聚类操作中一次迭代的并行算法。并对该并行算法进行了扩展,使得当处理器数分别为N×M和N×M×K时,一次迭代的时间复杂度分别为O(K)和O(1)。  相似文献   

18.
根据对距离多普勒(Range Doppler)成像算法的特点进行研究,提出了一种基于流水线的合成孔径雷达(SAR)并行成像算法。这种算法基于C/MPI编写并成功地在32节点的IBM PC集群实现。通过与已建立的通用的并行成像算法进行比较分析,得出基于流水线的并行算法是一种更适合SAR并行成像的一种算法,能够提供更高的并行效率。  相似文献   

19.
基于FPGA的H.264去块滤波系统的优化设计   总被引:1,自引:0,他引:1       下载免费PDF全文
欧阳剑  杜学亮 《计算机工程》2008,34(12):239-241
提出一种H.264去块滤波系统的优化设计方法。通过合理设计流水线级数提高并行性,适当增加内部SRAM来提高系统速度和总线利用率,使用一种层次化的有限状态机设计方法,实现对数据流的精确控制并且有效降低硬件实现复杂度。基于FPGA的验证结果显示在最坏情况下滤波每个宏块平均只需220个时钟,比原有方案快10个时钟以上。  相似文献   

20.
AVS反扫描、反量化和反变换模块的一种优化设计   总被引:2,自引:0,他引:2       下载免费PDF全文
根据AVS标准中的反扫描、反量化和反变换算法特点提出了一种用于AVS解码芯片中的反扫描、反量化和反变换硬件模块的设计方案,该设计以宏块为单位进行操作,便于集成到整个解码芯片的流水线中。同时,在宏块内实现了8×8子块的流水线操作并进行了优化,在反变换中用RAM代替寄存器堆进行转置操作。综合结果表明,该设计在获得了较高处理速度的同时节省了大量的寄存器和选择器资源。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号