共查询到20条相似文献,搜索用时 546 毫秒
1.
计算二维FFT的MIMD并行算法 总被引:2,自引:0,他引:2
1.引言 Mueller提出一种计算信号阵列S(N,N)(设N=2~M)二维FFT的并行算法,它要用N~2/2个处理单元和2N个M立方体网,资源开销巨大,结构复杂,难以实现。而本文提出的两种计算信号阵列S(N,N)二维FFT的并行算法,一种叫宏流水线MIMD并 相似文献
2.
针对网络丢包条件下的H.264实时解码问题,设计了基于DM6467处理器的自适应的实时错误掩盖算法,该算法根据场景切换和相邻宏块的运动特征分别进行时域错误掩盖和空域错误掩盖,而不增加解码器的时空复杂度。在DM6467处理器上进行了错误掩盖解码并行算法的流水线设计和优化。实验结果表明,与现有方法相比,采用该方法后视频重建图像质量最大提高了1.87 dB,并且可以达到1080P30实时掩盖的效率。 相似文献
3.
基于同构多核处理器的H.264多粒度并行编码器 总被引:2,自引:0,他引:2
H.264码率低和视频质量高的优越性能以增加编码计算的复杂度为代价,如何开发适用于多核处理器平台的并行编码算法是提高其编码速度的重要研究内容,对于满足高清视频实时传输和大规模共享具有十分重要的意义.利用H.264开源编码器项目X264,在片级和数据级并行编码算法的基础上,通过分析图像帧之间的参考关系,提出并实现了B帧个数可变的帧级并行算法;根据宏块之间的参考关系,设计了一种类似流水线的宏块级并行方法;基于Intel同构多核平台,提出融合帧级、片级、宏块级和数据级4种不同粒度的并行编码方案,开发了H.264多粒度并行编码器.实验结果表明,在码率增加不大的情况下,H.264多粒度并行编码器可以很好地提升编码加速比,视频编码质量符合高质量的要求. 相似文献
4.
5.
机器人动力学并行计算 总被引:1,自引:0,他引:1
本文综述了并行计算在机器人动力学中的应用.简单介绍了并行计算机的各种结构以及并行算法的一些特点,重点介绍了以牛顿—欧拉方程为动力学初始模型的并行计算任务的调度以及流水线计算,对数递推计算等算法,最后还介绍了一种并行近似计算方法. 相似文献
6.
王嘉谟 《计算机工程与科学》1981,(4)
纵横加工流水线机不同于通常概念的流水线机。为了能够发挥纵横加工流水线的结构特点,需要给出与之相适应的并行算法。文中引入纵横加工并行算法的概念,并对若干典型计算问题给出了并行计算格式。对于所述并行计算格式的可用性,均附以简单结论。 相似文献
7.
宁平 《计算机工程与科学》2014,36(6):1023-1027
针对以往效率较低的串行计算CRC16 CCITT校验码的算法,研究了其计算效率低下的原因,并引入了一种通用的并行算法。在Quartus II下使用Verilog HDL实现了该算法并进行了仿真,使用Nios II自定义指令分析了采用并行算法对串行算法的性能改进。最后,通过多级流水线技术对基本并行电路进行改进和仿真,揭示了利用流水线技术提高存在反馈结构的逻辑电路Fmax存在的问题,并提出了应对的方法。仿真的结果表明,采用改进后的多级流水线电路可以大幅提高并行计算电路Fmax,进而提升CRC16 CCITT校验码计算的效率。 相似文献
8.
9.
10.
三维激光烧蚀流体界面不稳定性程序的并行化 总被引:1,自引:0,他引:1
在共享存储并行机和MPP并行机上,基于MPI(MessagePassingInterface)并行编程环境,本文研究三维激光烧蚀界而不稳定性程序(Lared-S)的并行实现.三维激光烧蚀的数值模拟采用分裂方法,其90%以上的计算负载存在于流体方程和热传导方程的求解(流体方程的求解采用分裂显格式,热传导方程的求解采用分裂隐格式).本文给出基于三维分裂格式的交替平面数据通信模式.分裂隐格式的求解转化为三对角方程组的求解,其并行实现采用块流水线并行算法.数值实验结果表明交替平面数据通信策略和块流水线并行算法是有效且可扩展的.在共享存储并行机上,应用64台处理机获得93%以上的并行效率;在MPP并行机上,应用128台处理机获得90%以上的并行效率. 相似文献
11.
12.
逐次松弛迭代算法(SOR)是求解线性方程组的一种常用迭代算法,当系数矩阵正定时,它具有较快的收敛速度。但是,由于每个迭代步内存在数据相关,它难以实现并行计算。目前的SOR并行算法采用数据分解的方法,但由于该法并行区域过小,同步通讯代价大,并行效率低。本文提出了SOR的一种新型并行算法,该算法与传统SOR方法等价,具有相同的收敛性和迭代结果。该并行算法通过矩阵分块增大了可并行计算的区域,并引入流水线技术,利用各处理器间通讯与计算时间的重叠,获得较理想的并行加速效率。通过多核微机以及小规模集群上的数值实验证明,本文提出的SOR并行算法在求解大型稠密线性方程组时具有较好的并行效率。 相似文献
13.
14.
15.
高只明 《计算机工程与科学》1981,(1)
这篇文章研究流水线向量计算机的并行算法,针对文中指出的特定的计算机模型,提出了算法优化的设计原则。并对算术表达式求值(包括向量线性递推)、数值解常微分方程、线代数方程求解及用差分法解变系数椭圆型方程等典型问题,分析了算法,设计了程序内核。并计算出这些程序在流水线计算机上执行的效率,所得结果适用于Crag-1型流水线计算机。 相似文献
16.
改进并行蚁群算法求解置换流水线调度问题 总被引:2,自引:0,他引:2
为了解决置换流水线的调度问题,提出了改进的并行蚁群算法.针对置换流水线问题本身的特性,在蚂蚁系统算法(ACS)的基础上,设计出了新的启发式信息算法.在计算大数据量的情况下,通过设计的新规律对数据进行分组,并对分组进行并行计算,然后合并各组最优解来问题的最优解.实验结果表明,该改进方法行之有效,新的启发式信息提高了解的质量,而按数据规律的分组并行不仅缩小查找最优值时间,相比于随机分组的并行算法,更加提高了解的质量. 相似文献
17.
18.
根据对距离多普勒(Range Doppler)成像算法的特点进行研究,提出了一种基于流水线的合成孔径雷达(SAR)并行成像算法。这种算法基于C/MPI编写并成功地在32节点的IBM PC集群实现。通过与已建立的通用的并行成像算法进行比较分析,得出基于流水线的并行算法是一种更适合SAR并行成像的一种算法,能够提供更高的并行效率。 相似文献
19.
20.
根据AVS标准中的反扫描、反量化和反变换算法特点提出了一种用于AVS解码芯片中的反扫描、反量化和反变换硬件模块的设计方案,该设计以宏块为单位进行操作,便于集成到整个解码芯片的流水线中。同时,在宏块内实现了8×8子块的流水线操作并进行了优化,在反变换中用RAM代替寄存器堆进行转置操作。综合结果表明,该设计在获得了较高处理速度的同时节省了大量的寄存器和选择器资源。 相似文献