共查询到17条相似文献,搜索用时 742 毫秒
1.
流体系结构是一种适应VLSI工艺发展的新型体系结构,它是否对科学计算程序有效是一个广泛关注的问题。本文选取NASA并行测试程序集中的一个数据密集型程序MG,研究了 它在一个64位的面向科学计算设计的流处理器FT64上的实现和优化问题。在FT64上的实测表明,经过面向片上存储层次的优化,FT64能够达到与Itanium2处理器相当的性能。
。 相似文献
。 相似文献
2.
EP和GEMM是科学计算领域中常用的计算核心,并广泛应用于高性能计算机体系结构的性能评测.基于一种当今热门的体系结构--流体系结构,设计实现了这两个测试程序在FT64并行系统上的并行算法,并取得了很好的效果. 相似文献
3.
4.
旨在寻求新梅森素数的大互联网梅森素数搜寻计划GIMPS(Great Internet Mersenne Primes Search)[1]在网格技术的协助下已找到第44个梅森素数.GIMPS是唯一的全球分布计算计划,真正的虚拟组织[2].梅森素数的计算具有指数复杂性,随着p达千万级,所需计算时间须以千、万计算机年计.本文基于梅森素数搜索历程中的原理、技术和算法,探讨网格技术给GIMPS计划带来的突破性进展. 相似文献
5.
6.
网络最大流问题是经典的组合优化问题,随着网络规模的增加,提高算法效率成为解决问题的关键.为了降低求解大规模网络最大流的计算量,针对单源单汇网络提出基于网络分层的最大流问题求解新方法.分层法首先构造原有向网络对应的层次网络,接着在构造出的层次网络中计算各相邻结点层之间的最大流,以此为基础最终获得整个网络最大流的快速估算.分层法有效降低了计算的复杂性,为在大规模网络中快速获取最大流的求解提供了方便,并给出了一个解决最大流问题的新思路.不同网络上测试的实验结果显示,最大流的近似解误差可控制在1%左右,而平均运行时间仅为经典算法(FordFulkerson算法)运行时间的11%,最好情况下的运行时间仅为经典算法运行时间的2%,是two-phase capacity scaling改进算法运行时间的25%,表明分层方法的有效性. 相似文献
7.
本文就最大可行流问题给出了一种回溯求解的算法,并证明了不可扩展结点的可剪裁性问题,旨在减少后续可能的搜索空间.在一定程度上可以减少求解过程中的时间消耗. 相似文献
8.
最小费用最大流问题是一种组合优化问题,在经济、工业等领域具有重要研究意义和应用价值.针对部分最小费用最大流问题求解算法效率较低的情况,依据最小费用最大流问题的线性规划方程,将问题模型映射为对应因子图模型,改进描述函数,给出迭代方程,设计了求解最小费用最大流问题的信念传播算法.利用迭代方程优先对最大可行流特征值进行收敛计算,得到最大流,设置最大流阈值,在此基础上进行最小费用计算,从而求得问题最优解.最后选取若干带权有向图模型进行数值实验,验证了算法的可行性及有效性,且算法在求解效率上优于部分算法. 相似文献
9.
10.
提出了一种将有限元和比例边界有限元相结合求解无穷域势流问题的算法.用两条封闭曲线将求解域划分为存在重叠的有限和无限两个区域,在有限域和无限域上分别用有限元和比例边界有限元方法求解原问题,通过重叠区域交换数据迭代计算,直至收敛.分析了重叠区域面积的大小对计算收敛速度的影响,发现随着重叠区域面积的增大迭代次数减少,收敛速度加快.数值算例显示了算法的正确性和收敛性.本算法为求解无穷域势流问题提供了一个方法. 相似文献
11.
Xue-Jun Yang Yu Deng Li Wang Xiao-Bo Yan Jing Du Ying Zhang Gui-Bin Wang and Tao Tang 《计算机科学技术学报》2009,24(1):152-164
Stream Register File (SRF) is a large on-chip memory of the stream processor and its efficient management is essential for good performance. Current stream programming languages expose the management of SRF to the programmer, incurring heavy burden on the programmer and bringing difficulties to inheriting the legacy codes. SF95 is the language developed for FT64 which is the first 64-bit stream processor designed for scientific applications. SF95 conceals SRF from the programmer and leaves the management... 相似文献
12.
本文提出一种支持流数据传输的互连网络控制器的设计。该设计应用于FT64流处理器上,使得多个流处理器能够通过高性能网络进行数据传输,以便进行并行流数据运算。该设计采用二维环绕网,使用虚通道避免死锁,支持多个流的数据同时传输。投片后的测试结果表明,该设计功能正确,核心频率为500MHz,链路时钟频率为400MHz,满足设计要求。 相似文献
13.
FT64是一款自主研发的面向科学计算的64位流处理器。本文介绍了该处理器的微体系结构及其编程模型,重点讨论了片内流寄存器文件实现的关键技术;该流寄存器文件具有硬件代价低、支持多流虚拟并发访问等特性。测试结果表明,流寄存器文件满足某些类科学计算与工程应用的带宽需求。 相似文献
14.
Yang Xuejun Yan Xiaobo Xing Zuocheng Deng Yu Jiang Jiang Du Jing Zhang Ying 《Parallel and Distributed Systems, IEEE Transactions on》2009,20(8):1142-1157
The stream architecture is a novel microprocessor architecture with wide application potential. It is critical to study how to use the stream architecture to accelerate scientific computing programs. However, existing stream processors and stream programming languages are not designed for scientific computing. To address this issue, we design and implement a 64-bit stream processor, Fei Teng 64 (FT64), which has a peak performance of 16 Gflops. FT64 supports two kinds of communications, message passing and stream communications, based on which, an interconnection architecture is designed for a FT64-based high-performance computer. This high-performance computer contains multiple modules, with each module containing eight FT64s. We also design a novel stream programming language, Stream Fortran 95 (SF95), together with the compiler SF95Compiler, so as to facilitate the development of scientific applications. We test nine typical scientific application kernels on our FT64 platform to evaluate this design. The results demonstrate the effectiveness and efficiency of FT64 and its compiler for scientific computing. 相似文献
15.
16.
17.
In modern VLSI technology, hundreds of thousands of arithmetic units fit on a 1cm^2 chip. The challenge is supplying them with instructions and data. Stream architecture is able to solve the problem well. However, the applications suited for typical stream architecture are limited. This paper presents the definition of regular stream and irregular stream, and then describes MASA (Multiple-morphs Adaptive Stream Architecture) prototype system which supports different execution models according to applications' stream characteristics. This paper first discusses MASA architecture and stream model, and then explores the features and advantages of MASA through mapping stream applications to hardware. Finally MASA is evaluated by ten benchmarks. The result is encouraging. 相似文献