首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
本文讨论了高速向量机实际应用中并行度的极限,几种计算机结构可提供的并行能力及使用该潜在能力的两种方法:指令控制流及数据控制流。提出了一个流水线式多处理单元的向量机方案,给出了其基本系统结构及高稀疏向量处理功能。此外,为了提供足够高的数据传输率,采用了向量高速缓存及分布式主存储器的方案。介绍了一个用微处理机构成的该方案的模拟模型。  相似文献   

2.
SIMD扩展部件是集成到通用处理器中的加速部件,旨在发掘多媒体和科学计算等领域程序的数据级并行.当前两种基本的向量发掘方法分别是发掘迭代间并行的Loop-based方法和发掘迭代内并行的SLP方法.Loop-aware方法是对SLP方法的改进,其思想是首先通过循环展开将迭代间并行转换为迭代内并行,使循环体内的同构语句条数足够多,再利用SLP方法进行向量发掘.但当循环展开不合法或者并行度低于向量化因子时,Loop-aware方法无法实现程序向量并行性的发掘.因此提出了向量并行度指导的循环向量化方法,依据迭代间并行度、迭代内并行度和向量化因子,构建循环向量化方法选择方案,同时提出不充分向量化方法发掘并行度低于向量化因子的循环向量并行性,最后依据向量并行度对生成的向量循环进行展开.经过标准测试集测试,向量并行度指导的循环SIMD向量化方法比Loop-aware方法识别率提升107.5%,性能提升12.1%.  相似文献   

3.
“大规模并行计算机”作为一条泛指的术语,没有明确限定某一类体系结构。显然,“大规模”(massively)这个词使人联想到很多的处理机,这的确可以作为一个标准(比如说至少一千台处理机)。但是,考虑到目前计算机研制者所遵循的众多设计方法,这样的标准甚至连一类具有令人感兴趣特性的并行结构也表示不了。此外,以处理机数目衡量的标准也不是绝对的,因为它取决于技术的发展,很明显,今天被认为是“大规模”的结构,在不久的将来就会被认为是“适度规模”的了。不过,并行结构的一种特殊设计方法——细颗粒(fine grain)单指令流多数据流(SIMD)并行计算机使用的方法——为我们提供了一条利用大量处理机构造并行计算机的便利途径。因为,这种并行计算机基于的是体积很小的处理单元、常规互联网和一种简单的控制机制。这一类体系结构,我们称之为MPC。考虑到读者的广泛性,我们认为简要介绍一下大规模并行计算机领域并概括出已有的最重要的系统是有益的。为此,我们请了MPC的主要制造商们提供其系统的简短介绍,然后由我们加以编辑,使得描述一致。我们将这些内容包括在了这篇介绍中。  相似文献   

4.
多线程计算模型、体系结构与编译技术   总被引:3,自引:0,他引:3  
1 引言在过去的30年里,计算机体系结构经历了长足的发展,超标量、超流水线、VLIW等先进思想显著地提高了计算机的性能,但这些单线程的体系结构在提高指令级并行度方面也面临着巨大的困难。多线程体系结构被认为是一种提高并行度的有效模型,它结合了数据流结构和传统的冯·诺依曼控制流结构,既保持了指令执行的高性能,又实现了处理器的高  相似文献   

5.
一类求解非线性方程组算法的并行性能分析   总被引:12,自引:1,他引:11  
杨庚 《计算机学报》2000,23(10):1035-1039
讨论了一类求解非线性方程组算法的并行性能,与传统的算法不同之处是用一个块对角矩阵作为迭找矩阵,且该矩阵可由一个仅包含向量内积的矩阵与向量乘积的递推关系简便计算得到,在对算法进行描述之后,分析了算法的并行执行过程,给出了算法的并行加速比和对存储的需求分析,数值计算表明理论分析与数值结果相符合,算法具有较好的并行度和较低的存储要求,可适用于一般和大规模科学与工程的高性能计算。  相似文献   

6.
通过对国内外并行计算机体系结构的分析与研究,提出一种面向多媒体应用的嵌入式数据并行计算机体系结构模型,将可重构总线与PIM技术相结合,弥补传统PIM体系结构下处理元之间通信复杂度高、结构可适应性弱等不足.描述其主要部件的功能和结构,定义该体系结构计算机的指令集,通过一个典型的算法样例介绍其汇编语言程序组成和并行计算过程...  相似文献   

7.
引言 近二十年来,随着并行处理技术的发展计算机的体系结构也发生了很大变化。并行处理系统在计算机体系结构发展史上也是一个重要的突破。它包括多机系统、多处理机系统、阵列(并行)处理机、流水线处理机等。这些系统多是以并行计算为基础,它们在不同程度上使用了时间重迭、资源重复和资源共享三个基本的并行性概念。并行性除了与计算问题的算法及其程序结构密切相关外,高并行度的机器结构也是实现多级并行性的重要手段。  相似文献   

8.
支持向量机是数据挖掘的新方法,由于其优秀的学习能力而得到了广泛的应用,但是,传统的支持向量机算法在处理大规模问题时存在训练时间过长和内存空间需求过大的问题,而应用多个支持向量机构成多分类器系统进行并行学习,是目前解决文本分类中大规模数据处理问题的一种有效方法。在分析传统并行算法的基础上,提出了一种改进的基于多支持向量机的并行学习算法,实验结果表明,采用该算法可使得分类效率得到较大的程度的提高,虽然,分类精度相对传统的方法略差,但是,在可接受的范围之内。  相似文献   

9.
针对SVM (support vector machine)算法应用到大规模网络流量分类中存在计算复杂度高、训练速度慢等问题,提出一种基于云计算平台进行并行网络流量分类的SVM方法,以提高对大数据集的分类训练速度.该方法是一种采用云计算平台构建多级SVM和映射规约(MapReduce)模型的方法.它将训练数据集划分为多个子训练数据集,通过对所有子训练数据集进行并行训练,得到支持向量集,进而训练出流量分类模型.实验结果表明,与传统的SVM方法相比,并行SVM网络流量分类方法在保持较高分类精度的前提下,有效地减少了训练时间,提高了大规模网络流量分类的速度.  相似文献   

10.
本介绍一个采用VLIW超长指令字体系结构的高性能单片多处理机,在这个体系结构中采用流水寄存器堆来消除循环程序内的数据相关,从而使程序能够在指令级以极高的并行度并行运行。模拟实验结果表明这个体系结构具有很高的运算速度和很好的性能价格比。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号