首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
冯颖  袁庆华  沈健炜 《通信技术》2011,44(2):141-143
基于CPU+GPU的异构计算系统是在传统计算机系统中加入GPU作为加速部件并配合CPU共同承担计算任务的新型系统,相比于传统的单纯以CPU作为计算部件的同构计算系统,异构系统优势明显。分析了基于CPU+GPU异构计算模式程序开发面临的主要困难,重点研究了当前可用的主要解决途径和研究方向,并总结了当前各种编程方法的适用场合和各自的优缺点。  相似文献   

2.
随着计算机GPU硬件的快速发展,GPU编程环境变得友好,CPU/GPU异构体系结构也被广泛的应用。文章为了有效利用CPU/GPU异构体系结构的优点,并提出了基于该体系结构的两种并行编程模型,使得并行程序设计研究人员使用CPU/GPU异构体系结构的并行编程模型来对大量的程序进行设计,从而最大程度地提高程序的性能。  相似文献   

3.
对多区结构网格大规模CFD流场模拟的高效并行方法进行了研究,以天河超级计算机平台的CPU同构计算环境和CPU+MIC异构计算环境为例,重点讨论了CFD应用特点与超级计算机运行环境相适应的性能优化与改进策略,发展了一系列多层次并行与性能优化方法.通过在天河2高性能计算平台上进行了多个算例的数值模拟,验证了这些优化方法的并行效果;在CPU+MIC异构平台上模拟的最大CFD问题规模达到6800亿个网格单元,共使用137.6万CPU+MIC处理器核,测试结果表明在CPU+MIC异构平台上移植优化后的程序性能提高2.6倍左右,且具有良好的可扩展性.  相似文献   

4.
<正>传统单核处理器对复杂任务的处理能力不够,多核处理器系统的提出可以很好解决问题。分析了多核处理器系统中同构多核处理器与异构多核处理器的系统特点和结构特征,总结对比了每个结构的优劣势,分析研究了多核处理器的任务调度算法,核间通信机制,核间互斥与中断机制等问题,指出了处理器系统未来的发展方向。近些年来,随着物联网和5G技术的快速发展,对嵌入式实时系统的应用需求日趋复杂,对于处理器性能的要求也随之提高,原来通过提高CPU主频提升处理器性能的方式由于高功耗的制约受到很大挑战,因此多核处理器构架作为新的解决方案被提出,并得到越来越多的关注。  相似文献   

5.
孔燚 《中国有线电视》2006,(23):2322-2324
随着科技的进步,目前CPU+GPU+I/O技术广泛应用于非线性编辑系统中,在分析传统有卡非线性编辑系统的基础上,介绍基于CPU+GPU+I/O卡的非线性编辑系统的原理、特点和优势,并介绍了基于CPU+GPU+I/O卡设备的应用。  相似文献   

6.
随着微处理器技术的发展,GPU/CPU的混合计算已经成为是科学计算的主流趋势.本文从编程的层面,介绍了如何利用已有的并行编程语言来,调度GPU的计算功能,主要以MPI(一种消息传递编程模型)与基于GPU的CUDA(统一计算设备架构)编程模型相结合的方式进行GPU集群程序的测试,并分析了CPU/GPU集群并行环境下的运行特点.从分析的特点中总结出GPU集群较优策略,从而为提高CPU/GPU并行程序性能提供科学依据.  相似文献   

7.
挑战多核   总被引:1,自引:1,他引:0  
MCU通常通过主处理器和协处理器架构形成多核;在高性能处理器(MPU)中,同构核、异构核纷繁复杂,对软件编程形成了挑战,需要仿真、虚拟化等技术来实现.  相似文献   

8.
刘昆  杜国宏  廖成 《微波学报》2010,26(5):50-52
提出一种全新的时域有限元运算加速方法--应用图形处理器(GPU)实现对时域有限元运算的提速.在GPU上通过OpenGL编程完成时域有限元运算,从而利用GPU的并行处理功能达到提高运算速度的目的.文中介绍了编程实现过程,并分析讨论了GPU提速过程中处理数据量不同具有不同表现的现象,进而得出随着处理数据量的增加,GPU相对于CPU的处理速度将会更快.文中以时域有限元的辐射算例验证了该算法的正确性和有效性,为时域有限元运算提速提供了一条有效途径.  相似文献   

9.
面对互联时代海量的信息数据,图形处理器凭借极强的并行计算处理能力,通过GPU+CPU的架构为现代无线接入网设备的信号处理,提供了一种理想的技术手段。文章设计了一款基于CUDA编程接口的GPU Trace模块,用于在GPU+CPU平台架构中跟踪记录GPU的运行信息。  相似文献   

10.
现在CPU+GPU技术已被广泛地应用到非线性编辑系统中,本文阐述了非线性编辑系统架构的发展历程,并从GPU技术的实质出发,介绍了CPU+GPU架构非编系统的工作原理、特性和发展前景等.  相似文献   

11.
异构BSP模型及其通信协议   总被引:9,自引:0,他引:9       下载免费PDF全文
异构并行计算由于其较高性能价格比而在高性能科学计算和通用应用领域受到广泛研究.但由于异构并行程序设计与性能分析仍处于经验阶段,开发实用程序较为困难.本文提出异构环境中的HBSP模型,并导出相应的开销预测方法,能有效指导异构并行程序的设计与分析.所设计并实现的HBSP模型的通信协议能运行于所有支持MPICH软件包的计算平台.最后以并行FFT算法为例,给出相应的算法设计和实际测试结果.  相似文献   

12.
前言     
人们对后3G的要求是:在全球范围内实现无缝覆盖,进行包括语音、文本、图像、视频等在内的高速多媒体通信。为此,在有限频谱资源条件下,必须缩短无线信号的传输半径,极大限度地复用频谱资源,提高单位空间的信道容量。采用各种先进的无线传输技术的无线传输网络则在中、小范围内提供高速率、高质量的无线移动通信服务。因而WLAN和WPAN的需求和应用在不断增长,超宽带(UWB,ultra wide-band)等短距离、高空间容量的技术日益兴起,成为目前无线通信领域的热点。UWB的核心是冲激无线电技术,即利用持续时间非常短(纳秒、亚纳秒级)的脉冲波形来…  相似文献   

13.
计算任务与体系结构匹配的异构计算可扩展性分析   总被引:4,自引:0,他引:4       下载免费PDF全文
郝水侠  曾国荪  谭一鸣 《电子学报》2010,38(11):2585-2589
 扩展性是衡量高性能并行系统的一个关键要素,而扩展性的研究主要集中在同构的高性能系统上,异构系统研究的文献很少. 本文以异构系统为研究对象,根据实际应用任务,将计算任务分为三类:单任务模型、元任务池模型和fork-join任务队列模型,并给出这三类计算任务的定义. 提出描述基于计算任务和体系结构相匹配的异构计算系统匹配矩阵,给出异构计算的可扩展性定义. 针对上述三种计算任务模型以及异构匹配给出异构系统的可扩展性条件,为异构系统的可扩展性提供了理论依据. 用实例分析证实了这种方法的有效性.  相似文献   

14.
贾明权  钟瑜  潘灵  陈颖 《电讯技术》2019,59(6):627-634
针对智能化作战对军事电子信息系统计算能力提升的迫切需求,结合云计算的资源虚拟化、大数据的分布式计算等技术,提出了基于嵌入式CPU+ALL(DSP、FPGA、PPC、GPU、AI处理器等)的异构处理的信号级协同计算平台架构,包括弹性、轻量级异构资源虚拟化模型、分布式实时计算框架和智能计算框架等,形成了一套架构统一、资源共用、使用简便的协同计算和智能计算环境。通过战术级无线电认知和智能信号与信息处理两个典型应用场景,探讨了该信号级协同计算平台可能带来的颠覆性效用。  相似文献   

15.
软件定义网络(SDN)技术为高速发展的云计算提供了网络解决方案,而数据中心SDN的规模化部署必然带来SDN异构互通、统一管理和协同编排需求。在研究SDN异构互通、北向接口标准化和协同编排等关键技术及其发展现状的基础上,提出通过网络协同编排平台SDN Hub实现跨域、跨厂商、跨SDN控制器互通和互操作的方法,并给出了平台的方案设计和系统实现,最终实验结果证明,平台具备多控制器接入和异构资源池调度能力。  相似文献   

16.
为了解决传统雷达信号处理机在研发阶段面临的调试困难,计算能力受硬件限制及程序复用性差等问题,本文提出了使用GPU作为雷达计算核心的方案.在使用GPU实现雷达信号处理算法的过程中,动目标检测(MTD)部分的优化效果远低于脉冲压缩和恒虚警检测.经过分析,MTD过程中的矩阵转置与向量点乘占据了算法的大量时间.本文从GPU的数...  相似文献   

17.
黄涛 《电子质量》2002,(3):110-112
探讨了异构计算环境下的实时多媒体通信以及ATM(异步传输模式)网络上能提供服务保证的高性能宽带多媒体应用,设计了异构环境下基于Native-ATM(纯ATM)方式的实时多媒体通信系统,该系统在两不同的计算机系统之间实现了基于ATM AAL5协议的实时多媒体通信数据流的互通,为异构环境下宽带分布多媒体应用的研究创造了良好的基础。  相似文献   

18.
面向异构计算的能效感知调度研究   总被引:1,自引:0,他引:1       下载免费PDF全文
王静莲  龚斌 《电子学报》2016,44(4):893-897
异构调度可使大规模计算系统采用并行方式聚合广域分布的各种资源以提高性能.传统调度目标追时限约束求高性能而忽视高效能,远不能适应绿色计算科学发展要求.因此,本文在理论上一方面建立融合能效感知的调度模型;另一方面提出适于超计算机混合体系的多学科背景的元启发式优化算法.从技术上解决了面向不同环境目标的调度实施条件界定及调度指标(时间、能耗)实时变化描述等问题.大量仿真实验结果表明:与三个元启发式调度器相比,论文方法在能效及可扩展等方面优势明显;对于高维实例,整体性能改善分别达到8%,15%和17%.  相似文献   

19.
王旭  胡铮 《无线电工程》2007,37(11):1-3,8
个人周边智能设备与移动业务的融合促进了服务发现机制的发展,智能设备的增加和移动性也使得现有服务发现机制很难在用户移动当中始终提供有效服务。在对个人周边的异构网络特征分析的基础上,利用组播和信息熔合等技术,提供了一套适用于节点具有群组移动性、异构性的动态网络的可靠的服务发现机制,并且不会消耗过多的系统带宽资源。  相似文献   

20.
With the advance of network and computer techniques, the development of scalable computing becomes a new trend. To integrate and utilize distributed and heterogeneous resources efficiently, message broadcasting is an important and crucial technique for distributed computing systems such as grids and clouds. In this paper, we present a Location Aware Broadcasting Scheme (LABS) for performing message broadcast on irregular and heterogeneous networks in distributed systems. The LABS introduces a new scheduling scheme that based on heterogeneity of workstation and network topology. Together with a binomial tree optimization technique, the LABS is able to schedule communications to avoid both node and link contention. To evaluate the performance of the proposed techniques, we have implemented the LABS method along with some well‐known algorithms. These algorithms were performed in a variety of scenarios. Our extensive experiments show that the LABS is able to provide reliable performance with lower network latency in different circumstances. In particular, the LABS have significant improvements when the environment is with high heterogeneity. Copyright © 2014 John Wiley & Sons, Ltd.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号