共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
3.
对多区结构网格大规模CFD流场模拟的高效并行方法进行了研究,以天河超级计算机平台的CPU同构计算环境和CPU+MIC异构计算环境为例,重点讨论了CFD应用特点与超级计算机运行环境相适应的性能优化与改进策略,发展了一系列多层次并行与性能优化方法.通过在天河2高性能计算平台上进行了多个算例的数值模拟,验证了这些优化方法的并行效果;在CPU+MIC异构平台上模拟的最大CFD问题规模达到6800亿个网格单元,共使用137.6万CPU+MIC处理器核,测试结果表明在CPU+MIC异构平台上移植优化后的程序性能提高2.6倍左右,且具有良好的可扩展性. 相似文献
4.
<正>传统单核处理器对复杂任务的处理能力不够,多核处理器系统的提出可以很好解决问题。分析了多核处理器系统中同构多核处理器与异构多核处理器的系统特点和结构特征,总结对比了每个结构的优劣势,分析研究了多核处理器的任务调度算法,核间通信机制,核间互斥与中断机制等问题,指出了处理器系统未来的发展方向。近些年来,随着物联网和5G技术的快速发展,对嵌入式实时系统的应用需求日趋复杂,对于处理器性能的要求也随之提高,原来通过提高CPU主频提升处理器性能的方式由于高功耗的制约受到很大挑战,因此多核处理器构架作为新的解决方案被提出,并得到越来越多的关注。 相似文献
5.
随着科技的进步,目前CPU+GPU+I/O技术广泛应用于非线性编辑系统中,在分析传统有卡非线性编辑系统的基础上,介绍基于CPU+GPU+I/O卡的非线性编辑系统的原理、特点和优势,并介绍了基于CPU+GPU+I/O卡设备的应用。 相似文献
6.
刘钢锋 《微电子学与计算机》2013,30(2)
随着微处理器技术的发展,GPU/CPU的混合计算已经成为是科学计算的主流趋势.本文从编程的层面,介绍了如何利用已有的并行编程语言来,调度GPU的计算功能,主要以MPI(一种消息传递编程模型)与基于GPU的CUDA(统一计算设备架构)编程模型相结合的方式进行GPU集群程序的测试,并分析了CPU/GPU集群并行环境下的运行特点.从分析的特点中总结出GPU集群较优策略,从而为提高CPU/GPU并行程序性能提供科学依据. 相似文献
7.
8.
9.
面对互联时代海量的信息数据,图形处理器凭借极强的并行计算处理能力,通过GPU+CPU的架构为现代无线接入网设备的信号处理,提供了一种理想的技术手段。文章设计了一款基于CUDA编程接口的GPU Trace模块,用于在GPU+CPU平台架构中跟踪记录GPU的运行信息。 相似文献
10.
现在CPU+GPU技术已被广泛地应用到非线性编辑系统中,本文阐述了非线性编辑系统架构的发展历程,并从GPU技术的实质出发,介绍了CPU+GPU架构非编系统的工作原理、特性和发展前景等. 相似文献
11.
12.
人们对后3G的要求是:在全球范围内实现无缝覆盖,进行包括语音、文本、图像、视频等在内的高速多媒体通信。为此,在有限频谱资源条件下,必须缩短无线信号的传输半径,极大限度地复用频谱资源,提高单位空间的信道容量。采用各种先进的无线传输技术的无线传输网络则在中、小范围内提供高速率、高质量的无线移动通信服务。因而WLAN和WPAN的需求和应用在不断增长,超宽带(UWB,ultra wide-band)等短距离、高空间容量的技术日益兴起,成为目前无线通信领域的热点。UWB的核心是冲激无线电技术,即利用持续时间非常短(纳秒、亚纳秒级)的脉冲波形来… 相似文献
13.
扩展性是衡量高性能并行系统的一个关键要素,而扩展性的研究主要集中在同构的高性能系统上,异构系统研究的文献很少. 本文以异构系统为研究对象,根据实际应用任务,将计算任务分为三类:单任务模型、元任务池模型和fork-join任务队列模型,并给出这三类计算任务的定义. 提出描述基于计算任务和体系结构相匹配的异构计算系统匹配矩阵,给出异构计算的可扩展性定义. 针对上述三种计算任务模型以及异构匹配给出异构系统的可扩展性条件,为异构系统的可扩展性提供了理论依据. 用实例分析证实了这种方法的有效性. 相似文献
14.
15.
16.
17.
探讨了异构计算环境下的实时多媒体通信以及ATM(异步传输模式)网络上能提供服务保证的高性能宽带多媒体应用,设计了异构环境下基于Native-ATM(纯ATM)方式的实时多媒体通信系统,该系统在两不同的计算机系统之间实现了基于ATM AAL5协议的实时多媒体通信数据流的互通,为异构环境下宽带分布多媒体应用的研究创造了良好的基础。 相似文献
18.
异构调度可使大规模计算系统采用并行方式聚合广域分布的各种资源以提高性能.传统调度目标追时限约束求高性能而忽视高效能,远不能适应绿色计算科学发展要求.因此,本文在理论上一方面建立融合能效感知的调度模型;另一方面提出适于超计算机混合体系的多学科背景的元启发式优化算法.从技术上解决了面向不同环境目标的调度实施条件界定及调度指标(时间、能耗)实时变化描述等问题.大量仿真实验结果表明:与三个元启发式调度器相比,论文方法在能效及可扩展等方面优势明显;对于高维实例,整体性能改善分别达到8%,15%和17%. 相似文献
19.
个人周边智能设备与移动业务的融合促进了服务发现机制的发展,智能设备的增加和移动性也使得现有服务发现机制很难在用户移动当中始终提供有效服务。在对个人周边的异构网络特征分析的基础上,利用组播和信息熔合等技术,提供了一套适用于节点具有群组移动性、异构性的动态网络的可靠的服务发现机制,并且不会消耗过多的系统带宽资源。 相似文献
20.
Ching‐Hsien Hsu Tai‐Lung Chen Chao‐Tung Yang Hai‐Cheng Chu 《International Journal of Communication Systems》2015,28(5):952-971
With the advance of network and computer techniques, the development of scalable computing becomes a new trend. To integrate and utilize distributed and heterogeneous resources efficiently, message broadcasting is an important and crucial technique for distributed computing systems such as grids and clouds. In this paper, we present a Location Aware Broadcasting Scheme (LABS) for performing message broadcast on irregular and heterogeneous networks in distributed systems. The LABS introduces a new scheduling scheme that based on heterogeneity of workstation and network topology. Together with a binomial tree optimization technique, the LABS is able to schedule communications to avoid both node and link contention. To evaluate the performance of the proposed techniques, we have implemented the LABS method along with some well‐known algorithms. These algorithms were performed in a variety of scenarios. Our extensive experiments show that the LABS is able to provide reliable performance with lower network latency in different circumstances. In particular, the LABS have significant improvements when the environment is with high heterogeneity. Copyright © 2014 John Wiley & Sons, Ltd. 相似文献