排序方式: 共有9条查询结果,搜索用时 15 毫秒
1
1.
2.
针对目前快速多极子算法中PP问题在图形处理器上实现的缺点,如负载不平衡和计算规模受显存大小的限制等,提出了一种新的基于统一计算设备架构平台的实现方法。采取以Box为并行单位、在内存中开辟缓冲区与多线程流水计算等方式,使其适合于CPU和GPU组成的异构体系结构,充分利用CUDA编程模型的高并行性加速PP问题。实验结果表明,采用CUDA加速后,PP问题的计算时间明显降低,提高了整个FMM模拟效率,适合于各种多体问题的实时模拟。 相似文献
3.
针对FPGA能较好满足高性能计算的异构多核、并行、低成本、低能耗要求,研究了高性能计算的重要的应用之一——多体问题。分析了多体问题应用广泛的FMM算法以及FMM算法的各个算粒,并在FPGA器件实现算粒,与多核CPU上实现这些算粒进行比较,FPGA都获得了不错的加速比。分析了FPGA应用高性能计算的一些优势和当前面临的问题,对FPGA广泛应用高性能计算进行了初步探索。 相似文献
4.
5.
6.
传统媒体服务器仅能处理PSTN网络内的呼叫,通信处理能力弱,而且不易有效管理通信线路.IP媒体服务器继承PSTN网络上的业务,且能很好地处理IP网和PSTN网间的相互呼叫和通信,可提供多种业务,如全局交互式语音应答系统、会议、IP语音与传真、分布式呼叫中心等.结合专用板卡,采用C++设计了一个开放性、可扩展的平台.作为下一代网络的重刎要组成部分,IP媒体服务器将促进新的增值业务的发展. 相似文献
7.
对密集计算网格的资源进行角色分类,采用了基于作业优先级和资源优先级的作业调度算法,设计和实现了网格作业管理模块,为用户提供了一个有效的网格资源的使用方法,实现了对网格资源的优化使用,为网格用户提供了更好的网格资源服务共享。 相似文献
8.
FMM算法[1]是基于树结构的,用于解决多体问题(N-Body)的经典算法。它将N-Body问题的计算复杂度由O(N2)降为O(N),并且能达到任意精度。通用CPU在计算规模较大的N-Body问题时需要耗费大量的时间。为了加速算法的执行,本文对FMM算法在Cell/B.E.处理器上的实现进行了分析与验证。首先从功能上将FMM算法分解为八个核心过程,在此基础上根据计算特点的不同,对八个核心过程进行归类,最后选取其中有代表性的核心步骤,阐述了其在Cell/B.E.上实现的可行性问题,以及部分核心步骤的设计和实现过程。实验结果表明,选定的FMM算法核心步骤在Cell/B.E.上可以获得相对通用CPU较高的加速比。 相似文献
9.
1