共查询到20条相似文献,搜索用时 46 毫秒
1.
随着社会生产生活的发展,对计算机的依赖越来越大,要解决庞大计算量的实际问题就需要高性能的计算机以及高速的计算方法。在应用蒙特卡洛方法求解非线性方程组时,利用多线程技术,串行改并行,使用WinAPI、OpenMP、MPI三种并行模式得出三种最优的并行计算方法。根据数值试验分析了各种计算模式的优缺点,发现MPI并行模式计算速度最快,最终得以结论并行计算模式可以推广到各种数值计算问题。 相似文献
2.
本文分析了非结构网格多群粒子输运Sn方程求解的并行性,拟合多核机群系统的特点,设计了MPI/OpenMP混合程序,针对空间网格点采用区域分解划分,计算结点间基于消息传递MPI编程,每个MPI计算进程在计算过程中碰到关于能群的计算,就生成多个OpenMP线程,计算结点内针对能群进行多线程并行计算。数值测试结果表明,非结构网格上的粒子输运问题的混合并行计算能较好地匹配多核机群系统的硬件结构,具有良好的可扩展性,可以扩展到1024个CPU核。 相似文献
3.
随着四核微机走向市场和八十核处理器在实验室研制成功,多核正引领软件研发发生基础性变化。开发人员需要在代码中添加线程来利用系统所提供的多个内核,从而提升PC应用软件的功能和性能。文中探讨在多核微机上进行并行计算的实现技术。介绍了共享存储系统并行编程接口OpenMP的模型、指令和库函数,以及Intel C 编译器9.1和Microsoft Visual Studio 2005等对OpenMP的支持;着重探讨了二维离散快速傅里叶变换并行算法的设计、实现与优化技术;展望了高性能并行计算软构件库的开发前景。 相似文献
4.
研究了一种基于OpenMP技术的多核架构下并行蚁群算法,通过在TSP问题中的实验表明,该算法易于操作,而且充分利用了多核处理器并行计算的优势,提高了算法的运行效率。 相似文献
5.
提出了一种基于Logistic模型的惯性权重非线性调整策略,采用OpenMP多线程编程,在微机上实现了微粒群算法的多核并行计算。通过对BenchMark测试函数集中的5个函数进行测试,试验结果表明,采用基于Logistic模型的惯性权重非线性调整策略在算法成功率和收敛代数都优于线性调整策略,而基于OpenMP的微粒群多核并行计算使得计算速度得到提高。 相似文献
6.
为应对传统遗传算法在处理大规模组合优化问题面临的进化速度缓慢,难以达到实时要求的严峻挑战,提出了一种在多核PC集群系统上实现“粗粒度一主从式”混合并行遗传算法的模型:通过把“粗粒度一主从式”并行遗传算法映射到多核PC集群上,结合消息传递和共享存储两种并行编程模型,在节点间使用消息传递模型(MPI),对应的遗传算法为粗粒度并行遗传算法,在节点内使用共享存储模型(OpcnMP),对应的遗传算法为主从式并行遗传算法,用MPI和OpenMP混合编程的方式以进程和线程两级并行在多核集群上实现具体的混合并行遗传算法。理论分析和实验结果表明,提出的实现模型有较好的性能,可大大改进传统遗传算法的缺陷。为利用并行遗传算法在普通多核PC集群上处理大规模组合优化问题提出了一种有效、可行的解决方案。 相似文献
7.
8.
多核并行技术在分子动力学模拟中的应用 总被引:1,自引:0,他引:1
为了充分利用多核处理器资源,研究了一种用于分子动力学模拟中的多核并行技术。在多核处理器上利用OpenMP技术实现多线程创建与同步、动态设置子线程的调度运行方式以及负载均衡以减少子线程执行等待时间。通过对不同分子体系结构下的动力学模型测试,得出在不同子线程下并行计算的时间,并且得到了良好的性能加速比。实验结果表明,采用OpenMP并行技术可有效地提高电荷求解过程在分子动力学模拟运算中的时间效率,以及多核计算机资源的利用率。 相似文献
9.
多核处理器的新特性使多核机群的存储层次更加复杂,同时也给MPI程序带来了新的优化空间.国内外学者提出了许多多核机群下MPI程序的优化方法和技术.测试了3个不同多核机群的通信性能,并分别在Intel与AMD多核机群下实验评估了几种具有普遍意义的优化技术:混合MPI/Op)MP、优化MPI运行时参数以及优化MPI进程摆放,同时对实验结果和优化性能进行了分析. 相似文献
10.
简要综述并行计算的思想,并对分布式内存结构和共享式内存结构两种结构的特点进行比较。叙述如何应用OpenMP和MPI进行混合编程,以及相应的混合编程模型。通过一个实例,针对多核CPU组成的SMP构架的集群,实现OpenMP和MPI混合编程的性能对比和结论分析。 相似文献
11.
12.
数据流驱动相比控制流驱动计算模式,更容易发掘应用程序的并行性,多线程是其必然结果.在嵌入式多核系统中,采用分布和并行的多个处理核来提供高计算能力.数据流驱动的多线程计算模式抽象其中的并行计算、通信、存储和资源限制等模式.适合用来描述多核系统的行为,对性能进行分析和预测.并指导系统设计和开发. 相似文献
13.
We have developed a high performance version of the Monte Carlo particle transport simulation code MC4. The original application code, developed in Visual Basic for Applications (VBA) for Microsoft Excel, was first rewritten in the C programming language for improving code portability. Several pseudo-random number generators have been also integrated and studied. The new MC4 version was then parallelized for shared and distributed-memory multiprocessor systems using the Message Passing Interface. Two parallel pseudo-random number generator libraries (SPRNG and DCMT) have been seamlessly integrated. The performance speedup of parallel MC4 has been studied on a variety of parallel computing architectures including an Intel Xeon server with 4 dual-core processors, a Sun cluster consisting of 16 nodes of 2 dual-core AMD Opteron processors and a 200 dual-processor HP cluster. For large problem size, which is limited only by the physical memory of the multiprocessor server, the speedup results are almost linear on all systems. We have validated the parallel implementation against the serial VBA and C implementations using the same random number generator. Our experimental results on the transport and energy loss of electrons in a water medium show that the serial and parallel codes are equivalent in accuracy. The present improvements allow for studying of higher particle energies with the use of more accurate physical models, and improve statistics as more particles tracks can be simulated in low response time. 相似文献
14.
15.
16.
Important components of molecular modeling applications are estimation and minimization of the internal energy of a molecule.
For macromolecules such as proteins and amino acids, energy estimation is performed using empirical equations known as force
fields. Over the past several decades, much effort has been directed towards improving the accuracy of these equations, and
the resulting increased accuracy has come at the expense of greater computational complexity. For example, the interactions
between a protein and surrounding water molecules have been modeled with improved accuracy using the generalized Born solvation
model, which increases the computational complexity to O (n
3). Fortunately, many force-field calculations are amenable to parallel execution. This paper describes the steps that were
required to transform the Born calculation from a serial program into a parallel program suitable for parallel execution in
both the OpenMP and MPI environments. Measurements of the parallel performance on a symmetric multiprocessor reveal that the
Born calculation scales well for up to 144 processors. In some cases the OpenMP implementation scales better than the MPI
implementation, but in other cases the MPI implementation scales better than the OpenMP implementation. However, in all cases
the OpenMP implementation performs better than the MPI implementation, and requires less programming effort as well.
Trademark Legend Sun, Sun Microsystems, SPARC, UltraSPARC, Sun Fire, Sun Performance Library and Sun HPC Cluster Tools are
trademarks or registered trademarks of Sun Microsystems, Inc. in the United States and other countries. 相似文献
17.
基于Win32平台下串行通信编程方法研究 总被引:1,自引:0,他引:1
介绍串行通信编程的三种方式,着重说明在VC环境下串行通信编程所需要的Win32 API函数和串行通信编程的基本流程。最后以计算机通过串口控制投影仪为例,利用Win32 API笔者成功地实现串行通信。 相似文献
18.
提出了一种基于多核的防病毒引擎的设计模型,并根据此模型实现了一款包含防病毒引擎的多核UTM(Unified Threat Management,统一威胁管理系统),经过测试表明,此款多核防病毒引擎的实现与传统防病毒引擎相比性能优异,可满足业务专网安全接入平台中的病毒防御需求。 相似文献
19.
非线性方程组求解的一种新方法 总被引:1,自引:0,他引:1
针对现有的非线性方程组求解方法不能同时收敛到所有解的问题,提出了一种混合小生境遗传算法的求解新方法.采用确定性拥挤小生境创造出种群的小生境进化环境,克服遗传算法的遗传漂移现象,维持种群的多样性,使算法能同时收敛到多个解;以拟牛顿算法作为遗传算法的局部搜索算子进行精确搜索,进一步提高算法收敛速度和精度.选择了几组典型的多解非线性方程组进行了求解验证,结果表明所设计的混合小生境遗传算法能在解的定义域内同时收敛到所有解,收敛速度快、精度高,是求解非线性方程组全局解的一种有效方法. 相似文献