期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘凯寇正《微型机与应用》2003,22(12):12-14

OpenMP的功能、执行方式和主要指令,用OpenMP对一个描述粒子运动的模式进行了并行优化。相似文献

2.

蔡佳佳李名世郑锋《微机发展》2007,17(10):87-91

随着四核微机走向市场和八十核处理器在实验室研制成功,多核正引领软件研发发生基础性变化。开发人员需要在代码中添加线程来利用系统所提供的多个内核,从而提升PC应用软件的功能和性能。文中探讨在多核微机上进行并行计算的实现技术。介绍了共享存储系统并行编程接口OpenMP的模型、指令和库函数,以及Intel C 编译器9.1和Microsoft Visual Studio 2005等对OpenMP的支持;着重探讨了二维离散快速傅里叶变换并行算法的设计、实现与优化技术;展望了高性能并行计算软构件库的开发前景。相似文献

3.

基于OpenMP多核架构下并行蚁群算法研究

赵辉徐俊刚《微型机与应用》2011,30(16):6-8,11

研究了一种基于OpenMP技术的多核架构下并行蚁群算法,通过在TSP问题中的实验表明,该算法易于操作,而且充分利用了多核处理器并行计算的优势,提高了算法的运行效率。相似文献

4.

OpenMP并行计算在侧向散射激光雷达数据处理中的应用

刘俊见陶宗明《计算机与数字工程》2019,47(2)

相似文献

5.

OpenMP在Android多核编程中的研究与运用

王冲杨斌《单片机与嵌入式系统应用》2014,(8):24-26

作为在桌面系统上兴起的技术,OpenMP在PC平台上已经非常成熟,但是在嵌入式领域,尤其是Android的开发大多还停留在传统的单核模式。Google推出的NDK R9提供了对OpenMP函数库的支持,本文介绍了OpenMp在Android上的运用,并对存在的问题进行了修正。相似文献

6.

OpenMP多核计算技术在SAR图像处理中的应用

程栋王卫红《计算机科学》2017,44(Z6):161-163, 187

SAR图像数据量大,常规识别算法复杂、处理耗时,难以满足实时性要求。针对这一问题,提出一种基于OpenMP多核计算的SAR图像目标分类算法。在分析基于模板匹配的SAR图像目标分类算法的基础上,给出基于OpenMP多核计算技术的图像处理并行处理框架,实现SAR图像目标分类算法的并行计算。最后,采用所提方法对3类目标进行分类识别实验,SAR图像分类识别的处理速度提高了8倍,表明了该方法是有效的。相似文献

7.

面向嵌入式多核的OpenMP扩展方法

王庆季振洲刘涛《计算机科学与探索》2011,5(1):81-86

为多核平台开发一种有效的编程方法已经成为并行软件研究的一个重要目标.在嵌入式多核平台上进行了OpenMP并行程序的有效的实施运行.针对嵌入式具有有限内存资源的特点,提出了通过扩展OpenMP自定义制导语句tiling来提高并行程序在嵌入式多核平台上的运行效率.扩展后的OpenMP并行程序支持循环分片,从而能够充分利用层... 相似文献

8.

基于OpenMP的分子动力学并行算法的性能分析与优化

白明泽程丽豆育升孙世新《计算机应用》2012,32(1):163-166

为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三角形方法。所提方法中每个线程所计算的粒子数固定,且粒子数目呈阶梯状上升,使得各线程能够错时到达临界区。从而使程序在临界区的闲置时间比Critical方法减半,加速比明显提高。相似文献

9.

基于OpenMP的事务存储同步语义研究

田祖伟李勇帆《计算机科学》2009,36(5):166-168

多核处理器环境下必须解决多核处理器的并行编程问题,才能够充分发挥多核处理器的性能.事务存储(Transactional Memory)机制提供了一种在多核环境下程序并行执行和同步的方法.已有的工作已将事务存储扩展到了OpenMP,为程序员提供满足事务原子性、一致性和隔离性的共享存储访问.但当前事务存储的语义并不完善,事务间不能交换中间结果,不能实现锁的部分语义.提出并实现了一种基于开放嵌套的事务存储的同步语义,从而解决了事务间不能交换中间结果的问题,增强了扩展事务存储后OpenMP的并行编程能力. 相似文献

10.

基于OpenMP的Multi-Critical分子动力学并行算法优化

段振华白明泽豆育升《计算机应用研究》2012,29(7):2432-2434

为提高分子动力学模拟在多核共享内存式服务器上的运算速度,在现有的分子动力学并行算法基础上提出了Multi-Critical算法。该算法使用手动划分力矩阵的方法,使多个线程进入不同名的临界区,并使用分块叠加的方法优化了并行算法,提高了并行效率。实验结果表明,对比之前的Critical算法,该算法的加速比和并行效率均有较大幅度的提高。相似文献