面向国产高性能众核处理器的编程模型 |
| |
引用本文: | 陈虎,周鹏灵.面向国产高性能众核处理器的编程模型[J].计算机应用,2023(11):3517-3526. |
| |
作者姓名: | 陈虎 周鹏灵 |
| |
作者单位: | 1. 华南理工大学软件学院;2. 广东省高性能计算重点实验室 |
| |
基金项目: | 国家自然科学基金重点项目(U1836207); |
| |
摘 要: | 在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一方面基于消息队列机制开发国产高性能众核处理器的线程级并行机制;另一方面基于单指令多数据流(SIMD)编程模型开发从核上的数据级并行性。首先,对国产高性能众核处理器体系结构进行抽象;其次,设计模型的消息队列机制,并为程序员提供一套异构并行编程接口,如系统参数接口、从核线程控制接口、消息队列接口、SIMD抽象接口;最后,在上述基础上形成全新的高性能计算软件开发模型和方法,方便用户开发基于国产高性能众核处理器的并行计算软件。性能传输测试结果表明,在国产众核处理器上,当启动核数较少时,所提模型的传输带宽普遍达到了峰值直接内存访问(DMA)带宽的90%;当启动的核数较多时,消息队列模型的传输带宽普遍达到了峰值DMA带宽的70%。在矩阵乘法实验中,与系统原语传输矩阵并计算的性能相比,所提模型的性能达到前者的90%;在口令猜测系统中,所提模型的代码性能与直接使用最底层的接口开发的代...
|
关 键 词: | 国产众核处理器 单指令多数据流 并行编程模型 SW26010 消息队列模型 |
|