面向DCU非一致控制流的编译优化期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

面向DCU非一致控制流的编译优化

引用本文：	杨小艺,赵荣彩,王洪生,韩林,徐坤坤.面向DCU非一致控制流的编译优化[J].计算机应用,2023(10):3170-3177.

作者姓名：	杨小艺赵荣彩王洪生韩林徐坤坤

作者单位：	1. 郑州大学计算机与人工智能学院

基金项目：	河南省重大科技专项（221100210600）~~；

摘要：	国产DCU采用单指令多线程（SIMT）的并行执行模型，在程序执行时核函数内会产生非一致控制流，导致线程束中的线程部分只能串行执行，即线程束分化。针对核函数的性能因线程束分化受到严重制约的问题，提出一种减少线程束分化时间的编译优化方法——部分控制流合并（PCFM）。首先，通过散度分析找到同构且含有大量相同指令和相似指令的可融合发散区域；其次，统计合并后节省的指令周期百分比，从而评估可融合发散区域的融合盈利；最后，查找对齐序列，并合并有收益的可融合发散区域。在DCU上使用PCFM测试从图形处理器（GPU）基准测试套件Rodinia和经典的排序算法中选择的测试用例，实验结果表明，PCFM对测试用例能够取得1.146的平均加速比，与分支融合+尾合并方法相比，使用PCFM的加速比平均提高了5.72%。可见，所提方法减少线程束分化的效果更好。
关键词：	DCU 单指令多线程线程束分化复杂控制流编译优化