首页 | 本学科首页   官方微博 | 高级检索  
     

排序算法在龙芯3A上的优化实现
引用本文:翁玉萍,顾乃杰,李恺,陈强.排序算法在龙芯3A上的优化实现[J].计算机工程,2011,37(20):255-257.
作者姓名:翁玉萍  顾乃杰  李恺  陈强
作者单位:中国科学技术大学计算机科学与技术学院安徽省计算与通讯软件重点实验室,合肥,230027
基金项目:国家“863”计划基金资助项目(2008AA010902);国家自然科学基金资助项目(60803066)
摘    要:分析归并排序算法和快速排序算法,根据国产CPU龙芯3A的体系结构特性,提出2种优化算法并进行实现。综合利用访存特性,引入拷贝优化、循环展开、交换操作优化和不同基本排序混用等优化技术。测试结果表明,在不影响排序稳定性的前提下,与Glibc 2.11库中的排序函数相比,2种优化算法均能提升16.9%~90.5%的排序性能。

关 键 词:龙芯3A  归并排序  快速排序  优化算法  循环展开
收稿时间:2010-04-14

Optimized Implementation of Sorting Algorithm on Loongson 3A
WENG Yu-ping,GU Nai-jie,LI Kai,CHEN Qiang.Optimized Implementation of Sorting Algorithm on Loongson 3A[J].Computer Engineering,2011,37(20):255-257.
Authors:WENG Yu-ping  GU Nai-jie  LI Kai  CHEN Qiang
Affiliation:(Anhui Province Key Laboratory of Computing and Communication Software,School of Computer Science and Technology,University of Science and Technology of China,Hefei 230027,China)
Abstract:Through analysis of the characteristics of merging sorting and quick sorting,this paper presents two optimized algorithms specially for Loongson 3A CPU's features.To boost the performance,it adapts various optimizing techniques including utilize the characteristic of memory access,copy optimization,loop unrolling,operation exchanging and compounding different basic sorting algorithms.Without losing the robustness,sorting performance on Loongson 3A is improved by about 16.9% to 90.5% in different situations,compared to the sorting function in Glibc 2.11.
Keywords:Loongson 3A  merging sorting  quick sorting  optimization algorithm  loop unrolling
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号