首页 | 本学科首页   官方微博 | 高级检索  
     

NTRU加解密算法的GPU实现研究
引用本文:朱瑶,严承华,李强.NTRU加解密算法的GPU实现研究[J].计算机工程与应用,2011,47(34):81-85.
作者姓名:朱瑶  严承华  李强
作者单位:海军工程大学电子工程学院,武汉,430033
基金项目:全军军事学研究生课题(No.2010JY0698-403)
摘    要:GPU拥有高度并行性和可编码的特点,在大规模数据并行计算方面得到广泛应用。NTRU算法是一种安全性高,易于并行化的公钥密码算法。研究了NTRU算法基于CUDA的并行化实现技术,将计算中最耗时的卷积运算分解到多个线程并行计算,引入大量的独立并发的加解密线程块来完成整个加解密过程,并给出了具体的数据编码及存储结构、线程组织以及基于合并访问和共享内存的性能优化技术。实验结果表明,基于CUDA的NTRU加解密算法实现了硬件加速,相对于NTRU算法在CPU的实现,CUDA实现能够达到12.38MB/s的吞吐量,可获得最大为95倍的加速比。

关 键 词:统一计算设备架构  图形处理单元  NTRU算法  并行
修稿时间: 

Research of NTRU encryption and decryption algorithm with GPU
ZHU Yao,YAN Chenghua,LI Qiang.Research of NTRU encryption and decryption algorithm with GPU[J].Computer Engineering and Applications,2011,47(34):81-85.
Authors:ZHU Yao  YAN Chenghua  LI Qiang
Affiliation:ZHU Yao,YAN Chenghua,LI Qiang School of Electronic Engineering,Naval University of Engineering,Wuhan 430033,China
Abstract:Graphic Processing Uni(tGPU) has a advantage of high parallelism and programmable,which is applied widely to massive data parallel compute.NTRU is a public key cryptography algorithm which has a high security and is easy to be parallel.A high performance implementation of NTRU algorithm based on Compute Unified Device Architecture(CUDA) is presented.The most time-consuming convolution is divided into several parallel threads to compute and the whole CUDA implementation of NTRU is large amount of independent...
Keywords:Compute Unified Device Architecture(CUDA)  Graphic Processing Uni(tGPU)  NTRU algorithm  parallelization  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号