期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李忠彭代渊郝悦彤《计算机科学》2009,36(3):158-160

有限域GF(2n)上乘法运算是影响GF(2n)上椭圆曲线密码实现效率的关键运算之一.基于窗口技术的comb乘法算法,被认为是目前有限域GF(2n)上乘法运算最快的算法之一.但是,它仍然使用了移位操作,而移位操作恰好又是域GF(2n)乘法运算中很耗时的操作.提出并实现了一种新的基于窗口技术的快速comb乘法算法,该算法避免了移位操作,且不增加异或运算次数.理论分析和实验结果表明,新算法有很好的实现效率,适合于有限域GF(2n)上椭圆曲线密码算法的软件实现. 相似文献

2.

优化正规基域元素乘法的快速计算

下载免费PDF全文

王红霞赵宪生周贇覃思《计算机工程》2008,34(24):79-81

给出基域GF(2m)上优化正规基域元素乘法的一般计算公式,针对Rosing算法中预计算较多的问题,结合Ning-Yin算法思想,提出一种改进算法和3种预计算方法。与Ning-Yin算法相比,改进算法的效率提高了约20%。相似文献

3.

GF(2m)上自适应正规基乘法器的FPGA实现

王峰《微计算机信息》2007,23(17):221-222

本文从实际应用出发,研究了GF(2m)上基于正规基的乘法运算的FPGA的实现。采用w-SMPOⅡ算法,FPGA实现了任意域长m上的任意字长w的乘法器。并给出了几个域上的乘法器的面积和速度的比较分析。相似文献

4.

基于CUDA架构矩阵乘法的研究

马梦琦刘羽曾胜田《微型机与应用》2011,30(24):62-64,68

首先介绍了CUDA架构特点,在GPU上基于CUDA使用两种方法实现了矩阵乘法,并根据CUDA特有的软硬件架构对矩阵乘法进行了优化。然后计算GPU峰值比并进行了分析。实验结果表明,基于CUDA的矩阵乘法相对于CPU矩阵乘法获得了很高的加速比,最高加速比达到1079.64。GPU浮点运算能力得到有效利用,峰值比最高达到30.85%。相似文献

5.

对称密码中复合域乘法运算可重构设计研究

李淼徐建博《信息网络安全》2012,(8):226-229

复合域乘法运算是对称密码算法中的基本运算和重要模块,因操作复杂且计算时间长,其实现性能在很大程度上制约着对称密码算法的运算速度。文章研究了对称密码算法中的复合域乘法运算特点及实现原理,设计了以GF（28）为基域,扩展到GF（（28 ）h（k=1,2,3,4）域上的复合域乘法可重构架构,通过配置能够灵活高效地实现GF（2 8）、GF（（2H）2）、GF（2 8）3、CF（（28）4）域上的有限域乘法操作。同时结合处理器的指令设计方法,设计了通用的复合域乘法操作及配置指令,能够极大的提高对称密码算法中复合域乘法运算的处理效率。最后文章对复合域乘法可重构架构进行了模拟与验证,在0．18μmCMOS工艺标准单元库下进行逻辑综合以及布局布线,并对综合结果进行了性能评估。结果表明,文章提出的复合域乘法可重构架构及相应的专用指令,在灵活性的前提下提供了较高的执行效率,具有较高的实用价值。相似文献

6.

有限域GF(2m)模逆算法的改进与实现

下载免费PDF全文

杨先文李峥《计算机工程》2008,34(18):202-203

在椭圆曲线密码体制中,有限域GF(2m)中模逆运算是最重要的运算之一。在分析一种通用有限域GF(2m)模逆算法的基础上,提出改进算法。改进算法减少了原算法快速实现时的缺点,能够有效地提高算法效率。基于FPGA分别实现了GF(283)和GF(2233)中模逆算法模块,并与2种已有实现结果进行了对比。结果表明,选取有限域GF(283)和GF(2233)时,改进算法效率提高率分别约为72.9%和59.5%。相似文献

7.

GF（2^m）上自适应正规基乘法器的FPGA实现

王峰《微计算机信息》2007,(17):221-222,242

本文从实际应用出发,研究了GF：2^m）上基于正规基的乘法运算的FPGA的实现.采用w-SMPOⅡ算法,FPGA实现了任意域长m上的任意字长w的乘法器.并给出了几个域上的乘法器的面积和速度的比较分析. 相似文献

8.

多核/众核平台上推荐算法的实现与性能评估

陈静方建滨唐滔杨灿群《计算机科学》2017,44(10):71-74

用OpenCL语言标准设计并实现了推荐系统领域的两种经典算法:交替最小二乘法(Alternating Least Squares,ALS)与循环坐标下降法(Cyclic Coordinate Descent,CCD)。将其应用到CPU,GPU,MIC多核与众核平台上,探索了在该平台上影响算法性能的因子:潜在特征维数与线程个数。同时,将OpenCL实现的两种算法与CUDA和OpenMP的实现进行比较,得出了一系列结论。在同等条件下,与ALS算法相比,CCD算法的精度更高,收敛速度更快且更稳定,但所耗时间更长。ALS和CCD算法基于OpenCL的实现性能不亚于CUDA(CCD 上加速比为1.03x,ALS上加速比为1.2x)和OpenMP的实现(CCD与ALS上加速比大约为1.6~1.7x),并且两种算法在CPU平台上的性能均比GPU与MIC好。相似文献

9.

基于CUDA平台的FIR滤波算法的设计与优化

郭海凤李莉《计算机技术与发展》2014,(3):102-105,167

针对目前基于普通DSP的FIR算法速度低、扩展性差的缺点,提出并实现基于CUDA平台实现的FIR滤波算法。由于在CUDA中程序可以直接操作数据而无需借助于图形系统的API,使开发者能够在GPU 强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。该算法将CUDA用于FIR滤波器输入输出关系计算,采用矩阵乘法的并行运算技术,在GPU上建立并行滤波模型,并对算法进行了优化。实验结果表明,在Tesla C1060平台上,和传统的基于DSP的FIR滤波算法计算速度相比,基于CUDA平台计算FIR滤波算法时,其加速比可接近30,解决了传统基于DSP计算FIR滤波算法速度较慢、扩展性差的问题。相似文献

10.

基于GF(2m)域上椭圆曲线数字签名的快速实现

梁建霞苏广川《计算机应用与软件》2005,22(4):96-98

椭圆曲线数字签名是基于乘法群的离散对数数字签名在椭圆曲线上的模拟。本文讨论了椭圆曲线数字签名算法(ECDSA)在GF(2^m)域上的软件实现,提出了一种基于固定基的核心点乘运算的快速算法,提高了数字签名和签名验证的速度。相似文献