共查询到18条相似文献,搜索用时 62 毫秒
1.
焦永 《数字社区&智能家居》2013,(9):2242-2245,2263
单精度浮点倒数开方运算在GPU设计中经常会用到。实现这种运算一般有两种方法,迭代法和查表法。迭代法要根据精度要求确定迭代次数,只需要很小的存储器保存迭代初值,但需要的运算器数量较多。查表法根据输入的数据直接从ROM中查表得到结果,需要占用的存储资源比较多。该文提出了一种间接查表法实现的浮点倒数开方运算实现方法,将迭代法和直接查表法的优点结合起来。经过理论推导和硬件仿真验证,该算法能够满足单精度浮点数的运算精度。 相似文献
2.
3.
4.
介绍了两种微控制器快速开方算法:改进牛顿-拉夫逊算法和模拟手算开方算法。前者是以牛顿-拉夫逊算法为基础的一种改进算法;后者是模拟手算开方过程实现开方的微控制器算法,这两种算法都具有较高的开方速度和计算精度。笔者以32位数开方为例,详细介绍了这两种算法用汇编语言实现的过程,并给出算法实现的流程图,最后根据两种算法的特点和实际运算时间,总结了两种算法的优缺点。 相似文献
5.
快速开方算法在微控制器上的实现 总被引:3,自引:0,他引:3
介绍了两种微控制器快速开方算法:改进牛顿-拉夫逊算法和模拟手算开方算法。前者是以牛顿-拉夫逊算法为基础的一种改进算法;后者是模拟手算开方过程实现开方的微控制器算法,这两种算法都具有较高的开方速度和计算精度。笔者以32位数开方为例,详细介绍了这两种算法用汇编语言实现的过程,并给出算法实现的流程图,最后根据两种算法的特点和实际运算时间,总结了两种算法的优缺点。 相似文献
6.
7.
浮点加法器电路设计算法的研究 总被引:7,自引:0,他引:7
介绍了浮点加法器电路设计的基本算法,阐述了近年来有关浮点加法器电路设计算法研究的成果。对目前所普遍采用的Two-Path算法及其改进算法进行了详细地分析。描述了快速规格化的关键技术——前导1的预判的基本原理。最后提出了一种进一步改进Two—Path算法的方案。 相似文献
8.
硬件设计中发展了许多除法运算算法,各算法在商收敛性速度、基本硬件单元和数学公式等许多方面均不相同。通过对现在较流行的浮点除法和平方根运算算法进行介绍,分析各浮点除法和平方根运算算法的思路和适合的不同场合,比较各自的优缺点。举例说明LSFT32处理器中浮点除法算法的选择。只有当算法的思路及其特点与运算器的结构相匹配时才能充分发挥速度和规模的优势,所选用的算法才是有意义的。 相似文献
9.
硬件设计中发展了许多除法运算算法,各算法在商收敛性速度、基本硬件单元和数学公式等许多方面均不相同。通过对现在较流行的浮点除法和平方根运算算法进行介绍,分析各浮点除法和平方根运算算法的思路和适合的不同场合,比较各自的优缺点。举例说明LSFT32处理器中浮点除法算法的选择。只有当算法的思路及其特点与运算器的结构相匹配时才能充分发挥速度和规模的优势,所选用的算法才是有意义的。 相似文献
10.
11.
12.
快速相对移位法浮点多字节开平方运算 总被引:1,自引:2,他引:1
介绍一种可在微型机上由汇编语言完成的快速多字节浮点开平方运算方法,它具有精度高,速度快和使用方便等特点,解决了快速四则运算,特别是乘除法运算之后,为快速的函数运算,如Y=sin(X)等打下了基础,要解决函数的快速运算,函数所采用的方法及共数学构造很重,但是作为其基础,大量使用的四则运算及开平方运算的速度也问题的关键所在。 相似文献
13.
14.
15.
介绍了常用的计算二次剩余平方根的方法,一类是基于剩余扩展来求解平方根,另一类是基于分离对数来求解平方根,并对这些方法的具体原理进行了详细介绍和分析,给出了其中一些方法的主要实现步骤,另外,还对一个基于分离对数方法的具体实现作了研究。 相似文献
16.
平方根容积卡尔曼滤波具有良好的数值稳定性与滤波效率,针对滤波中状态函数与实际不符带来的误差对滤波造成的影响,将基于预测残差统计量的自适应因子和最优自适应因子与平方根容积卡尔曼滤波算法相结合以降低预测信息在滤波中的权重,并将平方根容积卡尔曼滤波与带自适应因子的平方根容积卡尔曼滤波用于GPS动态单点定位数据处理,最后用航摄飞机实测GPS动态观测数据验证了算法的有效性。 相似文献
17.
本文提出了一种有效的高速乘法器结构,该结构具有连线简单、速度快的优点,阐述了用传输管实现的串行进位加法器、存储进位加法器(CSA)和子倍数选择电路的设计思想。 相似文献
18.
在计算机图形学、积分计算和神经网络等应用场景中,平方根函数的高性能实现在构建处理器的基础软件生态中起到了十分重要的作用.随着A RM架构处理器得到广泛的使用,研究A RM架构下的函数快速算法实现变得更加关键.当前大量处理器都采用了SIMD架构,所以,研究基于SIMD实现高性能函数计算方法具有重要的研究意义和发展前景.因此,对平方根函数进行了高性能的实现与优化.通过分析IEEE 754标准的浮点数在内存中的存储格式,设计了高效的平方根函数算法;然后通过结合平方根倒数和泰勒公式算法,进一步提高了算法精度;最后通过SIMD优化进一步提升了算法性能.实验结果表明,在满足精度的前提下,相比于libm算法库,实现的平方根函数的,性能提高了约7倍,相比于A RM V8提供的计算平方根的指令在性能上提高了约3倍. 相似文献