首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
一种改进的超越函数通用算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种适用于高性能计算的基础数学库超越函数通用算法。基于转换、近似、重建等技术,对级数法和迭代法进行改进,运用函数收敛性最好的一段区间进行函数算法设计,通过减少运算次数来降低因多次运算导致的累积误差,保证函数算法的精度。利用查表法构造辅助表参与运算,减少算法开销。测试结果表明,与GNU数学库函数相比,基于该算法的数学库函数运行效率平均提升50.91%。  相似文献   

2.
3.
基础数学函数库是计算机系统非常关键的软件模块,然而国产申威平台上的长向量超越函数只能依靠循环调用系统标量函数来间接实现,该方法无法充分发挥申威平台SIMD扩展部件的计算性能.为了有效解决此问题,实现了申威平台基于SIMD扩展部件底层优化的长向量超越函数,提出了浮点计算融合算法,解决了两分支结构算法难以向量化的问题;提出了基于Estrin算法动态分组的大阶数多项式实现方法,提高了多项式汇编计算的流水性能.这是在国产申威平台上首次实现长向量超越函数库,提供的函数接口包含三角函数、反三角函数、对数函数、指数函数等.实验结果表明,双精度版本最大误差控制在3.5ULP(unit in the last place)以下,单精度版本最大误差控制在0.5ULP以下,该性能与申威平台直接循环调用系统标量函数相比有显著提高,平均加速比为3.71.  相似文献   

4.
基础数学函数库是高性能计算机中最基础、最核心的底层软件之一, 它的性能直接决定了上层计算程序的运行效率. 现版本的国产申威基础数学库中部分函数使用rfpcr和wfpcr指令导致流水线中断, 降低了函数的性能.针对这个问题, 本文结合函数的功能和指令特性, 提出指令段功能等效替换方法. 实验表明, 运用该方法, 使得函数...  相似文献   

5.
基于移位加的坐标旋转数字计算机算法是用硬件实现超越函数的最简单方法。本文首先介绍了这种算法的工作方式和计算超越函数的具体过程,并设计了一个80位嵌入式超越函数运算器;然后从该处理器的设计构思和系统结构,到处理器内部各单元的设计,进行了比较详尽的阐述;最后给出了对该设计进行软件仿真的结果。  相似文献   

6.
随着科技的飞速发展,现如今世界已经步入信息时代,掌握一定的计算机技能是每一个当代人必备的一项生存手段。计算机学习和数学知识紧密联系在一起,我们数学中经常见到的初等函数比如对数函数、指数函数以及三角函数等都叫做超越函数,如何用超越函数来做一些基本简单的计算机算法编程呢?这对于初学计算机编程的人员来讲,是非常有必要学习和掌握的,笔者通过对于数学知识中超越函数的理解和总结,开深入探讨将其应用于计算机的算法研究中,希望,本文的研究能够为广大运用计算机编程和制作算法的工作者和学习者带来些许帮助。  相似文献   

7.
介绍自主设计的龙腾C2微处理器中浮点运算单元的设计与实现.该处理器与Intel 80486DX4指令系统兼容,支持IEEE 754标准扩展精度的浮点基本函数和超越函数运算.介绍了浮点运算单元的结构,分析了实现超越函数的高精度CORDIC算法的流程,讨论了实现浮点超越函数运算的数据通路和控制通路结构,并给出了仿真结果和精度评估结果.仿真和分析的结果表明,浮点运算单元的设计满足龙腾C2微处理器的设计要求.  相似文献   

8.
基于窗函数和特征滤波器的半带滤波器设计   总被引:4,自引:0,他引:4  
研究半带滤波器设计优化问题.半带滤波器是一种特殊的低通FIR数字滤波器,通带和阻带关于二分之一Nyquist频率对称,因而有近一半的滤波器系数为0,用来实现数字滤波可以大幅度地减少运算量,有利于滤波器的实时实现.为实现上述优化,采用两种方法来设计半带FIR滤波器,一种是传统的窗函数法,一种是特征滤波器法.基于半带FIR滤波器的频率特性,用窗函数法和特征滤波器法的半带FIR滤波器仿真结果表明,提出的方法为半带滤波器优化设计提供了参考.  相似文献   

9.
介绍自主设计的龙腾C2微处理器中浮点运算单元的设计与实现。该处理器与Intel80486DX4指令系统兼容,支持IEEE754标准扩展精度的浮点基本函数和超越函数运算。介绍了浮点运算单元的结构,分析了实现超越函数的高精度CORDIC算法的流程,讨论了实现浮点超越函数运算的数据通路和控制通路结构,并给出了仿真结果和精度评估结果。仿真和分析的结果表明,浮点运算单元的设计满足龙腾C2微处理器的设计要求。  相似文献   

10.
BLAS (Basic Linear Algebra Subprograms)是一个基本线性代数操作的数学函数标准, 该库函数分为三个级别, 每个级别提供了向量与向量(1级)、向量与矩阵(2级)、向量与向量(三级)之间的基本运算. 本文研究了在申威1621处理器上BLAS一级函数的优化方案, 以函数AXPY为例, 充分...  相似文献   

11.
点积函数是BLAS库中的一级基础函数,其被科学计算等领域广泛调用.由于浮点计算会引入舍入误差,现有BLAS库中双精度点积函数不足以满足某些应用领域的精度要求,因此需要高精度算法来实现更精确可靠的计算.在本文中,面向国产申威1621平台,在现有的BLAS库的基础上,新增高精度点积函数的实现接口,来满足应用的高精度需求.同时,对于高精度点积算法运用循环展开、访存优化、指令重排等优化策略,实现汇编级手工优化.实验结果显示,文中高精度点积算法的计算结果精度,近似达到了双精度点积的两倍,有效提升了原始算法精度.同时,在保证精度提升的基础上,文中优化后的高精度点积函数相比未优化前,平均性能加速比达到了1.61.  相似文献   

12.
基于CORDIC算法的高精度浮点超越函数的FPGA实现   总被引:2,自引:1,他引:2  
提出了一种新的输入输出浮点处理单元硬件架构,将数据从CORDIC算法内部格式转换为处理器能够支持的IEEE754标准浮点数据格式。输入数据支持2种不同的角度单位浮点数据直接输入,同时,硬件模块还直接支持超过360°的大角度数据输入。在Altera公司NiosⅡ处理器系统中以用户自定义指令的形式实现了该浮点硬件计算模块,并通过C语言程序验证了该模块的正确性。  相似文献   

13.
邓洁  赵荣彩  王磊 《计算机应用》2022,(S1):215-220
通用矩阵向量乘法(GEMV)函数是整个二级基础线性代数子程序(BLAS)函数库的构建基础,BLAS作为关键基础计算软件之一,目前在申威处理器上却没有一个高性能实现的版本。针对上述问题,为充分发挥申威1621平台的高性能BLAS库计算优势,提出一种基于申威1621的通用矩阵向量乘法的性能分析与优化方法。首先对GEMV函数进行计算重排序、循环分块的改进;然后采取单指令多数据流(SIMD)以及指令重排的优化方式;最后对内存分配方式进行择优选择。测试结果表明,GEMV函数平均性能达到GotoBLAS版的2.17倍。在使用堆栈分配内存空间或增加对y向量步长的判断分支两种方案后,相较于GotoBLAS,小规模矩阵的平均性能由2.265倍提升至2.875倍。为提高大规模矩阵的性能,以及发挥申威1621多核处理器并行机制,在开启4线程后,平均性能达到单核的3.57倍。因此,优化后的GEMV函数在申威平台上较好的体现了并行效果。  相似文献   

14.
针对多变量非线性复杂函数关系式在单片机中难以实现的问题,提出了一种快速有效的查表求解算法。首先建立顺序存储数据块,接下来查找输入变量在已存变量存储块中的自然序号,最后利用查得的变量自然数序号及事先确定的算法查找这些变量所对应的函数值的存储地址,进而得到计算结果。实现了非线性复杂关系式的快速精确求解,可推广于各种运算能力有限的单片机,提高了单片机的整体使用效率。  相似文献   

15.
针对多变量非线性复杂函数关系式在单片机中难以实现的问题,提出了一种快速有效的查表求解算法。首先建立顺序存储数据块,接下来查找输入变量在已存变量存储块中的自然序号,最后利用查得的变量自然数序号及事先确定的算法查找这些变量所对应的函数值的存储地址,进而得到计算结果。实现了非线性复杂关系式的快速精确求解,可推广于各种运算能力有限的单片机,提高了单片机的整体使用效率。  相似文献   

16.
基于变换函数与填充函数的模糊粒子群优化算法   总被引:1,自引:0,他引:1  
本文提出了一种基于变换函数与填充函数的模糊粒子群优化算法(Fuzzy partical swarm optimization based on filled function and transformation function,FPSO-TF).以基于不同隶属度函数的多回路模糊控制系统为基础,进一步结合变换函数与填充函数,使该算法减少了陷入局部最优的可能,又可以跳出局部极小值点至更小的点,快速高效地搜索到全局最优解.最后采用基准函数对此算法进行测试,并与几种不同类型的改进算法进行对比分析,验证了此算法的有效性与优越性.  相似文献   

17.
研究流感诊断仿真系统,因流感还缺乏概念准确的描述,为了降低流感诊断的复杂度,提高诊断决策的准确性,在深入研究变精度粗糙集模型的基础上.提出了一种基于 STL 的变精度粗糙集模型,并将模型应用于流感诊断仿真系统中.通过在流感决策表上直接建立变精度粗糙集模型,获取了流感诊断决策,建立流感诊断知识库提供了先验知识.在流感诊断仿真实验中,根据流感诊断决策规则进行了多次测试,测试结果表明仿真系统所获取的决策规则具有很高的正确率,达到了预期结果,可用于流感诊断.  相似文献   

18.
基于半变异函数的多极化SAR图像地表淹没程度分析   总被引:2,自引:0,他引:2  
洪涝灾害范围的提取能够为灾害的动态监测、评估提取重要的数据。由于半变异函数能够反映图像数据的随机性和结构性,可以很好的体现地物的空间自相关性。而地物在SAR图像上也表现出很好的空间自相关性和纹理特征,各种淹没程度的地物在图像上也表现出不同的空间自相关性,所以将特定窗口下特定步长的半变异函数应用到地表淹没程度分析,证明该方法的可行性。  相似文献   

19.
半方差函数纹理提取在遥感图像分类中的应用   总被引:2,自引:0,他引:2  
在提高遥感图像分类精度的方法中,将纹理信息作为扩展的特征向量加入特征空间中,是一个很有效的方法。从地统计角度利用地物在空间上的联系提取纹理,进而参与分类,实验结果表明加入纹理后明显提高了具有纹理信息的地物的分类精度,并通过实验中遇到的问题探讨了该方法的适用范围。  相似文献   

20.
一个基于分枝搜索的函数全局优化方法   总被引:1,自引:0,他引:1  
柳常青  张钹 《计算机学报》1997,20(11):1009-1017
本文给出了算法性能的一种度量,并且提出了一种全局优化算法策略,其基本框架(分枝随机搜索)类似于二分搜索,即将搜索区域划分成等测试的两个子区间(也可以多个),通过采样确定最有可能包含全局最优点的子区间,将其保留;去掉另一半,在剩下的区间重复这一过程。尽管这种算法其简单性几近随机算法和络点法,但理论分析和实验结果表明,其效率却高得多。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号