共查询到20条相似文献,搜索用时 0 毫秒
1.
3.
基础数学函数库是计算机系统非常关键的软件模块,然而国产申威平台上的长向量超越函数只能依靠循环调用系统标量函数来间接实现,该方法无法充分发挥申威平台SIMD扩展部件的计算性能.为了有效解决此问题,实现了申威平台基于SIMD扩展部件底层优化的长向量超越函数,提出了浮点计算融合算法,解决了两分支结构算法难以向量化的问题;提出了基于Estrin算法动态分组的大阶数多项式实现方法,提高了多项式汇编计算的流水性能.这是在国产申威平台上首次实现长向量超越函数库,提供的函数接口包含三角函数、反三角函数、对数函数、指数函数等.实验结果表明,双精度版本最大误差控制在3.5ULP(unit in the last place)以下,单精度版本最大误差控制在0.5ULP以下,该性能与申威平台直接循环调用系统标量函数相比有显著提高,平均加速比为3.71. 相似文献
4.
基础数学函数库是高性能计算机中最基础、最核心的底层软件之一, 它的性能直接决定了上层计算程序的运行效率. 现版本的国产申威基础数学库中部分函数使用rfpcr和wfpcr指令导致流水线中断, 降低了函数的性能.针对这个问题, 本文结合函数的功能和指令特性, 提出指令段功能等效替换方法. 实验表明, 运用该方法, 使得函数... 相似文献
5.
基于移位加的坐标旋转数字计算机算法是用硬件实现超越函数的最简单方法。本文首先介绍了这种算法的工作方式和计算超越函数的具体过程,并设计了一个80位嵌入式超越函数运算器;然后从该处理器的设计构思和系统结构,到处理器内部各单元的设计,进行了比较详尽的阐述;最后给出了对该设计进行软件仿真的结果。 相似文献
6.
姚玥 《计算机光盘软件与应用》2013,(7)
随着科技的飞速发展,现如今世界已经步入信息时代,掌握一定的计算机技能是每一个当代人必备的一项生存手段。计算机学习和数学知识紧密联系在一起,我们数学中经常见到的初等函数比如对数函数、指数函数以及三角函数等都叫做超越函数,如何用超越函数来做一些基本简单的计算机算法编程呢?这对于初学计算机编程的人员来讲,是非常有必要学习和掌握的,笔者通过对于数学知识中超越函数的理解和总结,开深入探讨将其应用于计算机的算法研究中,希望,本文的研究能够为广大运用计算机编程和制作算法的工作者和学习者带来些许帮助。 相似文献
7.
8.
9.
10.
BLAS (Basic Linear Algebra Subprograms)是一个基本线性代数操作的数学函数标准, 该库函数分为三个级别, 每个级别提供了向量与向量(1级)、向量与矩阵(2级)、向量与向量(三级)之间的基本运算. 本文研究了在申威1621处理器上BLAS一级函数的优化方案, 以函数AXPY为例, 充分... 相似文献
11.
点积函数是BLAS库中的一级基础函数,其被科学计算等领域广泛调用.由于浮点计算会引入舍入误差,现有BLAS库中双精度点积函数不足以满足某些应用领域的精度要求,因此需要高精度算法来实现更精确可靠的计算.在本文中,面向国产申威1621平台,在现有的BLAS库的基础上,新增高精度点积函数的实现接口,来满足应用的高精度需求.同时,对于高精度点积算法运用循环展开、访存优化、指令重排等优化策略,实现汇编级手工优化.实验结果显示,文中高精度点积算法的计算结果精度,近似达到了双精度点积的两倍,有效提升了原始算法精度.同时,在保证精度提升的基础上,文中优化后的高精度点积函数相比未优化前,平均性能加速比达到了1.61. 相似文献
12.
13.
通用矩阵向量乘法(GEMV)函数是整个二级基础线性代数子程序(BLAS)函数库的构建基础,BLAS作为关键基础计算软件之一,目前在申威处理器上却没有一个高性能实现的版本。针对上述问题,为充分发挥申威1621平台的高性能BLAS库计算优势,提出一种基于申威1621的通用矩阵向量乘法的性能分析与优化方法。首先对GEMV函数进行计算重排序、循环分块的改进;然后采取单指令多数据流(SIMD)以及指令重排的优化方式;最后对内存分配方式进行择优选择。测试结果表明,GEMV函数平均性能达到GotoBLAS版的2.17倍。在使用堆栈分配内存空间或增加对y向量步长的判断分支两种方案后,相较于GotoBLAS,小规模矩阵的平均性能由2.265倍提升至2.875倍。为提高大规模矩阵的性能,以及发挥申威1621多核处理器并行机制,在开启4线程后,平均性能达到单核的3.57倍。因此,优化后的GEMV函数在申威平台上较好的体现了并行效果。 相似文献
14.
针对多变量非线性复杂函数关系式在单片机中难以实现的问题,提出了一种快速有效的查表求解算法。首先建立顺序存储数据块,接下来查找输入变量在已存变量存储块中的自然序号,最后利用查得的变量自然数序号及事先确定的算法查找这些变量所对应的函数值的存储地址,进而得到计算结果。实现了非线性复杂关系式的快速精确求解,可推广于各种运算能力有限的单片机,提高了单片机的整体使用效率。 相似文献
15.
针对多变量非线性复杂函数关系式在单片机中难以实现的问题,提出了一种快速有效的查表求解算法。首先建立顺序存储数据块,接下来查找输入变量在已存变量存储块中的自然序号,最后利用查得的变量自然数序号及事先确定的算法查找这些变量所对应的函数值的存储地址,进而得到计算结果。实现了非线性复杂关系式的快速精确求解,可推广于各种运算能力有限的单片机,提高了单片机的整体使用效率。 相似文献
16.
基于变换函数与填充函数的模糊粒子群优化算法 总被引:1,自引:0,他引:1
本文提出了一种基于变换函数与填充函数的模糊粒子群优化算法(Fuzzy partical swarm optimization based on filled function and transformation function,FPSO-TF).以基于不同隶属度函数的多回路模糊控制系统为基础,进一步结合变换函数与填充函数,使该算法减少了陷入局部最优的可能,又可以跳出局部极小值点至更小的点,快速高效地搜索到全局最优解.最后采用基准函数对此算法进行测试,并与几种不同类型的改进算法进行对比分析,验证了此算法的有效性与优越性. 相似文献
17.
研究流感诊断仿真系统,因流感还缺乏概念准确的描述,为了降低流感诊断的复杂度,提高诊断决策的准确性,在深入研究变精度粗糙集模型的基础上.提出了一种基于 STL 的变精度粗糙集模型,并将模型应用于流感诊断仿真系统中.通过在流感决策表上直接建立变精度粗糙集模型,获取了流感诊断决策,建立流感诊断知识库提供了先验知识.在流感诊断仿真实验中,根据流感诊断决策规则进行了多次测试,测试结果表明仿真系统所获取的决策规则具有很高的正确率,达到了预期结果,可用于流感诊断. 相似文献
18.
基于半变异函数的多极化SAR图像地表淹没程度分析 总被引:2,自引:0,他引:2
洪涝灾害范围的提取能够为灾害的动态监测、评估提取重要的数据。由于半变异函数能够反映图像数据的随机性和结构性,可以很好的体现地物的空间自相关性。而地物在SAR图像上也表现出很好的空间自相关性和纹理特征,各种淹没程度的地物在图像上也表现出不同的空间自相关性,所以将特定窗口下特定步长的半变异函数应用到地表淹没程度分析,证明该方法的可行性。 相似文献
19.
半方差函数纹理提取在遥感图像分类中的应用 总被引:2,自引:0,他引:2
在提高遥感图像分类精度的方法中,将纹理信息作为扩展的特征向量加入特征空间中,是一个很有效的方法。从地统计角度利用地物在空间上的联系提取纹理,进而参与分类,实验结果表明加入纹理后明显提高了具有纹理信息的地物的分类精度,并通过实验中遇到的问题探讨了该方法的适用范围。 相似文献
20.
一个基于分枝搜索的函数全局优化方法 总被引:1,自引:0,他引:1
本文给出了算法性能的一种度量,并且提出了一种全局优化算法策略,其基本框架(分枝随机搜索)类似于二分搜索,即将搜索区域划分成等测试的两个子区间(也可以多个),通过采样确定最有可能包含全局最优点的子区间,将其保留;去掉另一半,在剩下的区间重复这一过程。尽管这种算法其简单性几近随机算法和络点法,但理论分析和实验结果表明,其效率却高得多。 相似文献