共查询到20条相似文献,搜索用时 156 毫秒
1.
随着SIMD扩展技术的不断发展,自动向量化逐步成为程序优化的重点。然而,大部分程序本身不能直接被向量化,需要通过循环变换来发掘潜在的并行性。首先以Open64中的循环变换为例概括介绍了传统的循环优化方式,然后从多面体表示、循环变换建模方法和代价模型等3个方面具体介绍了多面体模型指导的循环变换技术,最后对两种循环优化方式的优缺点进行了对比分析。 相似文献
2.
3.
王国鸣 《哈尔滨工业大学学报》1982,(4)
本文在吴明霞、陈火旺初探用向量运算代替串行FORTRAN DO 循环中某些赋值语句的基础上,对文[1]认为不可量化的赋值语句的右端表达式是否可向量化的问题作了进一步探讨,本文指出不可向量化赋值语句的右端表达式有时可以向量化。 相似文献
4.
阎笑非 《北京石油化工学院学报》1996,(1)
应用预测与决策理论并借助于计算机对近期我国部分塑料产品市场的前景进行了市场量化分析,就如何改变目前市场量化分析在企业中应用不起来的现状提出了设想和建议。 相似文献
5.
利用向量的受控关系,将矩阵作向量化运算,从而定义矩阵的受控关系,将向量受控的结论推广到矩阵受控,得到其他相应的结论;利用Schur函数及矩阵受控得到了推广结论;利用双随机阵,元素均相等的矩阵及单位矩阵之间的受控关系,得到了一些新的结论;推广了平均值之间的不等式关系及相应结论. 相似文献
6.
"都"字句是汉语中的一个常见句式,也是非常复杂的句式。学界对"都"的研究主要集中在对"都"自身的性质以及"都"与其他成分关系的探讨上。现有的研究还不足以解释与"都"相关的所有问题,尤其是右向关联的问题。探讨"都"右向关联名词性成分的解读问题,指出存在量化成分显现的允准条件,认为存在量化短语在"都"成分统制范围内获得允准的前提是该短语必须表达总括义。 相似文献
7.
本文主要介绍了脉冲编码调制(PCM)量化过程中均匀量化和基于A13折线的非均匀量化性能的比较,分析两种量化方式分别对大信号和小信号的量化误差的影响,以及对于不同种类信号如何选择合适的量化方式。 相似文献
8.
随着网络用户人数的不断增加,用户发布言论的平台也越来越多,在这个言论自由的时代,谣言、错误信息等也在不断增加,对网络舆情的监控成为政府办公中一项必不可少的工作。为了方便网络舆情监控工作的有效进行,提出一种基于深度学习模型CNN-BiLstm模型的研究方法,首先将使用Word2Vec模型对情感数据集进行向量化的表示,同时使用深度学习模型CNN-BiLstm模型对数据集进行情感分析研究,并通过舆情分析方法预测舆情的变化情况。 相似文献
9.
贾瑞娟 《河北工程大学学报(自然科学版)》2004,21(2):94-96
以不确定性信息的数学处理理论即不确定性数学理论为基础 ,把专家的可信度及专家意见进行量化 ,阐述了专家意见的不确定性量化法 ,进而指明如何使用专家。 相似文献
10.
为了提高量化通信下分布式一致性算法的收敛精度,对概率量化分布式一致性算法进行改进,提出改进概率量化分布式一致性算法。在改进概率量化分布式一致性算法中,节点利用自身状态值和邻接节点的概率量化信息进行节点的状态更新。对改进概率量化分布式一致性算法的收敛性和均方误差进行了分析、计算和仿真。结果表明改进概率量化分布式一致性虽然不能收敛到一致性,但是均方误差更小,收敛精度更高。 相似文献
11.
SIMD短向量扩展指令是实现细粒度数据级并行的一条重要途径,自动SIMD并行化是利用SIMD扩展指令最简单直接的方法,但现有编译器无法充分挖掘程序中的SIMD并行成分.文章在深入研究SIMD扩展部件执行方式基础上,提出SIMD短向量数据依赖关系约束条件,并实现了一种基于Tarjan算法的SIMD并行判定框架,提高了SIMD并行性识别率.实际程序测试结果显示,在面向复杂依赖关系的SIMD并行性判定方面优于ICC v11.0编译器. 相似文献
12.
SIMD阵列需要一个控制器,把宏指令转换成阵列操作指令,提供控制信号如改变阵列拓扑连接,输入输出控制等,构成系统还需要宿主机作系统控制以及后继信息处理,由此,针对嵌入式SIMD阵列结构的特点,引入嵌入式SIMD控制核的概念,将宿主与阵列控制器结合,把嵌入式SIMD控制核做成专用芯片,可以方便地构成SIMD阵列的控制系统。 相似文献
13.
在分析三角函数(主要是正弦)的常用近似计算方法级数法的基础上,提出针对于带有SIMD功能部件处理器的一种优化算法,并在实际环境中与常用级数法的精度和性能进行了对比测试,与GNU数学函数库也进行了对比测试。测试结果表明该优化算法性能优越。 相似文献
14.
为了满足G级像素帧实时处理的要求,提出图像同态滤波的数据并行实现方法.讨论了图像帧和滤波器在SIMD PE阵列中的预置及数据并行的滤波处理实现方法,其处理方式规则性强、并行度高,提高了处理速度.由于SIMD PE阵列具有可裁减性,可以适合不同规模图像帧的处理需求,满足不同的嵌入式应用环境. 相似文献
15.
一种阵列计算机输入/输出系统的设计 总被引:1,自引:0,他引:1
ABC95阵列是采用FPGA设计的多功能互连结构的计算机,多功能互连网络是指支持处理器到存储器的矩阵无冲突访问模式和增强型的处理机到处理机通讯的MESH网络。ABC95阵列机是一种协处理机方式的SIMD计算机,I/O系统的设计非常重要,必须保证通用性好,易于扩展,有足够的数据传送带宽。 相似文献
16.
异或移位随机数生成器是Marsaglia于2002年提出的周期为2k-1且适合32位CPU快速实现的随机数生成器,其中k为32,64,96,128等。近几年,通用CPU技术有了较大进展,例如单指令多数据技术和多级流水线等。文章利用第2代单指令多数据流扩展指令设计了一类基于128比特面向软件实现的随机数生成器。这类新的生成器与异或移位随机数生成器类似,但是它可以充分利用CPU的新特性。其反馈逻辑更适合流水线处理,速度较不使用SSE2指令约有2倍的提高,同时其输出序列的随机性与异或移位随机数生成器类似。 相似文献
17.
离散余弦变换(DCT)是图像处理领域广泛使用的一种变换方法,其中,Feig的2D DCT算法被认为是需要加法和乘法操作次数最少的.为了加深对Feig算法的理解和进一步提出更好的快速算法,首先使用简单的矩阵分解理沦来得到Feig的算法和另外3种不同形式的矩阵分解;然后,对Feig的Scaled-DCT算法做进一步研究,消去了其中隐含的49个求相反数的多余操作,并使其结构更加规整,以适合于SIMD和VLIW结构. 相似文献
18.
多面体模型具有规范化、健壮性、灵活性等特点,被认为是最有前途的编译优化技术之一,SIMD优化是重要应用领域之一。由于静态编译技术的限制,大量非规则循环无法建立多面体模型,例如复杂依赖关系,导致无法利用该模型实现SIMD循环优化与代码生成。文章通过分析、利用SIMD优化所需的程序运行剖面信息,将静态编译未知情况转化为已知情况,为多面体模型建立创造条件。SPEC2000和PolyBench的测试结果显示,通过本文提出的方法,可将适用多面体模型的非规则循环个数提高2.3倍,经过SIMD优化后,平均加速比提高了1.53倍。 相似文献
19.
0 INTRODUCTIONComputervisiontasksrequireanenormousamountofcomputation ,especiallywhenthedataisinimageform ,demandinghigh performancecomputersforpractical,real timeapplications .Parallelismap pearstobetheonlyeconomicalwaytoachievethelev elofperformancerequi… 相似文献
20.
视频数字信号处理芯片XY VDSP是采用阵列结构的SIMD处理机。XY VDSP在硬件结构和指令级上采用高度并行,使其可以高效处理视频应用。本文将分析XY VDSP的并行性实现,并以一个矩阵矢量乘加的例子作为说明。 相似文献