首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
ST全资子公司、全球领先的高性能计算(HPC)技术提供商Portland Group宣布PGI CUDA C和C++编译器已正式出货,针对基于产业标准的通用64位和32位x86架构的处理器系统。CUDA是英伟达(NVIDIA)开发的并行计算架构,可利用NVIDIA GPU(图形处理器)的动态提升系统计算性能。  相似文献   

2.
《电子与电脑》2011,(7):88-88
Portland Group宣布PGI CUDA C和C++编译器已正式出货,针对基于产业标准的通用64位和32位x86架构的处理器系统。  相似文献   

3.
意法半导体全资子公司Portland Group推出PGICUDAC和C++编译器,针对基于产业标准的通用64位和32位x86架构的处理器系统。CUDA是英伟达(NVIDIA)开发的并行计算架构,可利用NVIDIA GPU的动态提升系统计算性能。PGI的CUDAC/C++编译器让更多的开发人员能够利用CUDA并行编程模型优化代码库关键部分的性能,针对包括有或无NVIDIAGPU的服务器和服务集群。  相似文献   

4.
《今日电子》2012,(5):72-72
Portland Group发布首版支持OPenACC可支持图形处理器和加速器指令式编程模型标准的Fortran和C编译器。Beta版编译器包括对部分OpenACC标准的支持功能。PGI计划在未来两个月内推出的后续版本,增加对OpenACC的支持功能,而可支持OpenACC 1.0全部标准的版本预计于今年6B发布。  相似文献   

5.
Portland Group宣布PGI CUDAC和C++编译器已正式出货,针对基于产业标准的通用64位和32位x86架构的处理器系统。CUDA是NVIDIA开发的并行计算  相似文献   

6.
数字信号处理嚣(DSP)是专用的处理器,主要功能是高效率地执行信号处理算法。此外,应用中通常还需要执行传统的微控制器代码。为解决这一问题设计人员通常在系统中同时使用DSP和微控制器。但这样会增加产品的成本。本文介绍了一种新的DSP架构,它非常适合通用DSP算法,同时又可高效率地执行微控制器代码,并且有高效率的编译器性能。  相似文献   

7.
《电子与电脑》2009,(7):98-98
意法半导体全资子公司.世界领先的高性能计算机(HPC)编译器提供商Portland Group宣布与英伟达公司(NVIDIA)达成合作开发协议,两家公司计划为CUDA图形处理器(GPU)开发新的Fortran语言编译器。  相似文献   

8.
图形处理器协同运算的视频处理架构   总被引:1,自引:0,他引:1  
多媒体视频处理的任务繁重,计算量大,很多算法无法在仅使用一颗CPU的条件下达到实时处理的速度。设计一套图形处理器协同运算的视频处理架构,它采用图形处理器与中央处理器配合,共同完成视频计算的任务。这种架构可以大大加速处理速度,并减轻中央处理器的负担。  相似文献   

9.
《电子设计工程》2012,20(15):158
意法半导体全资子公司、全球领先的独立高性能计算(HPC)编译器及开发工具供应商Portland Group宣布,可支持新的图形处理其(GPU)和图形加速器指令式编程模型OpenACC市。  相似文献   

10.
介绍了一种为T RIC快速开发高级语言编译工具的方法.LCC是一个小型的可变目标C语言编译器,通过扩展LCC后端使其支持硬件中断等嵌入式C语言语法特性,进而实现 T RIC的C语言编译器.经测试验证,此方法可大大降低移植LCC的难度和出错的概率,且能快速开发出目标处理器的编译工具.  相似文献   

11.
意法半导体全资子公司PortlandGroup(PGI)推出基于ARM内核的ST-EricssonNovaThor移动平台专用PGIOpenCL开发框架。该开发框架包括一个把多核ARMCPU视为一个计算设备的PGIOpenCL编译器,并增强了OpenCLGPU(图形处理器)编译器功能。NovaThor是一个高集成度的完整的移动平台,  相似文献   

12.
随着计算机硬件技术的高速发展,图形处理器(Graphic processing unit,GPU)通用计算已经发展到颇为成熟阶段,其并行运算速度已远远超过多核CPU。文章简介CUDA架构并验证其在图形处理中的加速能力,对比线性代数运算在CPU与GPU架构下的效率,将CUDA技术应用于智能视频监控人体检测系统中,实验验证其高效性及可行性。最后对CUDA的发展方向进行了展望。  相似文献   

13.
为了能在PC机上处理大规模数据集问题,提出了使用CUDA架构对LP-SVM的加速实现方法。该方法针对PC机内存小的缺点,对SVM的分解算法进行改编,得到求解LP-SVM的分解算法。LP—SVM分解算法每次只需要求解一个小规模的线性规划问题,避免一次性把所有训练数据都装进内存。同时把求解线性规划中比较耗时的矩阵运算,移植到CUDA上进行,提高了求解效率。实验结果表明:LP—SVM算法在经过CUDA加速以后,算法的执行效率提高了10—35倍。  相似文献   

14.
基于GPU的高度并行Marching Cubes改进算法   总被引:1,自引:0,他引:1  
提出一种完全基于GPU(graphics processing unit)的高度并行Marching Cubes改进算法.针对Marching Cubes算法流程中数据处理阶段进行优化.首先并行遍历每个体元,以序列形式得到每体元的非空状态,再利用高效流式缩减操作获得非空体元序列以便仅针对非空体元高度并行地生成等值面三角形.实验表明,与同市场价格CPU实现相比,该算法效率最高提高到了前者的9倍以上.  相似文献   

15.
为了提高发射宽度,高端DSP普遍采用分簇结构设计.分簇结构的处理器依赖编译器在代码生成的时候指定每条指令所在的簇.针对传统分簇算法中存在参考信息太过局部的问题,提出一种依据资源压力将指令依赖图划分成多个子图,然后对子图进行分簇的算法.最后,验证了该算法能够提高分簇效率.  相似文献   

16.
童炜  刘铎 《通信技术》2011,44(4):1-4,9
随着图形处理器(GPU)的处理能力的不断增强,图形处理器越来越多地被应用于计算密集型的数据运算处理中。JPEG图像压缩算法中的部分步骤存在典型的并行特性,针对大分辨率图像JPEG压缩串行顺序执行时间开销较大的问题,利用CUDA的并行计算和图形硬件的可编程性,可实现对JPEG图像压缩的加速,同时结合GPGPU硬件结构可实现JPEG压缩程序程序的优化设计。通过程序测试实验,与串行程序比较加速比在20以上。  相似文献   

17.
商凯  胡艳 《电子技术》2011,38(5):9-11
近几年图形处理器GPU的通用计算能力发展迅速,现在已经发展成为具有巨大并行运算能力的多核处理器,而CUDA架构的推出突破了传统GPU开发方式的束缚,把GPU巨大的通用计算能力解放了出来.本文利用GPU来加速AES算法,即利用GPU作为CPU的协处理器,将AES算法在GPU上实现,以提高计算的吞吐量.最后在GPU和CPU...  相似文献   

18.
19.
LSI公司推出专为无线基础设施应用设计的Axxia系列通信处理器.Axxia 通信处理器采用突破性Lsl VIrtual Pipcline消息传递技术,将为用户提供更快速和稳定的性能,可满足视频流、web浏览和高质量数字语音等高要求无线应用的需求.  相似文献   

20.
《电子与电脑》2010,(10):78-78
近日,MathWorks宣布通过使用Parallel Computing Toolbox或MATLAB Distributed Computing Server实现在MATLAB应用中提供对NVIDIA图形处理器(GPU)的支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号