首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 343 毫秒
1.
邓斐  赵开勇 《微型计算机》2010,(30):116-120
GPU的功能绝不仅仅是进行和游戏相关的图形处理,它可以做得更多、更好。在通用计算方面.它已经展现出了令人惊讶的性能表现。在2010年NVIDIA举办的GTC(GPU Technology Conference)大会上,《微型计算机》与全球知名科学家.工程师以及研究人员一同见证了GPU技术的发展。  相似文献   

2.
2016年9月13日,GTC CHINA 2016(GPU技术大会)在北京召开,NVIDIA联合创始人、总裁兼首席执行官黄仁勋出席大会,深度阐释了GPU计算产品与解决方案平台将如何拓展人工智能发展的想象空间,加速人工智能改变未来的进程。同时,NVIDIA全球首发了两款深度学习和自动驾驶最新产品,宣布了与京东等领先企业的合作项目。  相似文献   

3.
既然CPU中可以集成GPU,那么未来NVIDIA GPU中是否也会加入CPU呢?CUDA—x86的作用究竟是怎样的?借2010年9月21日~23日NVIDIA举办GTC(GPU Technology Conference)大会之际,本刊记者就上述用户关注的热门话题采访TNVIDIA(英伟达)创始人、总裁兼首席执行官黄仁勋先生(以下简称“黄”)。  相似文献   

4.
42U机架计算能力达256万亿次每秒高性能、高密度系统支持基于NVIDIA Kepler架构的Tesla K10和K20/K20X加速器以及NVIDIA GRID K1和K2GPU加州圣荷西2013年7月30日电/美通社/--高性能、高效率服务器、存储技术和绿色计算领域的全球领导者美超微电脑股份有限公司(SuperMicro Computer,Inc.)(NASDAQ:SM-CI)将在本周的2013年日本NVIDIAGPU技术大会(简称GTC Japan2013)上展示其高性能企业级超级计算解决方案系列。这一广泛的GPU加速计算解决方案系列中包括12x GPU4U、4节点FatTwinTM、架装式SuperServer(超  相似文献   

5.
英伟达发布多项创新成果2019年12月18日,在美国英伟达(NVIDIA)公司举办的GTC(GPU Technology Conference,GPU技术峰会)中国大会上,公司创始人兼CEO黄仁勋宣布NVIDIA已经售出15亿块GPU,并发布支持L2-L5级自动驾驶系统级芯片Orin,全新版本Isaac软件开发套件(SDK)、TensorRT 7推理软件开发套件等创新成果。  相似文献   

6.
日前,在由英伟达(NVIDIA)与中国科学院、清华大学及中国算法协会联合举办的"2010 GPU高性能计算峰会(GTC)"上。华硕GPU超算产品中国区核心合作伙伴苏州吉浦迅科技悄悄曝光了一款全新的华硕ESC1000桌面超算平台。  相似文献   

7.
2012年5月15日,在全球GPU技术大会上,NVIDIA发布了全新系列的NVIDIA Tesla GPU,这一系列产品基于NVIDIAKepler GPU计算架构.NVIDIA希望,凭借这款新架构的TeslaGPU进一步深入高性能计算领域,让科学计算与工程应用能更轻松地利用GPU的并行计算效能.  相似文献   

8.
美超微将在2013年国际超级计算大会上推出针对NVIDIA Tesla K40 GPU加速器优化的功能强大的4U 8X GPU SuperServer全新的SuperServer拥有先进的散热架构,独立的CPU/GPU散热区,  相似文献   

9.
2012年5月15日,在全球GPU技术大会上,NVIDIA发布了全新系列的NVIDIATeslaGPU,这一系列产品基于NVIDIAKeplerGPU计算架构。NVIDIA希望,凭借这款新架构的TeslaGPU进一步深入高性能计算领域,让科学计算与工程应用能更轻松地利用GPU的并行计算效能。  相似文献   

10.
《个人电脑》2009,(1):93-93
在超级计算(SC)大会上,大会组委会以及媒体合作伙伴每年都会为杰出的高性能计算(HPC)研究与成就进行颁奖。今年,NVIDIA Tesla GPU以及NVIDIACUDA架构在多个分类中均获得了认可,这无疑说明GPU计算技术正在为高性能计算行业带来真正重大的影响。NVIDIACUDA技术通过C语言、Fortran、Java以及Python等业界标准语言为科学家、研究人员、工程师以及开发人员提供了访问GPU超强大规模并行处理架构的途径,从而继续改变着高性能计算行业。  相似文献   

11.
张延松  刘专  韩瑞琛  张宇  王珊 《软件学报》2023,34(11):5205-5229
GPU数据库近年来在学术界和工业界吸引了大量的关注. 尽管一些原型系统和商业系统(包括开源系统)开发了作为下一代的数据库系统, 但基于GPU的OLAP引擎性能是否真的超过CPU系统仍然存有疑问, 如果能够超越, 那什么样的负载/数据/查询处理模型更加适合, 则需要更深入的研究. 基于GPU的OLAP引擎有两个主要的技术路线: GPU内存处理模式和GPU加速模式. 前者将所有的数据集存储在GPU显存来充分利用GPU的计算性能和高带宽内存性能, 不足之处在于GPU容量有限的显存制约了数据集大小以及稀疏访问模式的数据存储降低GPU显存的存储效率. 后者只在GPU显存中存储部分数据集并通过GPU加速计算密集型负载来支持大数据集, 主要的挑战在于如何为GPU显存选择优化的数据分布和负载分布模型来最小化PCIe传输代价和最大化GPU计算效率. 致力于将两种技术路线集成到OLAP加速引擎中, 研究一个定制化的混合CPU-GPU平台上的OLAP框架OLAP Accelerator, 设计CPU内存计算、GPU内存计算和GPU加速3种OLAP计算模型, 实现GPU平台向量化查询处理技术, 优化显存利用率和查询性能, 探索GPU数据库的不同的技术路线和性能特征. 实验结果显示GPU内存向量化查询处理模型在性能和内存利用率两方面获得最佳性能, 与OmniSciDB和Hyper数据库相比性能达到3.1和4.2倍加速. 基于分区的GPU加速模式仅加速了连接负载来平衡CPU和GPU端的负载, 能够比GPU内存模式支持更大的数据集.  相似文献   

12.
遥感图像配准是遥感图像应用的一个重要处理步骤.随着遥感图像数据规模与遥感图像配准算法计算复杂度的增大,遥感图像配准面临着处理速度的挑战.最近几年,GPU计算能力得到极大提升,面向通用计算领域得到了快速发展.结合GPU面向通用计算领域的优势与遥感图像配准面临的处理速度问题,研究了GPU加速处理遥感图像配准的算法.选取计算量大计算精度高的基于互信息小波分解配准算法进行GPU并行设计,提出了GPU并行设计模型;同时选取GPU程序常用面向存储级的优化策略应用于遥感图像配准GPU程序,并利用CUDA(compute unified device architecture)编程语言在nVIDIA Tesla M2050GPU上进行了实验.实验结果表明,提出的并行设计模型与面向存储级的优化策略能够很好地适用于遥感图像配准领域,最大加速比达到了19.9倍.研究表明GPU通用计算技术在遥感图像处理领域具有广阔的应用前景.  相似文献   

13.
张宇  张延松  陈红  王珊 《软件学报》2016,27(5):1246-1265
通用GPU因其强大的并行计算能力成为新兴的高性能计算平台,并逐渐成为近年来学术界在高性能数据库实现技术领域的研究热点.但当前GPU数据库领域的研究沿袭的是ROLAP(relational OLAP)多维分析模型,研究主要集中在关系操作符在GPU平台上的算法实现和性能优化技术,以哈希连接的GPU并行算法研究为中心.GPU拥有数千个并行计算单元,但其逻辑控制单元较少,相对于CPU具有更强的并行计算能力,但逻辑控制和复杂内存管理能力较弱,因此并不适合需要复杂数据结构和复杂内存管理机制的内存数据库查询处理算法直接移植到GPU平台.提出了面向GPU向量计算特性的混合OLAP多维分析模型semi-MOLAP,将MOLAP(multidimensionalOLAP)模型的直接数组访问和计算特性与ROLAP模型的存储效率结合在一起,实现了一个基于完全数组结构的GPU semi-MOLAP多维分析模型,简化了GPU数据管理,降低了GPU semi-MOLAP算法复杂度,提高了GPU semi-MOLAP算法的代码执行率.同时,基于GPU和CPU计算的特点,将semi-MOLAP操作符拆分为CPU和GPU平台的协同计算,提高了CPU和GPU的利用率以及OLAP的查询整体性能.  相似文献   

14.
GPU通用计算在LBM方法中的应用   总被引:1,自引:0,他引:1  
提出了一种结合GPU通用计算与计算流体力学中的LBM算法来模拟二维流场的方法.根据GPU通用计算和LBM方法的基本原理,利用OpenGL的离屏渲染技术FBO和Cg语言,基于LBM方法中的D2Q9模型对二维方腔流进行数值模拟,并设计出基于OpenGL的GPU通用计算的二维流场数值计算框架.实验结果表明,利用GPU模拟与CPU模拟流场的数值结果相当吻合,特别地,利用GPU进行数值模拟实验的速度是利用CPU的4倍左右.  相似文献   

15.
随着GPU通用计算能力的不断发展,一些新的更高效的处理技术应用到图像处理领域.目前已有一些图像处理算法移植到GPU中且取得了不错的加速效果,但这些算法没有充分利用CPU/GPU组成的异构系统中各处理单元的计算能力.文章在研究GPU编程模型和并行算法设计的基础上,提出了CPU/GPU异构环境下图像协同并行处理模型.该模型充分考虑异构系统中各处理单元的计算能力,通过图像中值滤波算法,验证了CPU/GPU环境下协同并行处理模型在高分辨率灰度图像处理中的有效性.实验结果表明,该模型在CPU/GPU异构环境下通用性较好,容易扩展到其他图像处理算法.  相似文献   

16.
由于MapReduce模型进行Map和Reduce操作时需要频繁的CPU计算,面对大量并行计算任务时,CPU占用率甚至达到百分之百.而GPU有比CPU更好的并行计算能力,适度使用GPU,可降低了CPU的占用时间,又能用GPU的参与来平衡系统的计算能力.论文结合GPU技术和MapReduce技术的不同优势,设计出一种基于MapReduce和GPU双重并行计算的云计算模型.通过理论建模与实验验证,结果表明此模型可实现多GPU的MapReduce任务并行处理,提高了高性能计算的性能.  相似文献   

17.
GPU的概念提出后,经过十几年的迅速发展,GPU凭借其超高的计算密度以及超大的存储器带宽已经在图形图像、医疗、高性能计算、计算机网络等领域取得了突出的成果和广泛认可,本文通过了解GPU通用计算的发展历程以及追踪国内外最新的GPU通用计算技术来阐述其在相关领域的应用.  相似文献   

18.
GPU虚拟化相关技术研究综述   总被引:1,自引:0,他引:1  
因为计算密集型应用的增多,亚马逊和阿里巴巴等公司的云平台开始引入GPU(Graphic processing unit)加速计算. 云平台支持多用户共享GPU的使用,可以提升GPU的利用效率,降低成本;也有利于GPU的有效管理. 通过虚拟机监视器以及各种软硬件的帮助,GPU虚拟化技术为云平台共享GPU提供了一种可行方案. 本文综合分析了GPU虚拟化技术的最近进展,先根据技术框架的共同点进行分类;然后从拓展性、共享性、使用透明性、性能、扩展性等方面对比分析,最后总结了GPU虚拟化的问题和发展方向.  相似文献   

19.
应用GPU集群加速计算蛋白质分子场   总被引:1,自引:2,他引:1  
针对生物化学计算中采用量子化学理论计算蛋白质分子场所带来的巨大计算量的问题,搭建起一个GPU集群系统,用来加速计算基于量子化学的蛋白质分子场.该系统采用消息传递并行编程环境(MPI)连接集群各结点,以开放多线程OpenMP编程标准作为多核CPU编程环境,以CUDA语言作为GPU编程环境,提出并实现了集群系统结点中GPU和多核CPU协同计算的并行加速架构优化设计.在保持较高计算精度的前提下,结合MPI,OpenMP和CUDA混合编程模式,大大提高了系统的计算性能,并对不同体系和规模的蛋白质分子场模拟进行了计算分析.与相应的CPU集群、GPU单机和CPU单机计算方法对比,该GPU集群大幅度地提高了高分辨率复杂蛋白质分子场模拟的计算效率,比CPU集群的平均计算加速比提高了7.5倍.  相似文献   

20.
王翔 《微型计算机》2007,(8S):116-118
面对业界逐渐升温的通用计算大潮,AMD在去年的超级计算机大会上发布世界首款”流处理器(Stream Processor)”,宣告了通用GPU(GPGPU)的诞生。如今,NVIDIA终于也拿出了自己的首款通用GPU平台——Tesla(读作:特斯拉)。那么,究竟通用计算是做什么用的?Tesla和普通显卡又有什么不同呢?[编者按]  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号