共查询到20条相似文献,搜索用时 171 毫秒
1.
朱辉杰 《CAD/CAM与制造业信息化》2012,(6)
2012年5月15日,在全球GPU技术大会上,NVIDIA发布了全新系列的NVIDIA Tesla GPU,这一系列产品基于NVIDIAKepler GPU计算架构.NVIDIA希望,凭借这款新架构的TeslaGPU进一步深入高性能计算领域,让科学计算与工程应用能更轻松地利用GPU的并行计算效能. 相似文献
2.
《CAD/CAM与制造业信息化》2010,(1):91-91
CUDA从推出到进入各大应用领域仅用了不到两年时间,这一为程序开发者所津津乐道的颠覆性新技术,正在以惊人的速度展开普及。CUDA(Compute Unified Device Architecture,统一计算设备架构)是由NVIDIA推出的通用并行计算架构,该架构将GPU强大的并行计算能力充分调动起来,使GPU在解决复杂计算问题时发挥计算优势,开发人员使用C语言即可在基于CUDA架构的GPU上编写程序,借助GPU建立高密集的数据计算解决方案。 相似文献
3.
4.
在桌面游戏GPU市场,采用NVIDIA Ampere架构的GeForce RTX 30系列GPU带来了革命性的改变,强悍的性能和新一代光追技术将桌面游戏体验带到一个全新高度。在笔记本市场,众多玩家也翘首以盼,希望早日感受到NVIDIA Ampere架构的魅力。2021年1月13日,NVIDIA终于正式推出采用Ampere架构的GeForce RTX 30系列笔记本电脑GPU(Laptop GPU),首批搭载该系列GPU的游戏本新品也在1月26日起开售。全新GeForce RTX 30系列Laptop GPU带来了怎样的性能提升?又有哪些改进和优化呢?不久前,我们拿到了一台搭载NVIDIA GeForce RTX 3080 Laptop GPU的微星GS66游戏本,一起来看看吧! 相似文献
5.
作为视觉计算、AI计算的引领者,NVIDIA在前不久公布了2020年移动GPU的全新技术和数百款搭载这些的笔记本电脑。其中最核心的技术包括全系列图灵架构的移动GPU产品全新Max-Q以及新的RTX Studio解决方案。 相似文献
6.
二维扩散方程的GPU加速 总被引:1,自引:0,他引:1
近几年来,GPU因拥有比CPU更强大的浮点性能备受瞩目。NVIDIA推出的CUDA架构,使得GPU上的通用计算成为现实。本文将计算流体力学中Benchmark问题的二维扩散方程移植到GPU,并采用了全局存储和纹理存储两种方法。结果显示,当网格达到百万量级的时候,得到了34倍的加速。 相似文献
7.
8.
近年来GPU通用计算蓬勃发展。程序开发者和GPU通用计算应用程序的数量增长很快。针对不同的应用程序的要求和程序开发者不同的使用习惯,围绕着CUDA架构的 GPU,NVIDIA及其合作伙伴共同开发了很多种不同的编程技术。本文详细介绍了它们的特点和适用对象。希望可以帮助广大开发人员针对自己的编程习惯和程序要求选择最为合适的编程技术。 相似文献
9.
10.
《广东电脑与电讯》2013,(7):9-10
42U机架计算能力达256万亿次每秒高性能、高密度系统支持基于NVIDIA Kepler架构的Tesla K10和K20/K20X加速器以及NVIDIA GRID K1和K2GPU加州圣荷西2013年7月30日电/美通社/--高性能、高效率服务器、存储技术和绿色计算领域的全球领导者美超微电脑股份有限公司(SuperMicro Computer,Inc.)(NASDAQ:SM-CI)将在本周的2013年日本NVIDIAGPU技术大会(简称GTC Japan2013)上展示其高性能企业级超级计算解决方案系列。这一广泛的GPU加速计算解决方案系列中包括12x GPU4U、4节点FatTwinTM、架装式SuperServer(超 相似文献
11.
基于OpenCL的图像积分图算法优化研究 总被引:1,自引:0,他引:1
图像积分图算法在快速特征检测中有着广泛的应用,通过GPU对其进行性能加速有着重要的现实意义。然而由于GPU硬件架构的复杂性和不同硬件体系架构间的差异性,完成图像积分图算法在GPU上的优化,进而实现不同GPU平台间的性能移植是一件非常困难的工作。在分析不同CPU平台底层硬件架构的基础上,从片外访存带宽利用率、计算资源利用率和数据本地化等多个角度考察了不同优化方法在不同GPU硬件平台上对性能的影响。并在此基础上实现了基于OpenCL的图像积分图算法。实验结果表明,优化后的算法在AMD和NVIDIA CPU上分别取得了11.26和12.38倍的性能加速,优化后的GPU kernel比NVIDIA NPP库中的相应函数也分别取得了55.01%和65.17%的性能提升。验证了提出的优化方法的有效性和性能可移植性。 相似文献
12.
基于CUDA的快速图像压缩 总被引:1,自引:0,他引:1
为了进一步提高JPEG编码效率,对JPEG压缩算法进行研究,分析得出JPEG核心步骤可以并行化处理.因此,实现平台宜采用以并行计算为优势的GPU,而不是以串行计算为主的CPU.NVIDIA新推出的CUDA(计算统一设备架构)为此实现提供了软硬件环境.CUDA是基于GPU进行通用计算的开发平台,非常适合大规模的并行数据计算.在GPU流处理器架构下用CUDA技术实现编码并行化,并针对流处理器架构特点进行内存读写等方面的优化,提高了JPEG编码的速度.实验结果表明了CUDA技术在并行处理方面的优越性,JPEG编码效率得到了极大提高. 相似文献
13.
《CAD/CAM与制造业信息化》2015,(5)
2015年4月15日,NVIDIA在京召开了以"GPU计算开启深度学习的大门"为主题的战略发布会,公布了最新的针对深度学习的产品和解决方案,其中包括:全球最快GPU GeForce GTX TITAN X,针对研究人员的深度学习平台DIGITS DevBox,加速深度学习的下一代GPU架构Pascal和用于自动驾驶汽车的深度学习平台DRIVE PX. 相似文献
14.
《CAD/CAM与制造业信息化》2016,(11)
2016年11月15日,在美国盐湖城SC16超算大会上, NVIDIA宣布将与微软共同加速企业内部的人工智能.
得益于首款基于微软Azure云端或内部运行的NVIDIA Tesla GPUs定制式人工智能框架,企业现在可实施覆盖数据中心和微软云的人工智能平台.该优化平台可在NVIDIA GPU(包括采用了Pascal架构的GPU和NVLink 互联技术的NVIDIA DGX-1超级计算机)和Azure N系列虚拟机(目前仍是测试版本)上运行微软的Cognitive Toolkit. 相似文献
15.
面对RV870的咄咄逼人.目前NVIDIA尚欠缺能与之匹敌的产品。但NVIDIA下一代DirectX 11 GPU(代号为Fermi)即将于今年底或明年初上市,届时真正的DirectX11大战才开始.笔者有幸提前洞悉了Fermi架构的部分资料,我们不妨一起来看看Fermi架构究竟做了哪些改进? 相似文献
16.
笔记本的显卡无法升级,因此想获得更强悍的游戏性能就只有超频这一条路。在NVIDIA独显进入Geforce 700M时代后,温度竟然成为了影响新一代显卡超频能力的最关键参数。NVIDIA自去年Geforce 600M开普勒架构显卡开始引入了"GPUBoost1.0"(GPU加速)技术。一年后,700M系列显卡携"GPU Boost2.0"技 相似文献
17.
《CAD/CAM与制造业信息化》2016,(1)
2016年1月4日,在美国拉斯维加斯举办的国际消费类电子产品展览会(CES)上,NVIDIA发布了NVIDIA DRIVE PX 2,全球最强大的车载人工智能引擎.
DRIVE PX 2是NVIDIA为其汽车领域的合作伙伴而打造的产品,这套系统相当于150台MacBook Pro,为深度学习提供了前所未有的处理性能.它包含2颗第二代Tegra处理器和2颗基于Pascal架构的新一代独立GPU,每秒最多可完成24万亿次深度学习运算.该平台采用专门的指令集,这些指令集可加速深度学习网络推理中所运用的数学运算,平台计算性能比上一代产品快10倍以上.在通用浮点运算方面, DRIVE PX 2的多精度GPU架构每秒最多能够完成8万亿次运算,比上一代产品快了4倍以上. 相似文献
18.
复杂嵌入式应用领域的具体计算任务不仅需要计算平台具有嵌入式高效能计算能力,而且应具有与应用特点匹配的计算资源结构;面向复杂嵌入式应用领域研究了众核处理机体系架构,在GPU基本计算形态的基础上,依据NVIDIA Kepler架构的特性,进一步研究、构建了相应的众核组织与处理模式,将其形成3种基本计算模式:单任务并行计算、多任务并行计算、多任务流处理计算,有效地提高了嵌入式高性能计算的效能和灵活性。 相似文献
19.
20.
今年1月份,NVIDIA推出了采用Ampere架构的GeForce RTX 30系列Laptop GPU,不过首批上市的笔记本是基于RTX 3080、RTX 3070的机型,而且由于众所周知的原因,这些RTX 30系笔记本非常火爆,普通玩家一时也难以抢到。对于主流市场,NVIDIA拿出了最新的GeForce RTX 3060 Laptop GPU,目前搭载该GPU的游戏本相继上市,部分产品的售价甚至低至8000元档,比如我们本次体验的机械师T58-V。那么这台机器的实际表现如何呢? 相似文献