期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

齐崇英王艺韩颖《计算机工程与设计》2012,33(2):705-710

在构建数据融合仿真系统通用架构的基础上,介绍了系统主要功能和仿真流程;研究了数据融合模块设计、效能评估指标体系、效能评估数学模型等仿真系统实现的关键技术,从数据融合算法设计及系统软件开发两个方面,提出了数据融合仿真系统通用架构开发实现的基本思路和方法.该系统不但可用来研究评价不同数据融合模型、算法的性能,而且可用来评估数据融合系统的整体性能,对实际系统实现也有相当的借鉴作用. 相似文献

2.

面向E级计算的高性能处理器核心运算架构研究进展

吴铁彬过锋王谛《计算机工程与科学》2023,(5):761-771

高性能计算(HPC)已经进入后E级时代。作为超算系统核心器件,高性能处理器通过核心运算架构为HPC提供超强算力。核心运算架构的研究进展代表了高性能处理器体系结构的发展方向。以面向E级计算的先进高性能处理器为目标,从运算资源组织结构、数据和指令级并行方式、领域专用加速结构、支持数据类型和算力等方面对核心运算架构研究进展进行分析和探讨,并展望了高性能处理器核心运算架构的发展趋势。超宽向量SIMD和SIMT、领域专用加速结构加速矩阵运算、支持多种低精度运算以加速HPC和AI融合,将是未来高性能处理器核心运算架构研究和发展的主要方向。相似文献

3.

数据中心超融合系统架构应用研究

《信息与电脑》2019,(13)

经济水平全面提升的背景下,数据中心实现了显著发展。当前数据中心的发展已逐渐成为社会各界关注的重点。如何提升数据中心资源利用效率,合理控制成本,优化管理工作,成为当前需要重点解决的问题。超融合系统架构的出现,可以进一步实现存储、核心计算和网络功能的集成,在数据中心合理应用,对解决工作中的问题、提升数据中心工作的准确性具有重要帮助。为此,详细研究了数据中心超融合系统架构应用情况,希望为相关工作的开展提供一定帮助和指导作用。相似文献

4.

基于GPU的多层显微图像实时融合技术

何晓昀《微计算机信息》2012,(8):168-170

随着GPU技术的发展,GPU比CPU拥有了更高的处理能力。本文提出将多层显微图像融合计算由CPU转移到GPU上进行,提升融合速度,最终达到图像融合与图像采集同步。两者的对比实验结果表明GPU在进行图像融合有明显的速度优势;将图像融合嵌入到图像采集程序后的测试表明通过GPU进行图像融合完全可以与相机采集相同步,完成采集、融合实时进行。这一结果改变了长期以来研究人员进行图像融合时,先拍照,再融合的工作流程,只需要将相机在不同聚焦高度扫描一次即可得到多层聚焦位置的融合图。相似文献

5.

MIPS64架构推动Cavium Networks新型OCTEON Ⅱ处理器

《单片机与嵌入式系统应用》2009,(6)

相似文献

6.

海思处理器Hi3518 SDK架构分析和系统移植

吴丽萍蒋星红戈志明《工业控制计算机》2014,(6):15-16

海思半导体作为国产芯片生产的领先者,近几年相继推出了多款高性能的数字媒体处理芯片。作为监控领域的代表Hi3516、Hi3518芯片在很多厂家得到了充分的应用。SDK中媒体驱动相关部分不提供源码,都是只以模块ko和库lib的形式提供。因此在进行系统移植时需要特别注意。分析了Hi3518 SDK的架构,提出了相关的系统移植方法。相似文献

7.

融合边缘计算的新型科研云服务架构

周旭王浩宇覃毅芳程耀东《数据与计算发展前沿》2020,2(4)

相似文献

8.

融合架构云服务器体系结构和关键技术

下载免费PDF全文

黄家明李冠广乔英良班华堂梁锐《计算机工程与应用》2018,54(14):65-70

针对云计算、大数据等应用对异构资源管理和聚合的需求,提出了一种融合架构云服务器体系结构及其关键支撑技术。融合架构云服务器利用硬件资源池化技术,实现计算、存储、网络、供电、制冷和管理模块的解耦与融合重构,具有高密度、低功耗、易扩展、易管理,易维护特点,兼具横向扩展和纵向扩展优势,可优化系统部署、运维和能耗成本,显著降低总体拥有成本（TCO）。在金融、电信和互联网行业的实际应用案例表明,融合架构云服务器功耗降低超过15%,总体拥有成本降低近15%,为云计算、大数据等应用提供了更具性能功耗比优势的IT基础设施设计方案。相似文献

9.

多分辨图像融合通用开发平台

下载免费PDF全文

李波王娟覃征李爱国《计算机工程》2006,32(24):269-271

多分辨图像融合是图像融合技术的一个研究热点，具有广泛的应用前景。为方便多分辨图像融合仿真应用系统的开发和对新融合算法的比较验证，提出了一个开放的多分辨图像融合应用与开发平台。该平台使用了一个新的通用的多分辨图像融合仿真模型，进行了详细的模块结构设计，并实现了12种典型的多分辨图像融合算法。在平台之上可以构筑相关工程应用仿真系统，也可方便地集成新的算法进行融合比较实验。最后为了验证平台功能，给出了一个工程应用实例和一个新融合算法的比较验证实例。相似文献

10.

星地融合5G网络架构增强技术研究

王胡成徐晖孙韶辉《电子技术应用》2022,48(6):1-4+9

星地融合为5G网络带来更强的覆盖能力、更灵活的组网能力和更健壮的网络结构,使得5G网络真正可能实现万物互联,因此成为5G网络演进的重要方向。首先介绍了在后5G时代支持星地融合的必要性,然后从网络架构和技术标准的角度分析了当前星地融合5G网络的发展阶段和技术现状。基于技术现状,分析星地融合5G网络在系统架构演进方面面临的问题,并给出架构增强技术方案。相似文献

11.

Julia集合CPU和GPU方法的分析比较

李改红刘金义谢阳马梁《微处理机》2012,33(6):48-50

Julia集合编程主要有CPU和GPU两种实现方法。这两种方法的主要区别就是核函数的实现,在CPU方法中使用for()循环来遍历数据,而GPU方法中使用线程块的索引来生成数据的索引从而来遍历数据。通过实验测试,GPU方法的性能比CPU方法提高了将近10倍。相似文献

12.

Transparent partial page migration between CPU and GPU

Shiqing ZHANG Zheng QIN Yaohua YANG Li SHEN Zhiying WANG 《Frontiers of Computer Science》2020,14(3):143101-13

Despite the increasing investment in integrated GPU and next-generation interconnect research,discrete GPU connected by PCIe still account for the dominant position of the market,the management of data communication between CPU and GPU continues to evolve.Initially,the programmer explicitly controls the data transfer between CPU and GPU.To simplify programming and enable systemwide atomic memory operations,GPU vendors have developed a programming model that provides a single,virtual address space for accessing all CPU and GPU memories in the system.The page migration engine in this model automatically migrates pages between CPU and GPU on demand.To meet the needs of high-performance workloads,the page size tends to be larger.Limited by low bandwidth and high latency interconnects compared to GDDR,larger page migration has longer delay,which may reduce the overlap of computation and transmission,waste time to migrate unrequested data,block subsequent requests,and cause serious performance decline.In this paper,we propose partial page migration that only migrates the requested part of a page to reduce the migration unit,shorten the migration latency,and avoid the performance degradation of the full page migration when the page becomes larger.We show that partial page migration is possible to largely hide the performance overheads of full page migration.Compared with programmer controlled data transmission,when the page size is 2MB and the PCIe bandwidth is 16GB/sec,full page migration is 72.72×slower,while our partial page migration achieves 1.29×speedup.When the PCIe bandwidth is changed to 96GB/sec,full page migration is 18.85×slower,while our partial page migration provides 1.37×speedup.Additionally,we examine the performance impact that PCIe bandwidth and migration unit size have on execution time,enabling designers to make informed decisions. 相似文献

13.

Heterogeneous CPU plus GPU approaches for HEVC

Cebrián-Márquez Gabriel Galiano Vicente Migallón Héctor Martínez José Luis Cuenca Pedro López-Granado Otoniel 《The Journal of supercomputing》2019,75(3):1215-1226

The Journal of Supercomputing - The high efficiency video coding (HEVC) standard has opened the door to high-quality multimedia contents and new formats such as ultra-high definition as a result of... 相似文献

14.

CPU/GPU协同并行计算研究综述 总被引：3，自引：3，他引：3

卢风顺宋君强银福康张理论《计算机科学》2011,38(3):5-9

CPU/GPU异构混合并行系统以其强劲计算能力、高性价比和低能耗等特点成为新型高性能计算平台,但其复杂体系结构为并行计算研究提出了巨大挑战。CPU/GPU协同并行计算属于新兴研究领域,是一个开放的课题。根据所用计算资源的规模将CPU/GPU协同并行计算研究划分为三类,尔后从立项依据、研究内容和研究方法等方面重点介绍了几个混合计算项目,并指出了可进一步研究的方向,以期为领域科学家进行协同并行计算研究提供一定参考。相似文献

15.

多核CPU和GPU加速分子动力学模拟

林江宏林锦贤吕暾《计算机应用》2011,31(3):843-847

在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了计算机的处理能力。性能测试结果表明,相对于优化后的CPU串行计算,多核CPU-GPU异构并行计算模型有强大的性能优势,特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行,获得了最高可达12倍的计算加速比。相似文献

16.

CPU与GPU上几种矩阵乘法的比较与分析 总被引：1，自引：0，他引：1

下载免费PDF全文

刘进锋郭雷《计算机工程与应用》2011,47(19):9-11

描述了矩阵乘法在CPU上的三种实现方法和在GPU上基于CUDA架构的四种实现方法,分析了高性能方法的原由,发现它们的共同特点都是合理地组织数据并加以利用,这样能有效地减少存取开销,极大地提高算法的速度。其中CPU上的最优实现方法比普通算法快了200多倍,GPU上的最优实现方法又比CPU上的最优实现方法快了约6倍。相似文献

17.

多图像同态滤波的 CPU 和 GPU 并行计算磁

玉易钟诚郑明叶波《计算机与数字工程》2014,(10)

采取 CPU 分发图像滤波任务和回收滤波结果、将多个图像数据划分分配给多个 GPU 及其线程块、GPU 调用核函数库对图像进行傅里叶变换和反傅里叶变换的方法,设计实现了 CPU 和 GPU 协同计算的多图像同态滤波并行算法。实验结果表明,给出的多图像同态滤波并行算法高效,与单 GPU 计算的并行算法相比,多 GPU 协同计算的并行算法显著缩短了多个图像同态滤波处理所需的时间。相似文献

18.

Combining CPU and GPU architectures for fast similarity search

Martin Kruli? Tomá? Skopal Jakub Loko? Christian Beecks 《Distributed and Parallel Databases》2012,30(3-4):179-207

The Signature Quadratic Form Distance on feature signatures represents a flexible distance-based similarity model for effective content-based multimedia retrieval. Although metric indexing approaches are able to speed up query processing by two orders of magnitude, their applicability to large-scale multimedia databases containing billions of images is still a challenging issue. In this paper, we propose a parallel approach that balances the utilization of CPU and many-core GPUs for efficient similarity search with the Signature Quadratic Form Distance. In particular, we show how to process multiple distance computations and other parts of the search procedure in parallel, achieving maximal performance of the combined CPU/GPU system. The experimental evaluation demonstrates that our approach implemented on a common workstation with 2?GPU cards outperforms traditional parallel implementation on a high-end 48-core NUMA server in terms of efficiency almost by an order of magnitude. If we consider also the price of the high-end server that is ten times higher than that of the GPU workstation then, based on price/performance ratio, the GPU-based similarity search beats the CPU-based solution by almost two orders of magnitude. Although proposed for the SQFD, our approach of fast GPU-based similarity search is applicable for any distance function that is efficiently parallelizable in the SIMT execution model. 相似文献

19.

面向多核CPU和GPU平台的数据库星形连接优化

刘专韩瑞琛张延松陈跃国张宇《计算机应用》2021,41(3):611-617

针对联机分析处理(OLAP)中事实表与多个维表之间的星形连接执行代价较高的问题,提出了一种在先进的多核中央处理器(CPU)和图形处理器(GPU)上的星形连接优化方法.首先,对于多核CPU和GPU平台的星形连接中的物化代价问题,提出了基于向量索引的CPU和GPU平台上的向量化星形连接算法;然后,通过面向CPU cache... 相似文献

20.

基于GPU与CPU协作的实时波束形成实现方法*

李晓敏侯朝焕鄢社锋杨力《计算机应用研究》2011,28(4):1333-1335

波束形成的实时性一直是声纳和雷达等领域信号处理过程中的重点和难点。本文采用基于CUDA(Compute Unified Device Architecture,统一计算设备架构)的GPU(Graphic Processing Unit,图形处理器)与CPU协作处理方法,实现了宽带波束形成的实时处理。本方法的处理速度相较于matlab和CPU平台可以提高一至两个数量级,相较于同等处理速度的多DSP平台则体现了开发周期短、费用低、工作量小和可靠性高等众多优势。相似文献