共查询到20条相似文献,搜索用时 0 毫秒
1.
3.
4.
5.
6.
数字信号处理嚣(DSP)是专用的处理器,主要功能是高效率地执行信号处理算法。此外,应用中通常还需要执行传统的微控制器代码。为解决这一问题设计人员通常在系统中同时使用DSP和微控制器。但这样会增加产品的成本。本文介绍了一种新的DSP架构,它非常适合通用DSP算法,同时又可高效率地执行微控制器代码,并且有高效率的编译器性能。 相似文献
7.
8.
图形处理器协同运算的视频处理架构 总被引:1,自引:0,他引:1
多媒体视频处理的任务繁重,计算量大,很多算法无法在仅使用一颗CPU的条件下达到实时处理的速度。设计一套图形处理器协同运算的视频处理架构,它采用图形处理器与中央处理器配合,共同完成视频计算的任务。这种架构可以大大加速处理速度,并减轻中央处理器的负担。 相似文献
9.
10.
介绍了一种为T RIC快速开发高级语言编译工具的方法.LCC是一个小型的可变目标C语言编译器,通过扩展LCC后端使其支持硬件中断等嵌入式C语言语法特性,进而实现 T RIC的C语言编译器.经测试验证,此方法可大大降低移植LCC的难度和出错的概率,且能快速开发出目标处理器的编译工具. 相似文献
11.
12.
随着计算机硬件技术的高速发展,图形处理器(Graphic processing unit,GPU)通用计算已经发展到颇为成熟阶段,其并行运算速度已远远超过多核CPU。文章简介CUDA架构并验证其在图形处理中的加速能力,对比线性代数运算在CPU与GPU架构下的效率,将CUDA技术应用于智能视频监控人体检测系统中,实验验证其高效性及可行性。最后对CUDA的发展方向进行了展望。 相似文献
13.
为了能在PC机上处理大规模数据集问题,提出了使用CUDA架构对LP-SVM的加速实现方法。该方法针对PC机内存小的缺点,对SVM的分解算法进行改编,得到求解LP-SVM的分解算法。LP—SVM分解算法每次只需要求解一个小规模的线性规划问题,避免一次性把所有训练数据都装进内存。同时把求解线性规划中比较耗时的矩阵运算,移植到CUDA上进行,提高了求解效率。实验结果表明:LP—SVM算法在经过CUDA加速以后,算法的执行效率提高了10—35倍。 相似文献
14.
基于GPU的高度并行Marching Cubes改进算法 总被引:1,自引:0,他引:1
提出一种完全基于GPU(graphics processing unit)的高度并行Marching Cubes改进算法.针对Marching Cubes算法流程中数据处理阶段进行优化.首先并行遍历每个体元,以序列形式得到每体元的非空状态,再利用高效流式缩减操作获得非空体元序列以便仅针对非空体元高度并行地生成等值面三角形.实验表明,与同市场价格CPU实现相比,该算法效率最高提高到了前者的9倍以上. 相似文献
15.
为了提高发射宽度,高端DSP普遍采用分簇结构设计.分簇结构的处理器依赖编译器在代码生成的时候指定每条指令所在的簇.针对传统分簇算法中存在参考信息太过局部的问题,提出一种依据资源压力将指令依赖图划分成多个子图,然后对子图进行分簇的算法.最后,验证了该算法能够提高分簇效率. 相似文献
16.
随着图形处理器(GPU)的处理能力的不断增强,图形处理器越来越多地被应用于计算密集型的数据运算处理中。JPEG图像压缩算法中的部分步骤存在典型的并行特性,针对大分辨率图像JPEG压缩串行顺序执行时间开销较大的问题,利用CUDA的并行计算和图形硬件的可编程性,可实现对JPEG图像压缩的加速,同时结合GPGPU硬件结构可实现JPEG压缩程序程序的优化设计。通过程序测试实验,与串行程序比较加速比在20以上。 相似文献
17.
近几年图形处理器GPU的通用计算能力发展迅速,现在已经发展成为具有巨大并行运算能力的多核处理器,而CUDA架构的推出突破了传统GPU开发方式的束缚,把GPU巨大的通用计算能力解放了出来.本文利用GPU来加速AES算法,即利用GPU作为CPU的协处理器,将AES算法在GPU上实现,以提高计算的吞吐量.最后在GPU和CPU... 相似文献
18.
19.
LSI公司推出专为无线基础设施应用设计的Axxia系列通信处理器.Axxia 通信处理器采用突破性Lsl VIrtual Pipcline消息传递技术,将为用户提供更快速和稳定的性能,可满足视频流、web浏览和高质量数字语音等高要求无线应用的需求. 相似文献