期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王阳《自动化应用》2023,(14):241-244

军用电子信息系统网络化带来的数据交互需使用安全传输技术保证交互过程的安全性。传统的加密方式带来的传输时延影响了系统的实时性,本文研究基于OpenCL的AES算法并行化技术,为安全传输提供快速加密的技术支撑。通过对AES算法并行化的研究分析,设计T盒取代原有的S盒替换、行位移、列混合的数据块加密操作。通过多粒度加密方式对比、内存分配对比实验找出最优化的存储策略和并行粒度,使得优化后的AES算法在同等硬件环境下取得了最大3.74的加速比,能适用于安全传输且满足系统实时性的需求。相似文献

2.

基于OpenCL的NDVI算法的并行化实现

熊英罗琼《电脑开发与应用》2013,(11):77-78

以NDVI算法为例,讲述了利用OpenCL框架,使用GPU对NDVI算法实现加速操作。利用OpenCL框架的异构性,研究是否能更加有效提高加速比。相似文献

3.

基于OpenCL的并行kNN算法设计与实现

杨朋霖冯百明周志阳温向慧《计算机工程与科学》2017,39(12):2198-2202

kNN算法是机器学习和数据挖掘程序中经常使用的经典算法。随着数据量的增大,kNN算法的执行时间急剧上升。为了有效利用现代计算机的GPU等计算单元减少kNN算法的计算时间,提出了一种基于OpenCL的并行kNN算法,该算法对距离计算和排序两个瓶颈点进行并行化,在距离计算阶段使用细粒度并行化策略和优化的线程模型,排序阶段使用优化内存模型的双调排序。以UCI数据集letter为测试集,分别使用E8400和GTS450运行kNN算法进行测试,采用GPU加速的并行kNN算法的计算速度比CPU版提高了40.79倍。相似文献

4.

基于GPU的JPEG压缩算法实现

李杰刘灏马恩财刘明锋《数字社区&智能家居》2014,(26):6158-6160

图形处理器(Graphic Processing Unit),简称GPU,是针对多线程程序对吞吐量进行优化的处理器,在硬件设计上属于众核架构,非常适合于大规模并行计算任务。JPEG图像压缩作为计算密集型的矩阵数据运算,用GPU技术对JPEG算法进行实现,能充分发挥GPU的并行处理能力,极大提高编码效率。相似文献

5.

基于数组元素视图的并行化和特征

曾国荪陆鑫达《计算机科学》2001,28(5):15-19

1 引言近年高性能并行计算研究领域已转到异构计算,因为一个复杂的计算问题,如Grand challenge问题,往往存在多种计算需求,任何单一的计算模式,如:SISD,SIMD,MIMD,数据流等,都不能使求解过程顺利进行。只有按需分配计算模式,才能取得计算性能最优。异构计算的关键是并行性特征的提取。我们已经提出了基于程序结构和基于程序运行性能分析的两种方法,但还不完善。本文希望通过数组元素视图作深入的研究。相似文献

6.

基于OpenCL的自动微分并行实现及其应用

下载免费PDF全文

叶爱芬王环沈雁《计算机测量与控制》2019,27(5):155-159

针对如光束平差这样的大规模优化问题,实现基于OpenCL的并行化自动微分。采用更有效的反向计算模式,实现对多参数函数的导数计算。在OpenCL框架下,主机端完成C/C++形式的函数构建以及基于拓扑排序的计算序列生成,设备端按照计算序列完成函数值以及导数的并行计算。测试结果表明,将实现的自动微分应用于光束平差的雅可比矩阵计算后,相比于采用OpenMP的Ceres Solver,运行速度提高了约3.6倍。相似文献

7.

基于HXDSP的OpenCL运行时任务调度

顾经纬宁成明郑启龙《计算机系统应用》2022,31(11):130-138

OpenCL是一种开源免费的异构计算框架,被各类架构处理器广泛采用. HXDSP是中国电子科技集团公司第38研究所自主研发的国产高性能DSP芯片.为了解决HXDSP异构计算平台调度困难和硬件利用不充分,本文针对OpenCL运行时任务调度系统展开研究,设计了OpenCL运行时期间的任务图自动化提取方法,并结合HXDSP硬件特性和OpenCL执行模型特性对经典的静态调度算法HEFT进行改进,提出了一种异构双粒度最早完成时间优先调度算法HDGEFT,并在HXDSP异构计算平台上设计实验验证算法.实验结果表明经过特殊设计的调度算法在执行效率上有明显优势. 相似文献

8.

面向OpenCL模型的DCT并行化

向阳霞张惠民王子强《数字社区&智能家居》2013,(26):6007-6011

为了提高DCT变换的速度,文中对面向OpenCL模型的DCT并行化过程进行了研究,首先分析了GPU和OpenCL的特性和优势,研究了传统DCT变换的工作原理,然后针对CPU和GPU两种不同平台对DCT变换进行测试和结果分析,实验结果表明基于OpenCL模型的并行化能够有效地提高DCT变换的速度。相似文献

9.

Zynq异构FPGA平台的OpenCL框架研究

赵灵超柴志雷王芝斌《单片机与嵌入式系统应用》2016,(7):6-9

物联网与移动互联网的快速发展对高性能计算的需求愈发强烈,异构芯片往往比通用处理器有更好的计算能力,面对不同厂商的各种异构加速器,OpenCL作为业界标准统一了各种异构芯片的开发方式.FPGA在很多领域因其高性能、低功耗的特点成为异构芯片的佼佼者,但是目前对基于Xilinx FPGA的SoC尚无OpenCL的支持.本文以OpenCL规范为基础,为Xilinx Zynq SoC提供了OpenCL编程所需的依赖环境,实验结果表明,该环境为此类SoC开发省去了至少7个与硬件相关的开发步骤,使其易用性与开发效率有很大改善. 相似文献

10.

并行DSP处理器上JPEG算法的实现研究 总被引：1，自引：0，他引：1

刘杰康克军李政《计算机工程》2000,26(11):50-51

ＪＰＥＧ算法由于效率高和实用性强获得了广泛的应用;而并行处理器ＤＳＰ具有高效的并行处理能力,因而适合于图象的实时处理。提出了在ＴＩ的并行处理器ＤＳＰ－Ｃ８０上并行和快速实现ＪＰＥＧ算法的方法,实现了高速实时图象压缩。相似文献

11.

基于OpenCL的尺度不变特征变换算法的并行设计与实现

许川佩王光《计算机应用》2016,36(7):1801-1806

针对尺度不变特征变换（SIFT）算法实时性差的问题,提出了利用开放式计算语言（OpenCL）并行优化的SIFT算法。首先,通过对原算法各步骤进行组合拆分、重构特征点在内存中的数据索引等方式对原算法进行并行化重构,使得算法的中间计算结果能够完全在显存中完成交互;然后,采用复用全局内存对象、共享局部内存、优化内存读取等策略对原算法各步骤进行并行设计,提高数据读取效率,降低传输延时;最后,利用OpenCL语言在图形处理单元（GPU）上实现了SIFT算法的细粒度并行加速,并在中央处理器（CPU）上完成了移植。与原SIFT算法配准效果相近时,并行化的算法在GPU和CPU平台上特征提取速度分别提升了10.51～19.33和2.34～4.74倍。实验结果表明,利用OpenCL并行加速的SIFT算法能够有效提高图像配准的实时性,并能克服统一计算设备架构（CUDA）因移植困难而不能充分利用异构系统中多种计算核心的缺点。相似文献

12.

基于OpenCL的雷达外推算法改进与优化

王兴 ;苗春生 ;王秀君 ;樊仲欣《计算机与现代化》2014,(8):81-86

基于雷达资料的外推是临近预报中重要的方法之一,随着全国气象雷达网络建设规模的不断提高以及观测资料精细化程度的提升,基于区域乃至全国雷达拼图的外推预报,每次计算都需花费大量时间,甚至滞后于每6分钟一次的资料观测频次。为解决传统外推算法运算复杂度高,实时性差的问题,运用OpenCL构建基于GPU的异构计算模型对外推算法进行并行化改进。然后逐步分析影响算法性能的瓶颈,并通过改进和测试数据比对,阐述算法优化的过程。其中,内存与线程的映射优化、合理利用局部存储器作为高速缓存以及隐藏CPU执行时间等方法不仅对本算法的执行效率带来显著提升,也可为其他基于OpenCL异构计算的优化提供参考。以AMD Graphic Core Next和Northern Islands二代GPU架构作为测试平台,并以Intel CPU并行计算作为测试参考,测试结果表明,改进后的算法在硬件同等功耗的情况下,计算性能提升15~22倍。相似文献

13.

基于混沌和比特级置乱的并行图像加密算法

温万里游林《信息网络安全》2014,(4):40-45

文章提出一种基于混沌和比特级置乱的并行图像加密算法--CBLP算法。该算法主要包含3种基本运算：像素位置置换、比特旋转（BR）以及像素值异或（XOR）运算,其中位置置换用于置乱像素位置,BR和XOR运算用于扩散图像的像素值。另外,为充分利用当前异构处理平台的计算资源以大幅提升算法的执行效率,文章在NIVIDIA GeForce GTX 580 GPU上使用OpenCL技术并行实现了该算法。实验结果和数值分析表明,CBLP算法具有较高的加密效率和良好的安全性,可以有效地应用于实际加密当中,具有较高的应用价值。相似文献

14.

基于FPGA的JPEG压缩编码设计与实现

余磊李磊崔建明陈新华《微型机与应用》2012,31(21)

利用FPGA可以并行处理数据的优点,设计出了一种JPEG压缩编码电路。并在尽量保证图像质量的前提下,对JPEG的传统编码过程进行优化与调整,简化了编码电路,提高了编码效率,并生成独立IP核,方便调用。实验结果表明,设计的编码电路完全达到了预期目的。相似文献

15.

基于Omap5910嵌入式平台的并行JPEG压缩算法

程志贾智平郝凤琦《计算机工程与设计》2008,29(16)

针对传统离散余弦变换的行列法中存在的并行性,提出了一个基于Omap5910平台的并行JPEG压缩算法.该算法利用JPEG图像压缩过程中的数据无关性将任务分配到Omap5910平台的两个处理器(ARM和DSP)上,并以多线程模拟多处理器对JPEG压缩过程中的关键步骤离散余弦变换进行并行处理.实验结果表明,该算法在保证与串行压缩算法具有相同的压缩质量的前提下,能够有效地提高JPEG压缩的速度. 相似文献

16.

基于OpenCL的累积汇流并行计算

龙满生罗文浪《计算机工程与应用》2014,(3):22-29,116

大尺度、高分辨率数字地形数据应用需求的增长,给计算密集型的累积汇流等数字地形分析算法带来了新的挑战。针对CPU/GPU(Graphics Processing Unit)异构计算平台的特点,提出了一种基于OpenCL(Open Computing Language)的多流向累积汇流算法的并行化策略,具有更好的平台独立性和可移植性,简化了CPU/GPU异构平台下的并行应用程序设计。累积汇流并行算法包括时空独立型的流量分配和空间依赖型的累积入流两个过程,均定义为OpenCL内核并交由OpenCL设备并行执行,其中累积入流过程借助流量转移矩阵由递归式转换为迭代式来实现并行计算。与基于流量转移矩阵的并行汇流算法相比,尽管基于单元入度矩阵的并行汇流算法可以降低迭代过程中的计算冗余,但需要采用具有较大延迟的原子操作以及需要更多的迭代次数,在有限的GPU计算资源下,两种算法性能差异不明显。实验结果表明,并行累积汇流算法在NVIDIA GeForce GT 650M GPU上获得了较好的加速比,加速性能随格网尺度增加而有所增加,其中流量分配获得了约50～70倍的加速比,累积入流获得了10～20倍的加速比,展示了利用OpenCL在GPU等并行计算设备上进行大规模数字地形分析的潜在优势。相似文献

17.

JPEG图像压缩算法的IP核设计 总被引：2，自引：0，他引：2

王镇道陈迪平文康益《计算机应用》2005,25(5):1076-1077,1080

以基于矩阵分解的二维DCT算法为基础,设计了JPEG图像压缩算法的IP核,并用Verilog-HDL语言对各模块和整个IP核进行了RTL级描述和仿真,实验结果验证了设计的正确性。相似文献