首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
针对现有地貌晕渲算法多是基于单核单线程编程模式从而导致计算效率较低的问题,提出利用多核并行计算模式对现有地貌晕渲算法进行并行化改进。首先,通过格网分割方式对原始数字高程模型(DEM)数据进行分割从而实现数据分块;其次,利用.NET环境下的Parallel类对分块数据进行并行晕渲处理,得到各个分块数据的晕渲结果;最后,对各个分块数据的晕渲图像进行拼接,从而得到完整的地貌晕渲图像。实验结果表明:并行化改进算法的计算效率明显高于现有单核单线程地貌晕渲算法,且参与计算核数与晕渲效率基本上呈线性增长关系;同时,分析发现地貌晕渲的立体真实感与光源参数的设置极其相关。  相似文献   

2.
数据分块数的选择是并行/分布式机器学习模型选择的基本问题之一,直接影响着机器学习算法的泛化性和运行效率。现有并行/分布式机器学习方法往往根据经验或处理器个数来选择数据分块数,没有明确的数据分块数选择准则。提出一个并行效率敏感的并行/分布式机器学习数据分块数选择准则,该准则可在保证并行/分布式机器学习模型测试精度的情况下,提高计算效率。首先推导并行/分布式机器学习模型的泛化误差与分块数目的关系。然后以此为基础,提出折衷泛化性与并行效率的数据分块数选择准则。最后,在ADMM框架下随机傅里叶特征空间中,给出采用该数据分块数选择准则的大规模支持向量机实现方案,并在高性能计算集群和大规模标准数据集上对所提出的数据分块数选择准则的有效性进行实验验证。  相似文献   

3.
针对锥束CT感兴趣区域扫描中存在的截断投影数据图像重建问题,提出用基于迭代的代数重建(ART)算法进行重建。锥束ART算法的缺点是计算量大、重建速度慢。为了提高该算法的重建速度,提出了一种基于多核平台的快速并行图像重建方法。首先将三维重建区域等分为上下两块,相应地,探测器平面也分为上下两部分;然后通过双线性插值计算虚拟探测器投影数据;最后通过多线程技术在多核平台上实现了ART算法的并行重建,在保持较高重建精度的同时取得了约两倍的重建加速比。在此基础上,通过仿真实验对3DShepp-Logan模型不同感兴趣区域进行了重建,实验结果表明,ART算法用于感兴趣区域图像重建是可行的。  相似文献   

4.
利用多核处理器提供的强大计算能力提升数据库系统性能是当前国内外数据库研究的重要问题.利用基于多核处理器上的并行编程模型MSI和Intel处理器上的SIMD(单指令流多数据流)指令有效地加速了数据库查询的Join操作,与串行实现相比其最大加速可以达13倍.同时,还对比不同数据分块大小情况下对算法的影响,找到了优化的数据分块方法.  相似文献   

5.
刘晋胜  周靖 《微处理机》2011,32(2):38-40
图像匹配是图像处理的一个重要分支,其算法运算量大。针对图像互相关匹配算法具有较强的并行特性,提出空间分块技术对图像进行分块以及算法进行任务均衡分解,并将分割的图像数据通过FPGA生成的四块双口RAM空间进行数据存储并传输给多DSP进行图像NCCF值计算,实现快速图像匹配。实验证明该系统实现方案可行,具有较强的实际应用效果。  相似文献   

6.
逐次松弛迭代算法(SOR)是求解线性方程组的一种常用迭代算法,当系数矩阵正定时,它具有较快的收敛速度。但是,由于每个迭代步内存在数据相关,它难以实现并行计算。目前的SOR并行算法采用数据分解的方法,但由于该法并行区域过小,同步通讯代价大,并行效率低。本文提出了SOR的一种新型并行算法,该算法与传统SOR方法等价,具有相同的收敛性和迭代结果。该并行算法通过矩阵分块增大了可并行计算的区域,并引入流水线技术,利用各处理器间通讯与计算时间的重叠,获得较理想的并行加速效率。通过多核微机以及小规模集群上的数值实验证明,本文提出的SOR并行算法在求解大型稠密线性方程组时具有较好的并行效率。  相似文献   

7.
冯飞龙  陈耀武 《计算机工程》2010,36(23):226-228,233
对于多核高清视频实时编码系统,提出一种自适应Slice划分算法。该算法基于码率控制和熵编码复杂度模型,通过Intra预测得到当前编码图像的纹理复杂度分布,预测编码图像的计算复杂度分布,通过自适应Slice划分实现多核间计算复杂度均匀分配,从而提高多核并行编码效率。实验结果表明,与固定宏块数的Slice划分算法相比,该算法能更有效地提高并行加速比。  相似文献   

8.
多核处理器并行编程模型的研究与设计   总被引:2,自引:0,他引:2  
为了在多核处理器上充分利用多核资源以提升程序性能,研究了多核处理器的体系结构和多核环境下可能影响并行程序性能的因素,实现了基于任务的并行编程模型.该模型提供了单任务数据并行和多任务并行两种并行处理方式,其中单任务数据并行使用cache块技术划分数据集,多任务并行使用任务密取的任务调度策略.用该模型实现了计算斐波那契数列的递归算法,实验结果表明,使用该模型编写多核并行程序可以达到较高的相对于串行计算的加速比.  相似文献   

9.
多核图像处理并行设计范式的研究与应用   总被引:1,自引:0,他引:1       下载免费PDF全文
王成良  谢克家  刘昕 《计算机工程》2011,37(14):220-222
多核计算环境下采用图像处理并行算法可提高图像处理的速度,但已有的并行设计只针对边缘检测、图像投影等特定算法进行,没有形成通用的并行算法设计范式。为此,在研究图像处理算法可并行处理机制和多核架构特点的基础上,提出分析、建模、映射、调试和性能评价及测试发布等5个设计步骤的基于多核计算环境的图像处理算法并行设计范式,以图像傅里叶变换并行算法设计为例在单核、双核、四核、八核计算环境下验证了该并行范式的有效性。实验结果表明,该范式在图像处理并行设计方面可扩展图像处理的应用空间。  相似文献   

10.
将三维重建中捆集调整算法用于优化重建结果,是非常关键的步骤,然而传统单核串行算法耗时量大不太适合大场景重建。对此,首先对捆集调整算法本身进行了改进;然后在此基础上提出了多核并行捆集调整算法并采用图像处理器(GPU)实现该算法。实验表明,所提出的多核并行捆集调整算法提高了算法优化参数的精度和处理速度。  相似文献   

11.
面向算法的SIMD计算机数学模型及其应用研究   总被引:1,自引:0,他引:1  
针对数据并行计算在图像处理中的应用研究,提出了数据并行计算机的面向算法的数学模型,以及利用该模型得到的一种新颖的、数据并行算法的数学描述方法.采用该数学描述方法对数据并行图像处理中的灰度直方图运算、区域增长法图像分割以及图像卷积运算等3类图像处理方法进行了描述.结果表明,该数学描述方法不仅简单可行和精确,而且,可以从数学公式中直接得到算法的通信复杂性和计算复杂性.该方法可以应用到数据并行计算的应用研究中作为数学描述的工具.  相似文献   

12.
将常用于CT图像重建的滤波反投影算法程序设计成能够运行在大数据框架Spark中的并行模式,以此来提高计算效率并实现批量图像的重建,缩短图像重建时间。基于分布式计算框架Spark,利用其图像处理工具Thunder,将滤波反投影算法在图像重建过程中设计成并行程序模式,实现图像的片间并行重建。实验结果表明,随着Spark集群规模的不断扩大,在确保重建图像质量的前提下,重建一定数量的CT图像相比单机模式下时间显著缩短,并行滤波反投影算法具有完全加速比,并行效率趋近于1。基于Spark集群实现的滤波反投影算法能够显著提升CT图像重建速度,并实现大量图像并行重建,可扩展其他的CT图像重建算法,对远程医学图像重建平台的建设具有重要参考意义。  相似文献   

13.
利用GPU进行加速的归一化差分植被指数(Normalized Differential Vegetation Index,NDVI)提取算法通常采用GPU多线程并行模型,存在弱相关计算之间以及CPU与GPU之间数据传输耗时较多等问题,影响了加速效果的进一步提升。针对上述问题,根据NDVI提取算法的特性,文中提出了一种基于GPU多流并发并行模型的NDVI提取算法。通过CUDA流和Hyper-Q特性,GPU多流并发并行模型可以使数据传输与弱相关计算、弱相关计算与弱相关计算之间达到重叠,从而进一步提高算法并行度及GPU资源利用率。文中首先通过GPU多线程并行模型对NDVI提取算法进行优化,并对优化后的计算过程进行分解,找出包含数据传输及弱相关性计算的部分;其次,对数据传输和弱相关计算部分进行重构,并利用GPU多流并发并行模型进行优化,使弱相关计算之间、弱相关计算和数据传输之间达到重叠的效果;最后,以高分一号卫星拍摄的遥感影像作为实验数据,对两种基于GPU实现的NDVI提取算法进行实验验证。实验结果表明,与传统基于GPU多线程并行模型的NDVI提取算法相比,所提算法在影像大于12000*12000像素时平均取得了约1.5倍的加速,与串行提取算法相比取得了约260倍的加速,具有更好的加速效果和并行性。  相似文献   

14.
A parallel algorithm for syntactic image segmentation is introduced. Stochastic tree grammar is used as a context-generating model. It is shown that when this context-generating process is in the equilibrium state, a matched filter can be designed and applied in parallel to the image. This process can be used for image segmentation in a syntactic pattern recognition system to enhance the performance of the succeeding recognition process.  相似文献   

15.
针对深度学习图像分类场景中多GPU并行后传输效率低的问题,提出一种低时间复杂度的Ring All Reduce改进算法。通过分节点间隔配对原则优化数据传输流程,缓解传统参数服务器并行结构的带宽损耗。基于数据并行难以支撑大规模网络参数及加速延缓的问题,根据深度学习主干网络所包含的权重参数低于全连接层权重参数、同步开销小、全连接层权重大与梯度传输开销过高等特点,提出GPU混合并行优化算法,将主干网络进行数据并行,全连接层进行模型并行,并通过改进的Ring All Reduce算法实现各节点之间的并行后数据通信,用于基于深度学习模型的图像分类。在Cifar10和mini ImageNet两个公共数据集上的实验结果表明,该算法在保持分类精度不变的情况下可以获得更好的加速效果,相比数据并行方法,可达到近45%的提升效果。  相似文献   

16.
空间数据特别是遥感影像数据的快速增加和应用需求的扩大,其组织效率和处理速度已经成为制约技术应用的瓶颈,地球剖分理论和高性能计算为上述问题解决提供了一种可能途径。针对上述问题,在遥感影像剖分面片数据模型的研究基础上,提出了剖分面片模板并行计算模式,设计并实现了一种面向剖分面片模板的遥感影像并行处理方法;该方法基于MPI(Message Passing Interface)与OpenMP(Open Multi-Processing)混合并行计算框架,构建算法并行处理模型,形成算法并行化类库,通过调用其内部方法实现计算任务的并行执行。通过一个遥感影像剖分化并行分割处理实例,验证了该方法的有效性。实验结果表明,该方法具有较好的分割效果和加速比,有一定的示范意义,为进一步提高遥感影像应用能力提供了借鉴。  相似文献   

17.
针对核磁共振并行成像重建提出了一种联合稀疏性模型,并与新的软阈值函数结合,将有助于提高重建图像质量。首先利用校准数据生成重建核,重建未采样数据点;然后采用联合稀疏性模型和新的软阈值函数,对各线圈图像数据进行处理;最后用改进的凸投影集算法(POCS)对压缩感知核磁共振并行成像进行重建。对于仿真图像和脑部图像,改进算法相比原算法,重建图像归一化均方根误差(nRMSE)在加速比为4时分别减少了23%和9%。实验结果表明,加速比较大时改进算法能明显提高并行成像重建图像的准确性。  相似文献   

18.
空间应用需求对遥感数据处理的时间和精度提出新的要求,为了高速、高效地解决应用需求,提出一种基于通用模型的粗粒度遥感影像并行处理算法,采用"分块驱动"和"影像处理链驱动"两种策略进行遥感影像的并行算法设计,并对其进行MPI的实现。利用PCA融合算法在集群平台上进行并行性能测试,分析结果表明该算法在集群系统上获得了良好的视觉效果和近似线性的加速比,具有较好的扩展性和移植性。  相似文献   

19.
卫星遥感图像并行几何校正算法研究   总被引:7,自引:0,他引:7  
几何校正是遥感图像处理过程中的重要环节,具有计算量大、耗时长的特点,导致遥感图像处理的效率低下.该文提出一种分布存储环境下的并行几何校正算法,每个处理器通过计算本地输入子图像在目标图像中的范围,确定其需要进行重采样计算的区域,使计算过程中所需的数据均为本地数据,很好地解决了数据局部性问题.文章利用首尾相连的闭线段近似表示理想的输出图像块边界这一思想,详细讨论了局部输出区域的计算方法,并采用一种新的存储结构用于保存校正后的输出图像块信息.在机群系统上对算法进行实现,结果表明该算法具有良好的并行性能.  相似文献   

20.
特征点检测被广泛应用于目标识别、跟踪及三维重建等领域。针对三维重建算法中特征点检测算法运算量大、耗时多的特点,对高斯差分(Difference-of-Gaussian,DoG)算法进行改进,提出特征点检测DoG并行算法。基于OpenMP的多核CPU、CUDA及OpenCL架构的GPU并行环境,设计实现DoG特征点检测并行算法。对hallFeng图像集在不同实验平台进行对比实验,实验结果表明,基于OpenMP的多核CPU的并行算法表现出良好的多核可扩展性,基于CUDA及OpenCL架构的GPU并行算法可获得较高加速比,最高加速比可达96.79,具有显著的加速效果,且具有良好的数据和平台可扩展性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号