共查询到20条相似文献,搜索用时 15 毫秒
1.
研究和实现高效的几何枝正并行算法,能够有效地提高遥感图像预处理的工作效率。本文首先研究了基于多项式变换的几何校正算法,然后提出了新的并行几何校正算法。该算法通过局部边界计算达到延迟通信的目的,很好地解决了计算局部性问题;在机群系统上实现后,对多幅大小不同的G比特遥感数据集进行了测试,获得了正确的结果和良好的并行性能。 相似文献
2.
为了研究GPU的通用计算能力和适合SMP集群的编程模型,首次提出MPI+CUDA多粒度混合并行编程的新方法,节点间采用MPI实现粗粒度并行,节点内采用CUDA实现细粒度并行的混合编程方式.利用此方法在搭建的3节点SMP集群环境中,测试了大规模矩阵乘问题的并行计算能力.实验结果表明,该方法能够显著提升并行效率,同时证明MPI+CUDA混合编程模型能够充分发挥SMP集群节点间分布式存储和节点内共享内存的优势,为装有CUDA-enabled GPU的SMP集群提供了一种有效的并行策略. 相似文献
3.
针对利用各向异性扩散方程的去噪模型在求解中存在计算量大、耗时长、影响实时性等缺点,本文充分利用并行知识,提出了有效的解决方案。即基于各向异性扩散去噪模型,设计工作站机群平台,对噪声图像进行条状重叠的数据划分,以便实现算法节点内与节点间的两级并行策略:在机群结点内部采用共享内存结构,机群节点间采用分布内存结构,以二者的最优结合实现并行的层次结构化,从而得到一种高效的多层次并行图像去噪算法。实验结果表明,在基于混合模型的并行环境下,该算法能在一定程度上提高原算法的计算效率,不仅有效地缩短了运行时间,而且仍能获得与其相当的图像去噪质量。 相似文献
4.
卫星遥感图像并行几何校正算法研究 总被引:7,自引:0,他引:7
几何校正是遥感图像处理过程中的重要环节,具有计算量大、耗时长的特点,导致遥感图像处理的效率低下.该文提出一种分布存储环境下的并行几何校正算法,每个处理器通过计算本地输入子图像在目标图像中的范围,确定其需要进行重采样计算的区域,使计算过程中所需的数据均为本地数据,很好地解决了数据局部性问题.文章利用首尾相连的闭线段近似表示理想的输出图像块边界这一思想,详细讨论了局部输出区域的计算方法,并采用一种新的存储结构用于保存校正后的输出图像块信息.在机群系统上对算法进行实现,结果表明该算法具有良好的并行性能. 相似文献
5.
分子动力学作为一种重要的计算手段在许多领域有着广泛的应用,由于它的计算量比较庞大,因此并行计算方法被越来越多地引入到分子动力学的模拟中。本文在目前常见的SMP集群系统上,根据系统的结构特点,针对分子动力学的三种并行算法:区域分解法、原子分解法和力分解法,利用MPI Pthread的混合编程模型,采用节点间消息传递模式以及节点内部共享存储的编程模式,实现了近程作用分子动力学的两级并行计算。计算结果表明,不同的算法采用了两级并行的方式和原来只有消息传递的并行方式相比,具有不同的计算效率,但是从总体来说采用两级并行的计算方式可以利用更多的计算资源,从而有助于提高计算能力。 相似文献
6.
《遥感信息》2016,(3)
针对多卫星多传感器系统几何校正的通用可扩展性问题,提出了一种基于设计模式的系统几何校正算法。该算法运用模板方法和简单工厂方法,解决了多卫星多传感器在系统几何校正过程中的差异性问题,实现不同卫星不同传感器的系统几何校正处理。通过规范辅助数据的输出格式解决多卫星多传感器校正参数不统一的问题;抽象出系统几何校正功能的一般执行过程,在模板方法中确定该功能的执行逻辑;运用简单工厂方法,用卫星和传感器标识作为参数,选择具体的实现算法,完成相应的处理功能。实验结果表明,该算法能够在保证定位精度的情况下实现对多卫星多传感器的校正处理,并在不改变原有代码的情况下实现对新增卫星传感器的系统几何校正功能的扩展。 相似文献
7.
8.
基于对称三对角矩阵特征求解的分而治之方法,提出了一种改进的使用MPI/Cilk模型求解的混合并行实现,结合节点间数据并行和节点内多任务并行,实现了对分治算法中分治阶段和合并阶段的多任务划分和动态调度.节点内利用Cilk任务并行模型解决了线程级并行的数据依赖和饥饿等待等问题,提高了并行性;节点间通过改进合并过程中的通信流程,使组内进程间只进行互补的数据交换,降低了通信开销.数值实验体现了该混合并行算法在计算效率和扩展性方面的优势. 相似文献
9.
基于半经典分子动力学模型,在SMP集群中实现激光化学反应双层并行模拟系统。结合粗粒度的原子分解算法和细粒度的矩阵并行乘法实现激光化学反应模拟中力计算部分的并行化,分析粒度划分对半经典分子动力学模拟并行效率的影响。在SMP集群中测试表明,采用128个处理器模拟由500个C原子构成的分子体系,并行效率可达70%。在CPU数量固定的情况下,SMP节点内的细粒度的并行对提高半经典分子动力学模拟并行效率影响较大。该系统能够模拟大分子体系的激光化学反应,在提高加速比的同时保证计算资源的利用效率,满足激光化学反应模拟需求。 相似文献
10.
为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点内采用TBB及临界区技术实施线程级并行。在SMP集群中的测试表明,该方法在体系较大以及节点数较多时可以明显减少通信时间,使加速比在纯MPI模型上提高45%。结果表明,MPI+TBB混合并行编程模型可促进分子动力学并行模拟且效率明显提升。 相似文献
11.
12.
多核集群的层次化并行编程模型一直是高性能计算的研究热点。以SMP集群为例,从硬件上可分为节点间和节点内的两层架构。阐述了层次化并行编程的实现技术,针对N体问题算法进行了基于Hybrid并行编程模型的并行化研究。提出了一种块同步MPI/OpenMP细粒度N体问题的优化算法。基于曙光TC5000A集群,将该算法与传统的N体并行算法进行了执行时间与加速比的比较,得出了几句总结性具体论述。 相似文献
13.
14.
针对小卫星独立相机多光谱成像系统波段间配准的非线性误差问题,提出了一种多光谱图像波段间自动配准算法,该算法综合利用互信息、遗传算法和MQ几何校正模型进行多光谱图像的自动配准。在算法中,以互信息作为配准的相似性度量,获得了很高的配准精度;利用遗传算法的快速搜索特性,可以较快的完成搜索并获得整体的最优解;利用MQ几何模型可以精确的建立图像之间的几何关系。试验表明该算法对于多光谱图像波段间非线性几何关系,能够取得非常高的波段间自动配准精度,整体配准误差在一个像元以内。 相似文献
15.
提出一种支持权重分布数据的可伸缩分布式动态区间映射算法.该算法能够在存储节点发生变化时,根据可用的资源情况立即重新均衡数据对象分布,从所有存储节点中并行迁移数据对象,且迁移的数据对象数目是最少的.在此基础上提出分布式节点地址计算算法,支持计算节点通过视图校正算法自主学习,自动适应新的系统规模,消除了现有的集中式访问性能瓶颈,使系统具有高可伸缩性. 相似文献
16.
采用CUDA+MPI+OpenMP的三级并行编程模式,实现节点间的粗粒度并行,节点内的细粒度并行以及将GPU作为并行计算设备的CUDA编程模型.这种新的三级并行混合编程模式为SMP机群提供了一种更为高效的并行策略.本文讨论了三级并行编程环境的快速搭建以及多粒度混合并行编程方法,并在多个节点的机群环境中完成测试工作. 相似文献
17.
基于消息传递接口(Message Passing Interface,MPI)和消息传递并行编程模型,提出了一种针对计算机集群(Cluster)的纹理图像并行分割算法。该算法使用马尔可夫随机场作为纹理特征,通过将图像分块,把特征提取的计算量均匀的分布到并行系统中的各个节点上,从而极大地减少了计算时间。在遥感图像上的实验发现,该算法在4机并行的环境下可以取得与单机串行程序一样精确的分割,而耗时仅为串行程序的31.95%。令人满意的实验结果表明该并行算法不但可以有效的应用于纹理图像分割,而且也为使用计算机集群实现高时间复杂度的图像处理提供了有益的启示。 相似文献
18.
19.
将常用于CT图像重建的滤波反投影算法程序设计成能够运行在大数据框架Spark中的并行模式,以此来提高计算效率并实现批量图像的重建,缩短图像重建时间。基于分布式计算框架Spark,利用其图像处理工具Thunder,将滤波反投影算法在图像重建过程中设计成并行程序模式,实现图像的片间并行重建。实验结果表明,随着Spark集群规模的不断扩大,在确保重建图像质量的前提下,重建一定数量的CT图像相比单机模式下时间显著缩短,并行滤波反投影算法具有完全加速比,并行效率趋近于1。基于Spark集群实现的滤波反投影算法能够显著提升CT图像重建速度,并实现大量图像并行重建,可扩展其他的CT图像重建算法,对远程医学图像重建平台的建设具有重要参考意义。 相似文献
20.
基于灰度投影的快速纸币图像几何校正 总被引:1,自引:0,他引:1
纸币图像的几何校正是纸币清分机的一项关键技术,实际应用中要求其算法简洁、快速、准确。提出了一种通过灰度投影来进行快速纸币图像几何校正的算法。首先通过计算整幅及部分纸币图像的灰度投影来得到纸币的倾斜角度,根据倾斜角度对图像进行倾斜校正;然后通过计算整幅图像的灰度投影来确定图像中纸币的边界位置,并将纸币区域分割出来。实验结果表明这种算法能够实现纸币图像的快速准确几何校正。 相似文献