首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
针对在大规模矢量场中复杂几何曲面流线生成难的问题,设计实现了一种高精度的复杂曲面流线可视分析方法。首先,基于拓扑二维曲面结构进行求交计算,并引入高精度插值算法实现几何曲面矢量场并行抽取操作;然后,采用改进型龙格-库塔矢量场流线积分扩展技术进行积分计算,并引入自适应积分步长策略和流线-曲面求交加速结构,生成连续一致的曲面流线;最后,引入小球特征到可视化管线流程中,并集成于通用可视分析平台。实验结果表明,该方法能够高精度地生成连续一致的几何曲面流线,有效刻画复杂装置表面流场物理特性。  相似文献   

2.
流线的生成是流场可视化研究中的重要问题,也是流带、流管及流面等可视化显示方法实现的基础。经典的流线生成方法大多过于复杂。文中提出一种简化的流线生成方法,将流体质点的运动在单元网格内进行分解,通过判别条件判别流体质点流出的面,通过相邻单元之间的连接关系跟踪流线的轨迹。结合大型泵站流道CFD计算结果,对文中流线生成模型加以验证,其可视化效果良好。  相似文献   

3.
对于高性能并行计算机而言,如何由给出的计算、数据划分信息及精确数组数据流分析信息自动生成并行化代码是实现串行程序并行化的一个重要问题。根据Saman P.Amarasinghe和Lam的定理,实现了一种并行化识别工具中MPI(Message Passing Interface)并行化代码自动生成技术的算法,并对该算法的性能进行分析。  相似文献   

4.
由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(HPC)集群的主流加速器。随着处理单元的发展和集群节点的拓展,GPU集群不仅在节点层面呈现异构化,节点内也趋于异构化,大大提高了在GPU集群中编程的复杂度。主流GPU异构集群系统大多采用针对GPU的异构计算编程模型与面向分布式内存的消息传递模型的简单结合方式,这种方式使得GPU集群程序设计缺乏确定的准则,往往是低效而且易错的。为了提高在GPU集群中编程的效率,降低编程复杂度,以及实现平台无关性,提出一套异构GPU集群的并行分布式编程的解决方案。该方案通过采用扩展语言方法提出了编程框架DISPAR,并实现了预处理器系统StreamCC。实验证明了其可行性。  相似文献   

5.
流场类问题并行化中数组共享变量的自动搜索   总被引:3,自引:0,他引:3  
肖骊  康继昌 《软件学报》1997,8(11):871-874
本文的目的是解决流场类问题的自动并行化.首先将流场数据均匀划分,并以SPMD模式对流场计算串行程序进行并行化;引入数组共享变量,着重讨论一种新方法──用递归函数实现数组共享变量的自动搜索.用本文方法的并行化工具已初步实现.  相似文献   

6.
由于个人机和工作站良好的性价比以及网络速度的加快,利用机群系统进行高性能计算成为一个热点。在这种异构计算环境中,了解负载信息的变化对于实现负载平衡是必不可少的。该文提出了基于移动代理进行负载监控,为实现异构计算环境中分布并行应用的负载平衡提供了重要信息。这种模式具有良好的移植性、可扩展性、灵活性。  相似文献   

7.
高效准确的流线绘制一直是流场可视化的重要研究内容,流线可以对流场的重要特征进行有效的稀疏表示,但流线需要长期的粒子追踪过程及大量的积分计算,在面向大规模流场可视化时时间效率较低,需要高性能计算设备进行辅助计算.本文通过设计一种基于深度学习的高精度流线生成算法,将初始的低精度流线快速映射为稠密的高精度流线,可以在较短的时间内快速生成可靠的流线可视化结果,并在此基础上设计了交互式实时流场可视化系统,涵盖了流场的特征检测,属性关联分析,信息论分析等,帮助用户快速了解流场数据,找到自己感兴趣的区域进行后续进一步深度分析,避免了获取过多冗余数据,同时优化了分析工作的效率,满足用户对于流场结构,特征属性等多维度进行关联分析的需求.  相似文献   

8.
一种面向异构计算的结构化并行编程框架   总被引:1,自引:0,他引:1  
随着人工智能时代的到来,异构计算在深度学习、科学计算等领域发挥着越来越重要的作用。目前异构计算系统在应用上的瓶颈之一在于缺少高效的软件开发框架,已有的OpenCL、CUDA等支持GPU、DSP及FPGA的编程框架基于C/C++语言和传统的并行编程方法,导致软件开发效率较低,软件推理和调试困难,难以灵活处理计算设备之间的协作和调度。提出一种面向异构计算平台的基于脚本语言的结构化并行编程框架,提供结构化的并行编程接口,支持计算任务到异构计算设备的映射,便于并行程序的推理和验证。设计并实现了基于遗传算法的结构化调度算法,充分利用异构计算系统的计算能力,提高了异构计算系统的软件开发效率。实验结果表明,提出的编程框架在CPU+GPU平台上实现了相对于单处理器1.5到2.5倍的加速比。  相似文献   

9.
线云定位方法能保护场景隐私,但也存在被隐私攻击算法破解的风险。该攻击算法能从线云恢复近似点云,但其计算效率较低。针对该问题,提出了一种并行优化算法,并对其运行时间和加速比进行了分析。具体来说,分别采用SPMD模式和流水线模式实现了CPU多核并行和GPGPU并行。然后,进一步结合数据并行模式实现了异构计算,以达到最高的并行度。实验结果表明,并行优化算法加速比最大为15.11,最小为8.20;相比原算法,并行优化算法的还原点云相对误差控制在原误差的0.4%以内,保证了算法的精度。该研究对线云隐私攻击算法以及其他密度估计问题、不同场景下的线云隐私保护算法等有重要意义和参考价值。  相似文献   

10.
矢量场可视化线积分卷积方法研究与系统设计   总被引:1,自引:0,他引:1  
随着矢量场数据规模的增加,不论是采用流线还是基于LIC技术绘制流场,其绘制速度都是评价其性能的重要指标,此外由于流线数量增加,流线会在临界点附近产生长流线汇聚问题,导致视觉混乱,冗余计算过多等问题。为了解决上述问题,提出了改进的平坦种子生成策略和FSeedLIC算法,设计并实现了矢量场可视化系统。通过实验表明采用改进的平坦种子生成策略的流线生成算法其加速效果平均能达到70%,产生的流线更加均匀,解决了长流线在密集区域汇聚的问题;FSeedLIC算法相对LIC算法在得到相同的可视化效果的条件下,其加速比平均在60%以上。  相似文献   

11.
大尺度、高分辨率数字地形数据应用需求的增长,给计算密集型的累积汇流等数字地形分析算法带来了新的挑战。针对CPU/GPU(Graphics Processing Unit)异构计算平台的特点,提出了一种基于OpenCL(Open Computing Language)的多流向累积汇流算法的并行化策略,具有更好的平台独立性和可移植性,简化了CPU/GPU异构平台下的并行应用程序设计。累积汇流并行算法包括时空独立型的流量分配和空间依赖型的累积入流两个过程,均定义为OpenCL内核并交由OpenCL设备并行执行,其中累积入流过程借助流量转移矩阵由递归式转换为迭代式来实现并行计算。与基于流量转移矩阵的并行汇流算法相比,尽管基于单元入度矩阵的并行汇流算法可以降低迭代过程中的计算冗余,但需要采用具有较大延迟的原子操作以及需要更多的迭代次数,在有限的GPU计算资源下,两种算法性能差异不明显。实验结果表明,并行累积汇流算法在NVIDIA GeForce GT 650M GPU上获得了较好的加速比,加速性能随格网尺度增加而有所增加,其中流量分配获得了约50~70倍的加速比,累积入流获得了10~20倍的加速比,展示了利用OpenCL在GPU等并行计算设备上进行大规模数字地形分析的潜在优势。  相似文献   

12.
光流法是计算机视觉中的一个基础性算法,可广泛应用于运动检测、运动估计、视频分析等领域。但高质量光流法最大的问题是计算复杂、速度慢,限制了它在实际系统中的应用。针对一种混合亮度和梯度模型的高质量光流法,为其设计了一种高效、可扩展的并行计算方法。通过在具有代表性的网络众核架构-Tilera上进行验证,对于分辨率为640×480的图片,提出的并行计算方法在具有36核的Tilera处理器上执行时间为0.80秒,比主频3.40 GHz的CPU i3-3240快2.56倍,但功耗不到其1/6。当用于嵌入式环境时,其速度比ARM9处理器快33倍,而功耗只有它的一半。实验表明该并行算法具有良好的扩展性,可通过选择不同核数的处理器满足系统对性能、功耗的综合需求。  相似文献   

13.
本文基于网格区域剖分,提出了一种新的非结构网格粒子输运Sn并行算法,实现了多个角方向和多个能群的同时计算,在计算的过程中不用进行优先级计算和优先级队列维护,只需要按照计算队列的次序组织并行计算。综合考虑所有方向和所有网格点的数据依赖关系,结合B-level优先级,提出了一种优先级计算方法,优先计算需要数据发送的任务,延迟需要接收数据的任务,达到减少处理器等待时间和计算与通信重叠的目的。使用本文的Sn并行算法和优先级队列针对二维粒子输运问题进行的数值实验表明,并行算法具有良好的并行计算加速效果,扩展到1 024个处理机时,相对64个处理机的并行效率达到52%。  相似文献   

14.
刘智翔  宋安平  徐磊  郑汉垣  张武 《计算机应用》2014,34(11):3065-3068
针对复杂流动数值模拟中的格子Boltzmann方法存在计算网格量大、收敛速度慢的缺点,提出了基于三维几何边界的多重笛卡儿网格并行生成算法,并基于该网格生成方法提出了多重网格并行格子Boltzmann方法(LBM)。该方法结合不同尺度网格间的耦合计算,有效减少了计算网格量,提高了收敛速度;而且测试结果也表明该并行算法具有良好的可扩展性。  相似文献   

15.
网络计算环境下并行算法及其可扩放性分析   总被引:4,自引:2,他引:4  
并行算法的可扩放性是提其有效利用计算节点的能力,它可以预测算法在处理机数目变化时的性能,在网络环境下用PVM实现了并行矩阵乘法及PSRS算法,分析了在网络计算环境下这两个算法的可扩放性,并利用试验数据进行了验证。  相似文献   

16.
由于线性规划在理论和实践中的重要性,对求解大规模规划问题并行算法的研究已引起许多学者的兴趣.本文根据Galperin提出的线性规划的一种线性时间的立方算法特别适合并行的特点,提出了一种基于SPMD模型和主从式MPI的线性规划并行算法,并对算法性能进行了深入分析,理论分析和在曙光3000上的实验结果表明:该算法具有粗粒度并行、良好的可扩展性和理想加速比模型等优点,明显优于目前为止求解同类不对称线性规划问题的其他并行算法,可用于求解此类大规模线性规划问题的高性能计算.  相似文献   

17.
基于雷达资料的外推是临近预报中重要的方法之一,随着全国气象雷达网络建设规模的不断提高以及观测资料精细化程度的提升,基于区域乃至全国雷达拼图的外推预报,每次计算都需花费大量时间,甚至滞后于每6分钟一次的资料观测频次。为解决传统外推算法运算复杂度高,实时性差的问题,运用OpenCL构建基于GPU的异构计算模型对外推算法进行并行化改进。然后逐步分析影响算法性能的瓶颈,并通过改进和测试数据比对,阐述算法优化的过程。其中,内存与线程的映射优化、合理利用局部存储器作为高速缓存以及隐藏CPU执行时间等方法不仅对本算法的执行效率带来显著提升,也可为其他基于OpenCL异构计算的优化提供参考。以AMD Graphic Core Next和Northern Islands二代GPU架构作为测试平台,并以Intel CPU并行计算作为测试参考,测试结果表明,改进后的算法在硬件同等功耗的情况下,计算性能提升15~22倍。  相似文献   

18.
随着计算机硬件性能的提高,目前在个人终端上也开始出现使用预训练机器学习模型进行推理的运用.Caffe是一款流行的深度学习框架,擅长图像分类等任务,但是在默认状态下只能单核运行,无法充分发挥异构并行计算设备的计算能力.深度学习对于计算性能的要求较高,如果能并行化以充分使用所有计算设备,就能提升计算速度和使用体验.由于CP...  相似文献   

19.
可扩展性是设计并行计算系统和并行算法所要考虑的一个重要性能指标。分析了等效率、等速度、平均延迟和等并行计算开销比几种并行系统可扩展性模型的特征,提出了一种新的更有效的可扩展性度量标准。通过实验结果分析,该模型能很好地评测并行计算系统的可扩展性。  相似文献   

20.
并行矩阵乘法是线性代数中最重要的基本运算之一,同时也是许多科学应用的基石.随着高性能计算(HPC)向E级计算发展,并行矩阵乘法的通信开销所占比重越来越大.如何降低并行矩阵乘法的通信开销,提高并行矩阵乘的可扩展性是当前研究的热点之一.本文提出一种新型的分布式并行稠密矩阵乘算法,即2.5D版本的PUMMA(Parallel...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号