首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为提高level set函数重新初始化的计算效率,基于分区并行思想,提出一种快速步进法的并行策略,实现level set函数的快速并行重新初始化。通过对圆球、五叶管和圆环管等算例的level set函数重新初始化,讨论了新并行算法的准确性和效率。结果表明,与串行快速步进法相比,并行算法保留了串行算法的精度,仍基本保持在1阶左右,同时显著减少了重新初始化的计算时间,特别在8线程条件下,所获的最佳加速比能够达到5。  相似文献   

2.
为提高level set函数快速步进重构过程的并行计算效率,本文提出一种改进的分区并行重构算法。与原有分区并行算法相比,优化了子区域间的同步方案,缩短了level set函数并行重构的计算时间。运用OpenMP多线程技术,建立了相应的并行计算模型,实现了圆球、圆环管和哑铃等值面并行重构。并行重构数值结果表明:只要子区域均分初始表面边界,level set函数全局或局部并行重构均具有良好加速比,8线程的最大加速比可接近6。  相似文献   

3.
在夏克-哈特曼波前重构方法中,为了提高波前重构的速度,解决实时性差的问题,提出了一种基于GPU的快速夏克-哈特曼波前重构方法:将Zernike模式波前重构算法中Zernike多项式系数和波前数据的矩阵求解部分按照棋盘式和带状式分解并行化,根据不同的分解并行模式调度线程块及线程块中的线程数,转存数据到共享内存提高数据访问效率,优化数据存储结构提高全局存储器访问带宽,多个线程并发执行,快速重构波前。实验表明:基于GPU的快速算法相比传统CPU方式具有明显加速效果,当波前插值分辨率为2048*2048时,速度甚至提高了206倍;在加速的同时仍可保持原有算法的高准确度,为高精度、高分辨率的波前重构提供了快速、实时的计算方法。  相似文献   

4.
针对图像增强通常需要较大的计算量、用传统方法难于进行实时处理的问题,提出了一种基于图形处理器加速的Wallis变换影像增强方法.借助于图形处理器较强的运算能力,利用CUDA并行计算架构在PC机上实现了快速Wallis图像滤波算法,包括图形处理器(GPU)上任务分解、大规模计算核心的分解方法,结合使用共享存储器、全局存储器对算法进行加速,使用线程块内的共享存储器较好地解决了同一计算子空间的各线程同步问题.对比了CPU和GPU计算Wallis影像变换的时间,结果表明,随着图像分辨率的增大,Wallis并行算法可以把计算速度提高40倍.该方法具有较好的实时性,可大大提高图像增强过程的处理速度,显著地减少了计算时间.  相似文献   

5.
图形处理器(Graphic Processing Unit, GPU)作为主流高性能计算的加速设备,已越来越多地应用于诸多领域的并行计算中,利用GPU的并行计算能力,可以极大地提高传统算法的计算效率。文章主要研究GPU多线程计算方法与统一计算架构(Compute Unified Device Architecture, CUDA)技术在实景三维模型裁剪中的应用,提出了一种基于GPU的实景三维模型裁剪算法,包括设计了基于面拓扑的多级索引结构,以实现线程内重复交点快速查找;提出了一种轻量多边形三角化方法,优化算法流程;使用多种优化策略,在不影响裁剪网格质量的情况下进一步提高算法的性能。结果表明:根据模型大小与裁剪次数的不同,相较于传统算法,所提方法在单次裁剪的情况下加速比可达13.93,在多次裁剪的情况下加速比可达35.85,显著地提高了模型的裁剪效率。  相似文献   

6.
随着GPU等加速部件在超级计算领域的广泛应用,超级计算机单个节点的硬件并行度比单核时代高几倍甚至几十倍。在该环境下,并行应用于单个芯片、计算节点内和计算节点间的通信密度较单核时代急剧增加,通信瓶颈问题愈发突出。为应对高并行度带来的通信瓶颈问题,提出一种同步引擎的硬件设计,该同步引擎可有效地支持和加速计算节点内多任务间频繁小数据量传输(细粒度同步)以及计算节点内和节点间的Barrier、All-reduce集合操作,进而加速并行应用的性能。测试结果表明,在16进程规模下的集合操作测试中,同步引擎相比传统的软件实现有约4倍的加速,在三角矩阵分解(LU分解)测试程序中可以获得约20%的性能提升。  相似文献   

7.
中期冲突探测(MTCD)是空中交通管制的重要决策支持工具。针对Prandini概率型中期冲突探测算法存在计算速度慢、探测精度不够高的缺点,提出基于GPU CUDA的加速算法。利用CUDA线程并行处理能力和GPU的计算能力,对算法进行了重新设计与优化。通过仿真实验,证明了在NVIDIA Geforce 8800GTS显卡上可得到50倍以上的加速性能,可以满足大型空管自动化系统20 min内中期冲突探测的实时性和精度要求。  相似文献   

8.
改进形态学中的膨胀与腐蚀算法,以求在数据增多情形下提高其运算速度。将处理前一像素的运算结果,引入后一像素的处理过程,以减少相邻像素重复区域的计算量;利用图形处理器的分层存储机制,优化数据在其中的存储结构,以提高访存速度;采用线程并行处理方式,在统一计算设备架构平台上,实现形态学膨胀与腐蚀算法的并行化。实验结果表明,随着图像尺寸和结构元素尺寸的增大,改进算法实现加速效果显著,其加速比高于调用NPP库和MATLAB库函数实现的加速比。  相似文献   

9.
电信社群网络中介度的网格并行算法及调度算法   总被引:1,自引:0,他引:1  
为了解决电信社群网络中介度(图的一个几何量)计算中的海量计算问题,研究并实现了高性能网格并行计算方法。该算法采用层次性的二分法分割数据,能在较短的时间内完成大规模社群网络图的各个顶点中介度计算。为了提高计算的加速比,还提出了一种改进的网格并行调度算法,采用动静态结合的方法来平衡负载。论证表明,改进算法的加速比、并行效率和平衡度都有提高,计算用时与网格上并行计算处理器数目成近似线形关系。  相似文献   

10.
为了解决电信社群网络中介度(图的一个几何量)计算中的海量计算问题,研究并实现了高性能网格并行计算方法。该算法采用层次性的二分法分割数据,能在较短的时间内完成大规模社群网络图的各个顶点中介度计算。为了提高计算的加速比,还提出了一种改进的网格并行调度算法,采用动静态结合的方法来平衡负载。论证表明,改进算法的加速比、并行效率和平衡度都有提高,计算用时与网格上并行计算处理器数目成近似线形关系。  相似文献   

11.
模糊偏最小二乘及其在药物构效关系中的应用   总被引:3,自引:1,他引:3  
针对高维变量系统的模糊建模易引起规则“组合爆炸”,以及变量间的耦合关系会导致模型泛化能力的减弱, 提出构建模糊偏最小二乘法(FPLS)的一种新方案.先采用非线性迭代偏最小二乘(nonlinear iterative partial least squares, NIPALS)方法从样本数据中成对地提取最优成分,使多变量系统降维,并消除其间的耦合关系;然后对提取的每 对成分采用TSK模糊系统及自适应学习算法,实现单输入单输出的非线性建模,并组合为FPLS模型.将FPLS法应用于人类 免疫缺陷病毒1型蛋白酶抑制剂构效关系,所需规则甚少,所建模型有较强的泛化能力和稳定性,显示出FPLS方法的优越 性.  相似文献   

12.
一种基于网络数学分割的分解协调潮流并行算法   总被引:1,自引:0,他引:1  
研究了PC机群计算环境下的电力系统潮流计算模型,结合基于节点分割的网络分块方法和PC机群环境的特性,提出了一种基于网络数学分割的电力系统潮流分解协调算法,将大规模互联电力系统分解成若干子网络,通过分配于各个PC机的各个子网络之间的分解协调计算,获取加速比。利用该算法对IEEE标准系统进行了潮流计算测试,结果表明,该算法具有较高的加速度和计算精度,适合在网络计算环境中实现。  相似文献   

13.
为解决当前原型学习算法在大规模、大类别机器学习和模式识别领域的计算密集瓶颈问题,提出一种采用GPU和CPU异构并行计算架构的可扩展原型学习算法框架.一是通过分解和重组算法的计算任务,将密集的计算负载转移到GPU上,而CPU只需进行少量的流程控制.二是根据任务类型自适应地决定是采用分块策略还是并行归约策略来实现.采用大规模手写汉字样本库验证本框架,在消费级显卡GTX680上使用小批量处理模式进行模型学习时,最高可得到194倍的加速比,升级到GTX980显卡,加速比可提升到638倍;算法甚至在更难以加速的随机梯度下降模式下,也至少能获得30倍的加速比.该算法框架在保证识别精度的前提下具有很高的可扩展性,能够有效解决原有原型学习的计算瓶颈问题.  相似文献   

14.
在时变加速因子的自组织粒子群算法、中值粒子群算法、混沌粒子群算法的基础上,提出了一种新的混合粒子群优化算法( MPSO),并利用这种新的算法来训练径向基函数(RBF)神经网络的参数(连接权、隐节点中心和宽度),验证了所提方法的有效性.进一步,提出了基于神经网络的非线性系统直接预测控制方案,实现非线性系统的实时控制.通过...  相似文献   

15.
粒子群算法在新安江模型参数优选中的应用   总被引:10,自引:0,他引:10  
对粒子群算法进行了详细描述和分析,并将其应用于新安江模型的参数优选中.对于人工生成的理想水文资料,采用粒子群算法优化新安江模型,可以使全部参数收敛到真值;对于实测的水文资料,通过与单纯形混合加速遗传算法(SAGA)和单纯多边形进化算法(SCE-UA)进行比较,可以看出,粒子群算法全局收敛性能较好,计算效率和精度较高,是一种有效的新安江模型参数优选方法.  相似文献   

16.
改进SMAC(Simplified Marker and Cell)算法,增强其对流体模拟的实时处理能力。采用点差分格式对求解压力场和速度更新的偏微分方程进行离散化;引入消除数据相关性的存储算法以减少数据传输,并借助分层存储机制提高访存比,采用并行归约增加线程并行度;在统一计算设备架构平台下,对离散化的SMAC算法进行改进、优化及并行化实现。纯粹计算及多次迭代模拟实验结果显示,改进算法提速明显,可实现对一般场景的实时模拟。  相似文献   

17.
为了提高图像对比度, 解决传统的直方图均衡算法处理速度慢的问题, 提出了基于统一计算设备架构(CUDA)的直方图均衡图像实时处理加速方案。利用图形处理器(GPU)强大的计算能力和CUDA 优化的存储器结构, 以加速直方图均衡中的图像灰度级投票、 分布概率累加并映射以及图像新的灰度值填充等功能进行运算。在CUDA 条件下, 对直方图均衡算法进行串-并行分析, 分别从粗粒度与细粒度角度进行并行设计, 通过实验测定进行了设计参数寻优, 获得了线程块设计参数的最优尺寸。结果表明, 基于CUDA的图像直方图均衡并行算法的性能相比基于CPU 的串行算法和基于开放多处理(OpenMP)并行算法分别获得了61. 58 和32. 00 倍的加速比, 能够为大规模实时性图像处理系统设计提供参考。  相似文献   

18.
基于正交Haar变换(orthogonal Haar transform,OHT)的模板匹配算法在处理二维图像时采用条形和来替代积分图,从而获得了较高的运行效率,但它要求模板必须是标准大小的,即模板的高和宽必须相等且为2的幂次.为解决OHT算法的这一问题,提出了另一种基于拟Haar变换(quasi Haar transform,QHT)的模板匹配算法,它使用树分解策略来加速非标准模板时的匹配处理.QHT算法不仅能处理非标准模板的情况,也同样能处理标准模板的情况.在标准模板情况下,实验结果表明,QHT算法在低噪声等级时比OHT算法拥有更快的运行速度.  相似文献   

19.
针对枚举排序算法在处理大规模数据时存在运算量大、计算时间长、计算效率低等问题,提出一种利用GPU并行运算提升大规模数据处理速度的方法。在CUDA下对枚举排序算法进行串-并行分析,分别从细粒度与粗粒度角度进行优化,根据CPU与GPU的结构特点优化排序数据的读取和存储方式,内核采用一个GPU线程对应一次比较操作的计算方法,以充分利用GPU计算能力。实验结果表明,当排序数据规模大于40 000时,在GPU上的运算速度比在CPU上快3倍左右,并且随着数据规模的不断增大,加速比越来越大。研究结果对于提升大规模数值计算效率具有重要的意义。  相似文献   

20.
确定无线传感器网络(WSN)中节点的位置是网络初始化阶段首要任务之一,杂交PSO定位算法(Hybrid Particle Swarm Optimization,HPSO)可以通过父代粒子杂交产生性能较好的子代粒子,加速收敛,其定位精度明显优于其他PSO算法,因而成为近年来研究的热点之一。然而,杂交PSO定位算法存在计算量大、定位时间长等问题,针对这些问题,提出一种改进杂交PSO定位算法(Improved Hybrid PSO,IHPSO),在交叉和变异过程中引入粒子集中度和粒子平稳度两个概念,并加入选择机制和排队机制,加快算法的收敛度,同时有效地提高算法的定位精度和定位时间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号