期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《哈尔滨工程大学学报》2016,(5)

为提高level set函数重新初始化的计算效率,基于分区并行思想,提出一种快速步进法的并行策略,实现level set函数的快速并行重新初始化。通过对圆球、五叶管和圆环管等算例的level set函数重新初始化,讨论了新并行算法的准确性和效率。结果表明,与串行快速步进法相比,并行算法保留了串行算法的精度,仍基本保持在1阶左右,同时显著减少了重新初始化的计算时间,特别在8线程条件下,所获的最佳加速比能够达到5。相似文献

2.

Level set函数快速步进重构并行算法的改进

《哈尔滨工程大学学报》2017,(6)

为提高level set函数快速步进重构过程的并行计算效率,本文提出一种改进的分区并行重构算法。与原有分区并行算法相比,优化了子区域间的同步方案,缩短了level set函数并行重构的计算时间。运用OpenMP多线程技术,建立了相应的并行计算模型,实现了圆球、圆环管和哑铃等值面并行重构。并行重构数值结果表明:只要子区域均分初始表面边界,level set函数全局或局部并行重构均具有良好加速比,8线程的最大加速比可接近6。相似文献

3.

基于GPU的快速夏克-哈特曼波前重构方法研究

卫培霞景文博刘学王晓曼朱海忱《长春理工大学学报(自然科学版)》2016,(1):66-70

在夏克-哈特曼波前重构方法中,为了提高波前重构的速度,解决实时性差的问题,提出了一种基于GPU的快速夏克-哈特曼波前重构方法：将Zernike模式波前重构算法中Zernike多项式系数和波前数据的矩阵求解部分按照棋盘式和带状式分解并行化,根据不同的分解并行模式调度线程块及线程块中的线程数,转存数据到共享内存提高数据访问效率,优化数据存储结构提高全局存储器访问带宽,多个线程并发执行,快速重构波前。实验表明：基于GPU的快速算法相比传统CPU方式具有明显加速效果,当波前插值分辨率为2048*2048时,速度甚至提高了206倍;在加速的同时仍可保持原有算法的高准确度,为高精度、高分辨率的波前重构提供了快速、实时的计算方法。相似文献

4.

CUDA架构下的快速Wallis影像增强算法

肖汉吴庆双冯娜《沈阳工业大学学报》2011,33(3):293-298

针对图像增强通常需要较大的计算量、用传统方法难于进行实时处理的问题,提出了一种基于图形处理器加速的Wallis变换影像增强方法.借助于图形处理器较强的运算能力,利用CUDA并行计算架构在PC机上实现了快速Wallis图像滤波算法,包括图形处理器（GPU）上任务分解、大规模计算核心的分解方法,结合使用共享存储器、全局存储器对算法进行加速,使用线程块内的共享存储器较好地解决了同一计算子空间的各线程同步问题.对比了CPU和GPU计算Wallis影像变换的时间,结果表明,随着图像分辨率的增大,Wallis并行算法可以把计算速度提高40倍.该方法具有较好的实时性,可大大提高图像增强过程的处理速度,显著地减少了计算时间. 相似文献

5.

基于GPU的实景三维模型裁剪算法研究

马东岭李铭通朱悦凯《山东建筑大学学报》2024,(1):108-116

图形处理器(Graphic Processing Unit, GPU)作为主流高性能计算的加速设备,已越来越多地应用于诸多领域的并行计算中,利用GPU的并行计算能力,可以极大地提高传统算法的计算效率。文章主要研究GPU多线程计算方法与统一计算架构(Compute Unified Device Architecture, CUDA)技术在实景三维模型裁剪中的应用,提出了一种基于GPU的实景三维模型裁剪算法,包括设计了基于面拓扑的多级索引结构,以实现线程内重复交点快速查找;提出了一种轻量多边形三角化方法,优化算法流程;使用多种优化策略,在不影响裁剪网格质量的情况下进一步提高算法的性能。结果表明：根据模型大小与裁剪次数的不同,相较于传统算法,所提方法在单次裁剪的情况下加速比可达13.93,在多次裁剪的情况下加速比可达35.85,显著地提高了模型的裁剪效率。相似文献

6.

高性能计算节点中的同步操作加速引擎设计

陈飞曹政王凯胡农达安学军《电子科技大学学报(自然科学版)》2012,41(1):92-97

随着GPU等加速部件在超级计算领域的广泛应用,超级计算机单个节点的硬件并行度比单核时代高几倍甚至几十倍。在该环境下,并行应用于单个芯片、计算节点内和计算节点间的通信密度较单核时代急剧增加,通信瓶颈问题愈发突出。为应对高并行度带来的通信瓶颈问题,提出一种同步引擎的硬件设计,该同步引擎可有效地支持和加速计算节点内多任务间频繁小数据量传输(细粒度同步)以及计算节点内和节点间的Barrier、All-reduce集合操作,进而加速并行应用的性能。测试结果表明,在16进程规模下的集合操作测试中,同步引擎相比传统的软件实现有约4倍的加速,在三角矩阵分解(LU分解)测试程序中可以获得约20%的性能提升。相似文献

7.

基于CUDA GPU的中期冲突探测加速算法研究

杨波梁海军《四川大学学报(工程科学版)》2012,44(Z1):133-137

中期冲突探测(MTCD)是空中交通管制的重要决策支持工具。针对Prandini概率型中期冲突探测算法存在计算速度慢、探测精度不够高的缺点,提出基于GPU CUDA的加速算法。利用CUDA线程并行处理能力和GPU的计算能力,对算法进行了重新设计与优化。通过仿真实验,证明了在NVIDIA Geforce 8800GTS显卡上可得到50倍以上的加速性能,可以满足大型空管自动化系统20 min内中期冲突探测的实时性和精度要求。相似文献

8.

膨胀与腐蚀算法的改进及并行实现

《西安邮电学院学报》2017,(1):88-93

改进形态学中的膨胀与腐蚀算法,以求在数据增多情形下提高其运算速度。将处理前一像素的运算结果,引入后一像素的处理过程,以减少相邻像素重复区域的计算量;利用图形处理器的分层存储机制,优化数据在其中的存储结构,以提高访存速度;采用线程并行处理方式,在统一计算设备架构平台上,实现形态学膨胀与腐蚀算法的并行化。实验结果表明,随着图像尺寸和结构元素尺寸的增大,改进算法实现加速效果显著,其加速比高于调用NPP库和MATLAB库函数实现的加速比。相似文献

9.

电信社群网络中介度的网格并行算法及调度算法 总被引：1，自引：0，他引：1

陈平王柏徐六通吴斌王艳辉《北京邮电大学学报》2006,29(Z1):77-81

为了解决电信社群网络中介度(图的一个几何量)计算中的海量计算问题，研究并实现了高性能网格并行计算方法。该算法采用层次性的二分法分割数据，能在较短的时间内完成大规模社群网络图的各个顶点中介度计算。为了提高计算的加速比，还提出了一种改进的网格并行调度算法，采用动静态结合的方法来平衡负载。论证表明，改进算法的加速比、并行效率和平衡度都有提高，计算用时与网格上并行计算处理器数目成近似线形关系。相似文献

10.

电信社群网络中介度的网格并行算法及调度算法

陈平王柏徐六通吴斌王艳辉《北京邮电大学学报》2006,29(21):77-81

为了解决电信社群网络中介度(图的一个几何量)计算中的海量计算问题，研究并实现了高性能网格并行计算方法。该算法采用层次性的二分法分割数据，能在较短的时间内完成大规模社群网络图的各个顶点中介度计算。为了提高计算的加速比，还提出了一种改进的网格并行调度算法，采用动静态结合的方法来平衡负载。论证表明，改进算法的加速比、并行效率和平衡度都有提高，计算用时与网格上并行计算处理器数目成近似线形关系。相似文献

11.

模糊偏最小二乘及其在药物构效关系中的应用 总被引：3，自引：1，他引：3

成忠陈德钊《浙江大学学报(工学版)》2005,39(10):1613-1617

针对高维变量系统的模糊建模易引起规则“组合爆炸”，以及变量间的耦合关系会导致模型泛化能力的减弱，提出构建模糊偏最小二乘法(FPLS)的一种新方案.先采用非线性迭代偏最小二乘(nonlinear iterative partial least squares, NIPALS)方法从样本数据中成对地提取最优成分，使多变量系统降维，并消除其间的耦合关系;然后对提取的每对成分采用TSK模糊系统及自适应学习算法，实现单输入单输出的非线性建模，并组合为FPLS模型.将FPLS法应用于人类免疫缺陷病毒1型蛋白酶抑制剂构效关系，所需规则甚少，所建模型有较强的泛化能力和稳定性，显示出FPLS方法的优越性. 相似文献

12.

一种基于网络数学分割的分解协调潮流并行算法 总被引：1，自引：0，他引：1

祝文彪张步涵王武宁朱永兴《黄河水利职业技术学院学报》2008,20(3):43-46

研究了PC机群计算环境下的电力系统潮流计算模型,结合基于节点分割的网络分块方法和PC机群环境的特性,提出了一种基于网络数学分割的电力系统潮流分解协调算法,将大规模互联电力系统分解成若干子网络,通过分配于各个PC机的各个子网络之间的分解协调计算,获取加速比。利用该算法对IEEE标准系统进行了潮流计算测试,结果表明,该算法具有较高的加速度和计算精度,适合在网络计算环境中实现。相似文献

13.

面向异构并行架构的大规模原型学习算法

苏统华李松泽邓胜春于洋白薇《哈尔滨工业大学学报》2016,48(11):53-60

为解决当前原型学习算法在大规模、大类别机器学习和模式识别领域的计算密集瓶颈问题,提出一种采用GPU和CPU异构并行计算架构的可扩展原型学习算法框架.一是通过分解和重组算法的计算任务,将密集的计算负载转移到GPU上,而CPU只需进行少量的流程控制.二是根据任务类型自适应地决定是采用分块策略还是并行归约策略来实现.采用大规模手写汉字样本库验证本框架,在消费级显卡GTX680上使用小批量处理模式进行模型学习时,最高可得到194倍的加速比,升级到GTX980显卡,加速比可提升到638倍;算法甚至在更难以加速的随机梯度下降模式下,也至少能获得30倍的加速比.该算法框架在保证识别精度的前提下具有很高的可扩展性,能够有效解决原有原型学习的计算瓶颈问题. 相似文献

14.

混合粒子群优化算法及其在预测控制中的应用

张燕张佳会邓嫔杨鹏《河北工业大学学报》2011,40(4):13-16

在时变加速因子的自组织粒子群算法、中值粒子群算法、混沌粒子群算法的基础上,提出了一种新的混合粒子群优化算法( MPSO),并利用这种新的算法来训练径向基函数(RBF)神经网络的参数(连接权、隐节点中心和宽度),验证了所提方法的有效性.进一步,提出了基于神经网络的非线性系统直接预测控制方案,实现非线性系统的实时控制.通过... 相似文献

15.

粒子群算法在新安江模型参数优选中的应用 总被引：10，自引：0，他引：10

江燕胡铁松桂发亮武夏宁曾志炫《武汉大学学报(工学版)》2006,39(4):14-17,24

对粒子群算法进行了详细描述和分析,并将其应用于新安江模型的参数优选中.对于人工生成的理想水文资料,采用粒子群算法优化新安江模型,可以使全部参数收敛到真值;对于实测的水文资料,通过与单纯形混合加速遗传算法(SAGA)和单纯多边形进化算法(SCE-UA)进行比较,可以看出,粒子群算法全局收敛性能较好,计算效率和精度较高,是一种有效的新安江模型参数优选方法. 相似文献

16.

基于CUDA的SMAC算法并行化

《西安邮电学院学报》2016,(5):33-38

改进SMAC(Simplified Marker and Cell)算法,增强其对流体模拟的实时处理能力。采用点差分格式对求解压力场和速度更新的偏微分方程进行离散化;引入消除数据相关性的存储算法以减少数据传输,并借助分层存储机制提高访存比,采用并行归约增加线程并行度;在统一计算设备架构平台下,对离散化的SMAC算法进行改进、优化及并行化实现。纯粹计算及多次迭代模拟实验结果显示,改进算法提速明显,可实现对一般场景的实时模拟。相似文献

17.

基于CUDA架构下的直方图均衡并行算法

肖汉肖诗洋孙陆鹏郭宝《桂林理工大学学报》2021,41(3):654-663

为了提高图像对比度, 解决传统的直方图均衡算法处理速度慢的问题, 提出了基于统一计算设备架构(CUDA)的直方图均衡图像实时处理加速方案。利用图形处理器(GPU)强大的计算能力和CUDA 优化的存储器结构, 以加速直方图均衡中的图像灰度级投票、分布概率累加并映射以及图像新的灰度值填充等功能进行运算。在CUDA 条件下, 对直方图均衡算法进行串-并行分析, 分别从粗粒度与细粒度角度进行并行设计, 通过实验测定进行了设计参数寻优, 获得了线程块设计参数的最优尺寸。结果表明, 基于CUDA的图像直方图均衡并行算法的性能相比基于CPU 的串行算法和基于开放多处理(OpenMP)并行算法分别获得了61. 58 和32. 00 倍的加速比, 能够为大规模实时性图像处理系统设计提供参考。相似文献

18.

基于拟Haar变换的模板匹配算法

李厚君李玉鑑谢欢曦《北京工业大学学报》2014,40(2):278-284

基于正交Haar变换(orthogonal Haar transform,OHT)的模板匹配算法在处理二维图像时采用条形和来替代积分图,从而获得了较高的运行效率,但它要求模板必须是标准大小的,即模板的高和宽必须相等且为2的幂次.为解决OHT算法的这一问题,提出了另一种基于拟Haar变换(quasi Haar transform,QHT)的模板匹配算法,它使用树分解策略来加速非标准模板时的匹配处理.QHT算法不仅能处理非标准模板的情况,也同样能处理标准模板的情况.在标准模板情况下,实验结果表明,QHT算法在低噪声等级时比OHT算法拥有更快的运行速度. 相似文献

19.

一种基于GPU的枚举排序算法及其并行化

谷国太孙陆鹏张红艳肖汉《河南理工大学学报(自然科学版)》2020,39(6):139-143,158

针对枚举排序算法在处理大规模数据时存在运算量大、计算时间长、计算效率低等问题,提出一种利用GPU并行运算提升大规模数据处理速度的方法。在CUDA下对枚举排序算法进行串-并行分析,分别从细粒度与粗粒度角度进行优化,根据CPU与GPU的结构特点优化排序数据的读取和存储方式,内核采用一个GPU线程对应一次比较操作的计算方法,以充分利用GPU计算能力。实验结果表明,当排序数据规模大于40 000时,在GPU上的运算速度比在CPU上快3倍左右,并且随着数据规模的不断增大,加速比越来越大。研究结果对于提升大规模数值计算效率具有重要的意义。相似文献

20.

WSN杂交粒子群优化定位改进算法

唐弢赵月新郭岩胡福芳《黑龙江工程学院学报》2020,34(2):5-9

确定无线传感器网络(WSN)中节点的位置是网络初始化阶段首要任务之一,杂交PSO定位算法(Hybrid Particle Swarm Optimization,HPSO)可以通过父代粒子杂交产生性能较好的子代粒子,加速收敛,其定位精度明显优于其他PSO算法,因而成为近年来研究的热点之一。然而,杂交PSO定位算法存在计算量大、定位时间长等问题,针对这些问题,提出一种改进杂交PSO定位算法(Improved Hybrid PSO,IHPSO),在交叉和变异过程中引入粒子集中度和粒子平稳度两个概念,并加入选择机制和排队机制,加快算法的收敛度,同时有效地提高算法的定位精度和定位时间。相似文献