期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈风田雨波杨敏《计算机科学》2014,41(9):263-268

应用图形处理器(GPU)来加速粒子群优化(PSO)算法并行计算时,为突出其加速性能,经常有文献以恶化CPU端PSO算法性能为代价。为了科学比较GPU-PSO算法和CPU-PSO算法的性能,提出用"有效加速比"作为算法的性能指标。文中给出的评价方法不需要CPU和GPU端粒子数相同,将GPU并行算法与最优CPU串行算法的性能作比较,以加速收敛到目标精度为准则,在统一计算设备架构(CUDA)下对多个基准测试函数进行了数值仿真实验。结果表明,在GPU上大幅增加粒子数能够加速PSO算法收敛到目标精度,与CPU-PSO相比,获得了10倍以上的"有效加速比"。相似文献

2.

基于GPU的并行粒子群神经网络设计与实现

陈风田雨波杨敏《计算机工程与设计》2014,(11):3967-3973

针对粒子群优化(PSO)算法训练人工神经网络(NN)时面临的计算时间过长问题,引入基于图形处理器(GPU)技术的并行处理解决方法。使用粒子与线程一一对应的并行策略,通过并行处理各个粒子的计算过程来加快整个粒子群的收敛速度,减少粒子群神经网络(PSO-NN)的训练时间。在统一计算设备架构(CUDA)下对一简单测试函数逼近的数值进行仿真,实验结果表明,相较基于CPU的串行PSO-NN,基于GPU的并行PSO-NN在寻优稳定性一致的前提下取得了超过500倍的计算加速比。相似文献

3.

基于自适应线程束的GPU并行粒子群优化算法

张硕何发智周毅鄢小虎《计算机应用》2016,36(12):3274-3279

基于统一计算设备架构（CUDA）对图形处理器（GPU）下的并行粒子群优化（PSO）算法作改进研究。根据CUDA的硬件体系结构特点,可知Block是串行执行的,线程束（Warp）才是流多处理器（SM）调度和执行的基本单位。为了充分利用Block中线程的并行性,提出基于自适应线程束的GPU并行PSO算法：将粒子的维度和线程相对应;利用GPU的Warp级并行,根据维度的不同自适应地将每个粒子与一个或多个Warp相对应;自适应地将一个或多个粒子与每个Block相对应。与已有的粗粒度并行方法（将每个粒子和线程相对应）以及细粒度并行方法（将每个粒子和Block相对应）进行了对比分析,实验结果表明,所提出的并行方法相对前两种并行方法,CPU加速比最多提高了40。相似文献

4.

基于GPU的现代并行优化算法

张庆科杨波王琳朱福祥《计算机科学》2012,39(4):304-311

针对现代优化算法在处理相对复杂问题中所面临的求解时间复杂度较高的问题,引入基于GPU的并行处理解决方法。首先从宏观角度阐释了基于计算统一设备架构CUDA的并行编程模型,然后在GPU环境下给出了基于CUDA架构的5种典型现代优化算法(模拟退火算法、禁忌搜索算法、遗传算法、粒子群算法以及人工神经网络)的并行实现过程。通过对比分析在不同环境下测试的实验案例统计结果,指出基于GPU的单指令多线程并行优化策略的优势及其未来发展趋势。相似文献

5.

快速不变矩算法基于CUDA的并行实现

韩斌孙文赟周飞王士同《计算机应用》2010,30(7)

不变矩自提出以来被广泛应用于目标识别系统中进行特征描述,这需要能够实时计算不变矩值.虽然已经提出了许多不变矩的快速算法,但仍无法在单台PC机上实现不变矩的实时计算.分析了基于差分矩因子的不变矩快速算法的并行性,提出了一种基于统一计算架构(CUDA)的快速不变矩并行实现方法,并在NVIDIA Tesla C1060 GPU上实现.对所提出算法的计算性能与普通串行算法进行了对比分析.实验结果表明,所提出的并行计算方法极大地提高了不变矩的计算速度,可有效地用来进行实时特征提取. 相似文献

6.

并行自适应免疫量子粒子群优化算法

下载免费PDF全文

李红婵朱颢东《计算机工程》2011,37(5):221-223

为克服粒子群优化算法早熟收敛及粒子在进化过程中缺乏方向指导的问题,采用量子技术及免疫机制,提出一种自适应免疫量子粒子群优化算法。针对其计算量大、耗时长的缺点,结合已有的并行计算技术,构造该算法的并行计算方法。仿真实验结果表明,该并行算法在搜索能力和运行时间方面具有较好的性能。相似文献

7.

基于粒子群优化算法的并行模拟退火算法

林娟杜庆良杨辉钟一文《计算机科学与探索》2014,(7):886-896

针对模拟退火（simulated annealing,SA）算法收敛速度慢,随机采样策略缺乏记忆能力,算法内在的串行性使其具有并行化问题依赖等缺点,提出了基于粒子群优化（particle swarm optimization,PSO）算法的并行模拟退火算法。该算法利用粒子群优化算法中个体的记忆功能引导算法在解空间中开展精细搜索,在反向学习算法基础上设计新的反向转动操作机制增加了算法的多样性,借助PSO的天然并行性克服了SA的并行问题依赖性,并在集群上实现了多Agent协同进化的改进算法。对Toy模型的蛋白质结构预测问题进行了仿真实验,结果表明该算法能有效提高求解问题的质量和效率。相似文献

8.

基于CUDA的点云去噪算法 总被引：1，自引：0，他引：1

下载免费PDF全文

徐波唐杰武港山《计算机工程》2011,37(2):224-226

提出一种基于统一计算设备架构(CUDA)的双边滤波点云去噪算法,将点云去噪划分为多个并行度较高的步骤,利用GPU的并行计算能力,设计每个步骤的CUDA核函数。采用高斯加权的法矢计算方法,在双边去噪算法中加入面积权重缓解过光顺。实验结果表明,该算法能有效提高法矢计算的准确度,与CPU算法相比,计算速度提高了多个数量级。相似文献

9.

CUDA下单源最短路径算法并行优化

张晗钱育蓉王跃飞陈人和田宸玮《计算机工程与设计》2019,40(8)

相似文献

10.

基于岛屿群体模型的并行粒子群优化算法 总被引：19，自引：0，他引：19

黄芳樊晓平《控制与决策》2006,21(2):175-0179

为改善粒子群优化算法对大规模多变量求解的性能,提出了基于岛屿群体模型的并行粒子群优化算法．对粒子群优化算法机理和本质并行性进行分析,设计和实现了一种并行粒子群优化算法．实验结果表明,基于岛屿群体模型的并行粒子群优化算法不仅提高了求解效率,而且改善了早收敛现象,算法的性能比经典粒子群优化算法有了很大提高．相似文献

11.

基于CUDA的汇流分析并行算法的研究与实现* 总被引：2，自引：0，他引：2

赵向辉苗青付忠良苏畅李昕《计算机应用研究》2010,27(7):2445-2447

针对基于数字高程模型（DEM）生成流域等流时线的快速运算问题,提出了一种基于统一设备计算架构（CUDA）平台同时可发挥图形处理器（GPU）并行运算特性的汇流分析的快速并行算法。采用改进后的归并排序算法进行数据排序及新的内存分配策略和改进的并行算法进行汇流分析。用该并行算法和CPU上的串行算法, 对生成基于DEM的等流时线运算时间和矩阵乘法运算时间进行分析验证。实验结果表明,基于CUDA的汇流分析并行算法能提高系统的计算效率,具有较好的效果。相似文献

12.

基于CUDA的并行加速渲染算法

下载免费PDF全文

刘镇郝冬宁梅向东《中国图象图形学报》2013,18(11):1457-1461

GPU可以快速有效的处理海量数据,因此在近些年成为图形图像数据处理领域的研究热点。针对现有GPU渲染中在处理含有大量相同或相似模型场景时存在资源利用率低下和带宽消耗过大的问题,在原有GPU渲染架构的基础上提出了一种基于CUDA的加速渲染方法。在该方法中,根据现有的GPU渲染模式构建对应的模型,通过模型找出其不足,从而引申出常量内存的概念;然后分析常量内存的特性以及对渲染产生的作用,从而引入基于常量内存控制的方法来实现渲染的加速,整个渲染过程可以通过渲染算法进行控制。实验结果表明,该方法对解决上述问题具有较好的效果,最终实现加速渲染。相似文献

13.

基于CUDA的邻近粒子搜索算法研究

刘丹陈捷捷《计算机工程与应用》2012,48(18):53-56

在粒子方法中,运用邻近粒子搜索算法可以快速获取每个粒子的邻近粒子信息。由于粒子方法模拟一个体系的行为所采用的粒子数据是十分庞大的,对计算机的运算速度提出了挑战。研究了GPU的计算能力和CUDA开发环境,利用GPU的并行多线程处理技术,提出了一种并行邻近粒子搜索算法。实验结果表明,基于CUDA的并行邻近粒子搜索算法,加快了邻近粒子搜索过程,显著地减少了计算时间,成功实现了硬件加速,可获取290以上的加速比,对大规模粒子系统呈现出高效的处理能力。相似文献

14.

一种基于CUDA的并行多目标进化算法

胡宾宾祁荣宾钱锋《计算机与应用化学》2015,32(1)

传统的多目标进化算法多是基于Pareto最优概念的类随机搜索算法,求解速度较慢,特别是当问题维度变高,需要群体规模较大时,上述问题更加凸显。这一问题已经获得越来越多研究人员以及从业人员的关注。实验仿真中可以发现,构造非支配集和保持群体多样性这两部分工作占用了算法99%以上的执行时间。解决上述问题的一个有效方法就是对这一部分算法进行并行化改造。本文提出了一种基于CUDA平台的并行化解决方案,采用小生境技术实现共享适应度来维持候选解集的多样性,将多目标进化算法的实现全部置于GPU端,区别于以往研究中非支配排序的部分工作以及群体多样性保持的全部工作仍在CPU上执行。通过对ZDT系列函数的仿真结果,可以看出本文算法性能远远优于NSGA-Ⅱ和NPGA。最后通过求解油品调和过程这一有约束多目标优化问题,可以看出在解决化工应用中的有约束多目标优化问题时,该算法依然表现出优异的加速效果。相似文献

15.

基于量子行为粒子群优化算法的定位技术研究

赵吉纪志成《传感器与微系统》2012,31(5):58-61

针对无线传感器网络(WSNs)节点定位问题,阐述了WSNs的分布迭代式定位方法研究。这种方法将每次迭代后定位的节点作为其余未知节点的参考节点.同时将基于测距定位问题看成一个多维优化问题,并提出利用具有快速收敛能力的量子行为粒子群优化(QPSO)算法进行求解。最后将仿真实验结果与粒子群优化(PSO)算法进行比较,表明QPSO算法在优化性能上优于PSO算法,有效提高了节点定位精度,证明该方法的有效性。相似文献

16.

CT图像SART重建技术的CUDA并行实现

史怀林孙丰荣姜威刘炜秦通李新彩《计算机应用》2011,31(5):1245-1248

在计算机断层扫描(CT)图像重建领域,当投影数据不完备或者含有噪声时,相对于滤波反投影(FBP)算法,联合代数重建方法(SART)能重建出质量更高、更符合临床诊断要求的图像。但SART方法非常耗时,而算法的并行实现是解决这一问题的有效途径之一。提出一种基于nVIDIA通用设备计算架构(CUDA)实现的SART并行运算方法。实验结果表明,该方法在不牺牲重建图像质量的基础上,重建时间大为缩减,更有利于临床应用。相似文献

17.

基于粒子群优化算法的多交叉口信号配时* 总被引：3，自引：1，他引：3

张兰雷秀娟马千知《计算机应用研究》2010,27(4):1252-1254

以城市道路多个单点信号控制交叉口组成的绿波系统为研究对象,对绿波系统的交叉口信号配时优化进行研究。通过对路段和干线机动车流进行协调控制设计,以西安市某两相邻交叉口晚高峰时段各进口道的交通量、通行能力、饱和流量以及各交叉口进口道的实际车均延误时间为约束,确定各交叉口的信号周期及各相位有效绿灯时长,使得干线延误量最小。设计了PSO算法的编码方式,分别采用PSO算法、灾变PSO算法和二阶振荡PSO算法对多交叉口交通信号配时进行优化计算。仿真实验表明,二阶振荡PSO算法在该实例中表现最优。相似文献

18.

改进粒子群算法优化回声状态网络的电力需求预测研究

王林王燕丽安泽远《计算机工程与科学》2022,44(8):1457-1466

首先引入自适应算子对标准粒子群优化算法PSO的惯性权重和学习因子进行改进,以提高其探索当前空间和开发未知空间之间的平衡性。同时,采用非线性函数来构建回声状态网络ESN储备池内部状态之间的非线性关系。接着利用改进的粒子群优化算法APSO对非线性回声状态网络NESN的关键参数进行优化,以构建APSO-NESN组合预测模型。最后运用该模型进行电力需求预测。实验结果表明,相比自回归移动平均模型、多元线性回归、标准ESN及其他预测模型,APSO-NESN模型具有更高的预测精度。相似文献