首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
随着电力系统规模日益增大,对潮流计算速度与实时性的要求相应提高。为了适应大规模电力系统潮流计算需求,根据Krylov子空间思想,提出了一种基于迭代法求解线性方程组的潮流算法,该算法利用不完全LU分解作为预处理,并采用CPU-GPU异构运算架构,根据CPU和GPU的不同特点,将潮流算法分为CPU处理部分和GPU处理部分,其中GPU用于并行处理计算量最为密集的线性方程组求解步骤,CPU用于处理潮流算法的其他步骤,实现快速求解。算例表明,所提算法收敛性能稳定、收敛速度快、算法效率高,在系统规模较大时,与传统基于LU分解的潮流算法相比具有明显优势,能够满足大规模电网在线潮流计算的需求,具有工程应用价值。  相似文献   

2.
基于GPU的机电暂态仿真细粒度并行算法   总被引:1,自引:0,他引:1  
提出一种基于图形处理器(GPU)并采用隐形梯度法的机电暂态仿真细粒度并行算法。该算法将整个系统分为发电机节点系统和非发电机节点系统,对发电机节点系统求解时,先将在网络中直接相连的发电机节点合并成一个子系统,然后在GPU中给每个子系统分配相应线程块进行并行求解,其中采用了LU并行分解来求解线性方程组。求解完成后,利用从发电机节点系统传递来的LU分解信息,再对非发电机节点系统使用GPU进行求解。通过对不同规模的算例进行分析表明:所提出的GPU并行算法的计算结果与CPU串行算法和BPA软件的计算结果大致相同,且随着系统规模的增加,GPU并行算法的加速效果更为明显。  相似文献   

3.
为满足对大规模可再生能源接入的电力系统进行快速电磁暂态仿真的需求,提出了一种面向指数积分方法的电力系统电磁暂态仿真图形处理器(GPU)并行算法。首先,分析了矩阵指数积分算法求解过程所具有的高度数据并行性,进而将该特性与GPU计算资源相结合;利用GPU处理指数积分方法求解时所需的大规模矩阵运算,而将较为复杂的系统状态判别与更新保留在CPU中完成,有效提升了仿真计算速度。最后,分别针对17台和100台风机的风电场算例进行了测试,验证了所提并行算法的正确性和有效性,同时也说明了算法的加速效果会随着系统规模的增加而愈发明显。  相似文献   

4.
随着基于变流器的电气接口和交直流混联技术的广泛使用,电网电磁暂态仿真中需对大规模复杂控制系统进行建模。采用细粒度并行方法可加速控制系统计算,提升电网电磁暂态仿真整体效率。文中提出了一种控制系统细粒度并行仿真算法,加速了图形处理器(GPU)计算平台上大规模控制系统仿真。首先,为构造面向GPU的多线程细粒度并行计算,将控制系统建模为由大量基本控制元件构成的有向图。进一步,对控制系统有向图进行分层,生成控制元件求解顺序,以利用GPU的分组细粒度并行实现控制元件的分层计算。最后,结合GPU的三层并行结构,通过优化线程结构和配置共享内存,将计算线程映射到GPU中的计算资源,最大化控制系统仿真的并行度。对分布式电源接入IEEE 13节点系统的仿真结果对比表明,所提出算法在保证电网电磁暂态仿真正确性的同时,可显著提高GPU计算平台上大规模、复杂控制系统的仿真速度,在硬件资源充足时,不存在仿真规模限制。  相似文献   

5.
唐聪  严正  周挺辉 《电网技术》2013,(5):1365-1371
文中对电力系统暂态仿真算法及并行化设计进行了研究,针对图形处理器(graphic processing unit,GPU)的特性,应用广义最小残差法(generalized minimal residual,GMRES)提出一种基于GPU的电力系统暂态仿真并行算法。该算法采用预处理算法对暂态仿真计算过程中的系数矩阵进行预处理,降低条件数以提升收敛速度,经预处理后的线性方程组通过GMRES算法在GPU上并行求解,针对暂态仿真计算中线性方程组稀疏性的特点,算法应用稀疏存储技术以节省计算量和内存占用空间。测试表明,所提出的GPU并行算法与PSAT软件计算结果近似;相对CPU串行程序,当算例规模足够大时,GPU并行算法的加速效果明显,实测最高加速比为3.3。  相似文献   

6.
微粒群优化算法是一种进化计算技术,其优点是速度快,鲁棒性好且结构简单。针对标准粒子群优化算法容易陷入局部最优的问题,本文提出了一种新的改进粒子群算法,算法中引入了进化速度因子和聚集度因子。在每次迭代时可根据当前粒子群进化速度因子和聚集度因子动态地改变惯性权值,从而使算法具有动态自适应性。将该算法运用到控制分配系统中来获取控制参数。仿真结果表明,该改进算法能得到较好的控制指令来有效的解决战斗机在线故障问题。  相似文献   

7.
为提高正则化相关滤波跟踪算法在复杂场景下的跟踪性能,提出一种具有改进的时空正则化和异常抑制的相关滤波目标跟踪算法。该算法在现有时空正则项的基础上引入稀疏空间变化向量来学习空间权重和参考权重之间的变化,引入稀疏时间变化向量来学习相邻两帧之间滤波器的变化,同时将响应图变化引入目标函数来抑制训练过程中的响应突变,最后通过交替方向乘子法迭代优化求解。在OTB-2015数据集上的对比实验结果表明,提出的算法具有更好的精度和成功率,且在光照变化、遮挡、快速运动等复杂跟踪场景下具有更好的鲁棒性。  相似文献   

8.
通过引入广义注入电流节点模型,提出了一种改进的可兼顾分布式电源场景和弱环网场景的配电网潮流算法。首先,基于现有理论将各类分布式电源的注入功率和弱环网断点所在支路的交换功率变换为广义注入电流,从而实现将含分布式电源和弱环网的复杂配电网转换为常规的辐射状配电网;然后,分析了各类注入电流在每次迭代计算时的求解方法;进一步,设计了二维辐射状配电网模型的动态存储结构及改进的前推回代法;最后,利用VC++编程语言和MS SQL SERVER数据库研制了相应的配电网潮流计算系统并以此系统进行了算例研究。算例结果表明:相对于现有算法,所改进的配电网潮流算法在计算速度上有一定的提高, 同时也更容易实现。  相似文献   

9.
采用基于GPU的光线投射算法实现了三维数据场的等值面绘制。首先将三维数据作为三维纹理存入显存,然后通过编写片段程序计算采样射线和等值面的交点,最后根据Phone光照模型为交点加上光照。实验结果表明,利用该算法绘制等值面效果良好,绘制速度基本达到实时交互的要求,通过编写不同的片段程序可以实现更丰富的绘制效果。  相似文献   

10.
边缘检测是图像处理的基础,目前边缘检测算法不断完善,检测效果不断的提高,但检测速度方面的研究还存在很多不足,为了在保证检测效果的同时,提高边缘检测的速度,提出了一种基于可编程图像处理器GPU的边缘检测方法,应用GPU的像素着色器和Canny算子检测原理,用VC++,Cg,OpenGL在Windows XP系统下进行仿真实验。结果表明,该方法不仅提高了边缘检测的速度,而且有效保留图像边缘信息,具有实时性,为今后基于GPU提高图像处理速度的研究提供了宝贵资源。  相似文献   

11.
传统的高斯混合建模算法对阴影的抑制效果差,且存在噪声干扰和对光照突变比较敏感的问题。采用了一种改进的高斯混合建模方法进行运动目标轮廓提取。该方法利用Canny边缘图像对噪声和光照适应性强的特点,将传统高斯混合模型与Canny边缘检测相结合来提取目标轮廓。但是,该方法复杂度高且计算量大,不满足视频分析实时性的需求,因此,运用GPU强大计算能力和并行处理的优势,基于CUDA平台设计并实现了该运动目标轮廓提取算法。实验结果表明,该算法增强了对噪声和光照的适应性,且有效抑制了图像中的阴影,在保证效果的前提下能够更快速地提取视频序列中的运动目标轮廓。  相似文献   

12.
随着电网规模的扩大以及电力系统互联水平的提高,电网分析计算的计算量显著上升.图形处理器(GPU)等并行计算设备能够提高大电网分析的计算效率,但电网分析计算中的串行电网拓扑分析已经成为影响并行算法计算效率的重要因素,亟待得到加速.作为电网拓扑分析加速问题的难点,全网拓扑分析可采用并行算法进行加速.为此,提出了一种基于GP...  相似文献   

13.
针对高度细节三角网格模型实时绘制问题,通常使用LOD技术对模型进行处理,本文提出了一种适用于GPU的针对零亏格的三角网格模型的多分辨率绘制方法。该方法先将三角网格进行球面参数化,然后利用参数化结果构建几何图像,并在其上建立四叉树模型,最后使用GPU着色器进行模型细节层次的选择并对网格进行简化,实现模型的多分辨率绘制。与已有方法相比,利用GPU高度并行运算的特点,减少了简化模型过程的计算时间。实验结果表明,该方法在保证绘制质量的同时达到实时绘制的要求。  相似文献   

14.
基于道路树分层的大电网潮流并行算法及其GPU优化实现   总被引:3,自引:0,他引:3  
针对大规模电网分析及能量管理系统对快速潮流计算的需求,提出了一种适于图形处理器(GPU)的基于道路树分层的稀疏矩阵直接分解算法,并结合该算法在GPU上实现了基于牛顿-拉夫逊法的潮流计算.为提高基于GPU的计算效率,首先在GPU上实现了潮流方程式右端项生成、雅可比矩阵生成、LU分解以及前推回代求解,减少了CPU和GPU之间的数据传输时间.其次,针对GPU中寄存器-缓存-显存多级存储架构,改进数据存储方式,减少了读取延迟.进一步,考虑GPU线程组织特点,优化任务分配,增加了计算并行度.最后,对比基于CPU的电力系统分析综合程序(PSASP)潮流计算模块,进行了数值仿真测试.结果表明,随着节点数的增加,所提出的程序计算优势越来越显著,算例规模达到43 602个节点时可获得5.172倍的加速比,验证了算法的有效性和实用性.  相似文献   

15.
逆合成孔径雷达(inverse synthetic aperture radar,ISAR)是一种具有很高的成像分辨率的雷达,其成像过程是一项大数据量的高密度计算的处理任务。图形处理器(GPU)具有数十倍于CPU的浮点计算能力以及传输带宽,而CUDA 技术的发展使得多线程、单指令的GPU 架构能够方便快速地进行并行计算。提出了一种在cuda平台上用GPU进行非相参成像处理的高效方法,利用GPU 的并行特性,实现了成像处理过程的并行化,与一般GPU 处理方法相比,其处理速度可以达到实时成像的效果,运算速率明显提高。  相似文献   

16.
针对基于检测的两步多目标跟踪算法模型结构复杂、实时性差的问题,提出一种基于改进YOLOv4-Tiny和DeepSORT的实时多目标跟踪算法。在YOLOv4-Tiny算法中引入深度可分离卷积,压缩模型计算量;将检测分支增加至3个,并使用多尺度特征融合结构以降低对小目标的漏检率;利用改进的GC注意力模块,加强网络对全局上下文特征的提取能力。跟踪部分使用DeepSORT算法,使用匀加速卡尔曼滤波优化其行人运动模型,利用浅层分类网络重构其外观模型,最后在MOT16测试序列中实验。结果表明,改进算法的总参数量为4.2M,较原算法减少52%且MOTA增加5.2%,GPU下处理时间加快,单CPU时能达到平均每秒11帧的跟踪速度,能满足低算力设备对跟踪任务精度和速度的要求。  相似文献   

17.
针对小波分解计算速度慢、实际工程应用少的问题,采用图形处理器(GPU)作为计算平台,提出一种基于计算统一设备架构(CUDA)的细粒度高速并行小波分解算法。通过分析小波Mallat算法的并行性,并考虑GPU单个处理单元计算能力相对较弱的特点及CUDA的多层式存储器结构、多层式线程组织结构和单指令流多线程流(SIMT)体系结构,采用数据分组及轻量级线程任务分解的方式,提出了适合CUDA程序设计模型的高速并行小波分解算法,并将其用于电力系统谐波分析。实验证明,该算法相对于CPU串行小波分解和Matlab engine小波分解的计算耗时,最高可分别达到26倍和65倍的速度提升,且算法具有线性加速能力。  相似文献   

18.
针对基于传统混合高斯模型算法对光照突变敏感,以及运动物体速度缓慢时产生的“重影”现象,根据深海自主观测的应用需求提出了一种三帧差法结合动态自适应学习率的改进混合高斯模型算法。利用三帧差法快速定位出视频帧的背景、前景及干扰区,对不同区域给予不同的学习率和更新策略,减小了运算量和提高了算法的收敛速率。实验结果表明,该算法能有效地处理深海环境中海流扰动、浮游物干扰以及光线突变带来的影响,具有良好的实时性和鲁棒性,在深渊着陆器的实际工程应用中能够准确地检测出运动目标。  相似文献   

19.
本文将配准技术与插值算法相结合,通过对场景中运动物体的时间帧配准、时间域和空间域的插值,生成了任意时刻、任意视点处的渲染罔像,完成对运动物体时空域的光场渲染。该研究结合并推广了传统光场渲染方法,放宽了对场景的要求。和现有的方法相比,该方法适应性强、鲁棒性好。实验结果进一步体现了该方法较好的应用前景与可操作性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号