首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
使用伪谱方法的直接数值模拟准确、高效,但在高雷诺数情况下,计算量非常巨大,需要采用并行方法,但是快速傅里叶变换的并行算法在实际应用中有很大的困难。针对这一问题,提出了一种新的基于MPI的伪谱法直接数值模拟的并行计算方法。通过实例验证,该方法准确、易行、稳健,并且可以大幅提高计算速度,节省计算时间,这对直接模拟在科学研究和工程实际中的广泛应用都具有重要意义。  相似文献   

2.
为准确地预测狭长空间内火灾引起的烟气运动,本文研究了不同湍流模型的影响.针对某一巷道内的火灾烟气运动,分别采用考虑浮力修正的双方程湍流模型和大涡模拟方法展开计算.计算结果表明大涡模拟方法的预测值与测量值吻合较好,普通的双方程湍流模型虽然进行了浮升力的修正,但计算结果与实验值仍然存在着一定的差距.  相似文献   

3.
刘长猛  郜冶  刘平安 《计算机仿真》2012,29(11):395-398,403
研究高层建筑物表面压力分布的准确预测问题。针对工程的实际应用,由于建筑物与风之间的相互作用加在建筑物上,使建立压力分布的准确预测模型较为困难。为得到准确预测建筑物表面压力分布的模型,采用风场给定的大气边界层入口条件,使用不同湍流模型和粗化网格,对立方体建筑物表面压力分布进行计算。分析发现,与测试结果相比雷诺平均和分离涡模型在立方体建筑物表面压力系数计算偏差较大,而大涡仿真计算结果吻合度较好。仿真结果表明,给定合适边界条件和计算方法,使用粗化网格的大涡模拟计算能够得到准确的压力系数计算结果,可以为更加复杂的工程实际计算提供参考和应用依据。  相似文献   

4.

为了进一步提高伪谱最优控制方法的计算精度, 削弱微分形式伪谱法对状态变量近似误差的放大幅度, 研究基于积分形式的伪谱最优控制方法. 依次给出3 种伪谱法的积分伪谱离散形式, 证明当Lagrange 多项式对状态变量的近似误差等于零时, Gauss 伪谱法和Radau 伪谱法的积分形式与微分形式是等价的, 而Legendre 伪谱法的积分形式与微分形式是不等价的, 并分析了其不等价的原因.

  相似文献   

5.
求解最优控制问题的Chebyshev-Gauss伪谱法   总被引:1,自引:0,他引:1  
唐小军  尉建利  陈凯 《自动化学报》2015,41(10):1778-1787
提出了一种求解最优控制问题的Chebyshev-Gauss伪谱法, 配点选择为Chebyshev-Gauss点. 通过比较非线性规划问题的Kaursh-Kuhn-Tucker条件和伪谱离散化的最优性条件, 导出了协态和Lagrange乘子的估计公式. 在状态逼近中, 采用了重心Lagrange插值公式, 并提出了一种简单有效的计算状态伪谱微分矩阵的方法. 该法的独特优势是具有良好的数值稳定性和计算效率. 仿真结果表明, 该法能够高精度地求解带有约束的复杂最优控制问题.  相似文献   

6.
采用Eulerian/Lagrangian方法模拟直方槽道中气粒两相流动过程。气相采用大涡模拟方法,直接求解大尺度涡运动,小尺度涡采用标准的Smagorinsky亚格子模式模拟,壁面采用幂次率应力模型代替无滑移边界条件。颗粒相采用轨道模型求解。大涡模拟预报的气相平均速度与DNS结果相吻合。结果表明,在直方槽道流向截面,气相存在二次流现象。受气相二次流的作用,颗粒相也存在类似于气相的二次流现象,并考察了重力对颗粒相二次流的影响。  相似文献   

7.
常用的格子SVD法在精确计算矩阵A的ε-伪谱Λ_ε(A)时,需要将感兴趣的区域作细网格划分,在每一个网格点处计算σ_(min)(zI-A),并根据该值的大小判断该网格点是否位于Λ_ε(A)伪谱曲线上,其计算量往往很大.本文提出两种新的用于计算伪谱的方法:区域排除法和方格移动法.它们以不同方式,减小计算区域,大大提高了伪谱的计算速度.数值实验也充分说明算法的有效性.  相似文献   

8.
针对控制变量不连续的最优控制问题,本文提出一种自适应更新的忉伪谱法,这种方法在(Legendre Gauss Radau,LGR)点处取配点,能够以较小的网格规模获得较高的精度.通过计算相对误差估计,判断网格规模是增加还是缩减,若相对容许误差大于给定值,则增加网格区间数或网格配点数提高解的精度,反之则合并网格或减小网格配点数缩减网格规模提高计算效率.将hp伪谱法应用于最优控制问题,仿真验证了hp伪谱法的优越性.  相似文献   

9.
大柔性飞行器因结构重量低、柔性大使得机翼等部件在受载时产生较大的弹性变形,呈现显著的几何非线性效应,因此准确的结构大变形建模方法对于几何非线性气动弹性分析至关重要,而神经网络对非线性系统具有强大的拟合能力,可通过将神经网络应用于非线性结构建模,构造适用于结构大变形的前馈神经网络预测模型,在样本特征和数据结构相对较优的条件下结合曲面涡格法,搭建非线性气动弹性分析框架,对某机翼模型进行阵风响应计算;结果表明神经网络模型能准确预测大柔性机翼结构大变形,应用到气动弹性分析后能进行准确的阵风响应计算,验证了将神经网络应用到结构大变形预测的可行性,为以后机器学习技术与气动弹性分析结合的研究提供思路和方法。  相似文献   

10.
基于一种求解最优控制问题的新方法——hp自适应伪谱法对滑翔弹道快速优化设计问题进行了研究;该方法将全局伪谱法与有限元法的思想进行结合,采用双层优化策略对细化单元上的配点数和插值多项式的阶次进行自适应调节以满足快速性及精度要求;对滑翔弹道优化问题进行了数值仿真计算,用极小值原理验证了仿真所得的弹道是最优弹道,并与Guass伪谱法的仿真结果进行了对比分析;结果表明该优化方法在求解周期性跳跃滑翔弹道时具有更合理的配点分布及更少的计算时间,对初始控制量不敏感、鲁棒性强,具有一定的工程应用价值。  相似文献   

11.
对多核环境下的图像分割并行算法进行研究,在基于正交小波分解的多分辨率图像锥中引入模糊C-均值(FCM)算法,采用OpenMP语言设计P-FCM多核并行模型,并给出该模型的算法实现步骤。在对初始图像数据预处理时,采用矩形块数据分割法进行图像分块,将分块后的子图像数据作为并行运算时的输入数据由主线程分给不同的处理器。实验结果表明,在处理较大图像时,该算法效率较高。  相似文献   

12.
大尺度、高分辨率数字地形数据应用需求的增长,给计算密集型的累积汇流等数字地形分析算法带来了新的挑战。针对CPU/GPU(Graphics Processing Unit)异构计算平台的特点,提出了一种基于OpenCL(Open Computing Language)的多流向累积汇流算法的并行化策略,具有更好的平台独立性和可移植性,简化了CPU/GPU异构平台下的并行应用程序设计。累积汇流并行算法包括时空独立型的流量分配和空间依赖型的累积入流两个过程,均定义为OpenCL内核并交由OpenCL设备并行执行,其中累积入流过程借助流量转移矩阵由递归式转换为迭代式来实现并行计算。与基于流量转移矩阵的并行汇流算法相比,尽管基于单元入度矩阵的并行汇流算法可以降低迭代过程中的计算冗余,但需要采用具有较大延迟的原子操作以及需要更多的迭代次数,在有限的GPU计算资源下,两种算法性能差异不明显。实验结果表明,并行累积汇流算法在NVIDIA GeForce GT 650M GPU上获得了较好的加速比,加速性能随格网尺度增加而有所增加,其中流量分配获得了约50~70倍的加速比,累积入流获得了10~20倍的加速比,展示了利用OpenCL在GPU等并行计算设备上进行大规模数字地形分析的潜在优势。  相似文献   

13.
针对H.264压缩编码中计算量大以及最为耗时的运动估计搜索算法的特点,利用图形处理器的并行优化思想,研究基于CUDA计算平台的运动估计搜索算法GEA(全域消除算法)的并行化处理方法,并对其中的并行设计、数据处理、结果反馈等关键技术问题,进行了详细论述。最后通过实验数据对算法运行效率进行对比分析。实验结果表明GPU中的GEA搜索算法运动搜索性能较之CPU中有显著提高。  相似文献   

14.
RSA算法的CUDA高效实现技术   总被引:1,自引:1,他引:0       下载免费PDF全文
CUDA(Compute Unified Device Architecture)作为一种支持GPU通用计算的新型计算架构,在大规模数据并行计算方面得到了广泛的应用。RSA算法是一种计算密集型的公钥密码算法,给出了基于CUDA的RSA算法并行化高效实现技术,其关键为引入大量独立并发的Montgomery模乘线程,并给出了具体的线程组织、数据存储结构以及基于共享内存的性能优化实现技术。根据RSA算法CUDA实现方法,在某款GPU上测试了RSA算法的运算性能和吞吐率。实验结果表明,与RSA算法的通用CPU实现方式相比,CUDA实现能够实现超过40倍的性能加速。  相似文献   

15.
计算量过大是机载天线辐射特性分析的瓶颈问题,为此,提出一种基于等三角剖分的并行UTD计算与绘制算法,算法采用基于空间八叉树分割的模型框架半自动提取方法进行模型简化。给出一种全方位等三角剖分负载平衡方案,并采用sort-last并行图形绘制框架和Binary-swap图像合成算法进行并行绘制,将该算法在计算机集群上进行实现。实验结果表明,该算法能够有效节约计算时间,提高绘制效率,较好地满足了大型复杂飞行器机载天线的方向图特性分析需求。  相似文献   

16.
面向大规模可视数据的高速绘制问题,提出了一种基于区域分解的并行动态LOD(level-of-detail,层次细节模型)构建算法。算法首先改进了传统的渐进网格方法,实现了基于二次误差测度网格简化算法的渐进网格方法;接着提出了一种基于模型包围盒的区域分解算法,实现了原始模型的自适应区域分解;在每个子区域上,并行地执行渐进网格方法,实现了模型的并行动态LOD构建。实验结果表明,该算法可生成高质量的LOD模型,具备理想的加速比和可扩放性;与串行算法相比,该算法有效地提高了算法的执行效率。  相似文献   

17.
张峰  陆利忠  闫镔  李磊 《计算机工程》2011,37(10):275-277
反投影运算是锥束CT图像重建算法中运算量最大,最耗时的部分,是制约重建速度的瓶颈。为此,在计算统一设备架构模型下,应用体素驱动法实现基于Tesla平台的反投影(BP)并行运算,并对BP运算上的访存和数学指令进行优化。实际CT数据的重建结果表明,该方法的运算速度是CPU串行程序的198倍,效率高且易于实现。  相似文献   

18.
GPU加速希尔加解密方法的研究   总被引:1,自引:1,他引:0       下载免费PDF全文
GPU有效地利用了数量巨大的晶体管制造大量的处理单元,适用于处理单任务多数据(SIMD)的计算任务。研究了GPU的体系结构及CUDA的编程模式,改进了基于CPU的希尔加解密方法,使用多个线程将计算中耗时的矩阵相乘部分改造成SIMD模式,并分析了线程块内线程数对加速比的影响。实验结果表明,基于GPU的并行矩阵相乘的希尔加解密方法成功实现了硬件加速,相对于CPU上运行的希尔加解密方法,其执行效率明显提高,可获取12倍以上的加速,并易于扩展,对大规模数据加密和解密处理呈现出高效的处理能力。  相似文献   

19.
具有优越性能的卷积神经网络算法已得到广泛应用,但其参数量大、计算复杂、层间独立性高等特点也使其难以高效地部署在较低功耗和较少资源的边缘场景。为此结合该种算法的特点提出了一种基于混合架构的卷积神经网络计算加速方法,该方法选用CPU加FPGA的混合架构,对网络模型进行了压缩优化;在FPGA上通过指令控制数据流的DSP阵列结构实现了卷积计算加速;通过YOLO算法测试了该方法的加速性能,在7 000万门级FPGA上各类资源消耗低于50%且总功耗为7.36 W的情况下,吞吐率达到了120 GOPS。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号