首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
CUDA是应用较广的GPU通用计算模型,BP算法是目前应用最广泛的神经网络模型之一。提出了用CUDA模型并行化BP算法的方法。用该方法训练BP神经网络,训练开始前将数据传到GPU,训练开始后计算隐含层和输出层的输入输出和误差,更新权重和偏倚的过程都在GPU上实现。将该方法用于手写数字图片训练练实验,与在四核CPU上的训练相比,加速比为6.12~8.17。分别用在CPU和GPU上训练得到的结果识别相同的测试集图片,GPU上的训练结果对图片的识别率比CPU上的高0.05%~0.22%。  相似文献   

2.
冷连轧生产是较早引入仿真技术进行辅助研究与开发的领域之一,目前已取得了大量的成果。但大多数仿真研究局限于模型的静态机理建模,难以适应复杂环境的变化,造成了很大偏差。该文以轧制力为例,研究机理和数据的结合,从而修正轧制力的模型,实现轧制力参数的预报。轧制力是冷连轧生产的关键力能参数之一,为提高预报精度、缩短自适应过程的时间,研究轧制力建模,并进行仿真研究很必要。文章讨论了仿真系统模型的类型和建模方法,对冷连轧轧制力模型进行了机理推导,并运用智能方法对轧制力参数进行回归和分析。结果表明,采用机理建模和辨识建模相结合的方法,可以建立较精确的轧制力模型,为轧制过程模型的建立及优化提供了成功的范例。  相似文献   

3.
对轧机轧制力预测模型进行研究.使用人工鱼群优化算法对支持向量回归(SVR)参数选取进行最优的参数组合,将粒子群优化算法引入到常规人工鱼群算法中,并对其进行改进,提高了人工鱼群算法的性能.研究结果表明:Ekelund模型的轧制力计算结果误差较大,超过了10%,常规SVR预测模型的轧制力预测精度低于10%,而本文研究的改进SVR预测模型得到的轧制力误差低于5%,说明通过人工鱼群算法优化SVR算法模型的参数能够提高预测模型的预测精度,并且预测消耗时间在3种预测模型中是最短的.  相似文献   

4.
变形抗力是轧制力模型预测的重要参数,其模型的精确度直接影响轧制力的预报精度。为了得到更为精确的变形抗力数学模型,文中以据河南某铝热连轧厂1+4连轧精轧机组为研究对象,根据大量现场实测稳定段数据,应用轧制理论反推得到变形抗力回归所用数据后,将模型线性化再应用最小二乘法对1050系铝合金变形抗力进行了线性回归,得到初始参数后运用改进鱼群算法对影响变形抗力的参数进行了优化,仿真结果表明用改进鱼群算法优化出的参数得到的变形抗力模型比用最小二乘法回归出的变形抗力模型应用于轧制力预报的误差更小,所以,在进行轧制力预报时选择改进鱼群算法优化后的变形抗力模型。精确的轧制模型是轧制过程中的轧制预报的关键,对于指导生产,提高产品质量有着重要的实践意义。  相似文献   

5.
具有NN 分级误差补偿器的轧制力预报模型   总被引:1,自引:0,他引:1       下载免费PDF全文
为提高冷轧带钢质量,必须建立精确的轧制力预报模型。介绍了带有神经网络参数辨识器的轧制力预报模型,并采用神经网络构造误差补偿器,通过按时间跨度分级的数据处理过程,形成长期和短期训练数据集,结合相应的网络训练机制,实现模型预报误差的分级补偿,仿真结果表明,该预报模型能有效地提高预报精度。  相似文献   

6.
利用GPU进行加速的归一化差分植被指数(Normalized Differential Vegetation Index,NDVI)提取算法通常采用GPU多线程并行模型,存在弱相关计算之间以及CPU与GPU之间数据传输耗时较多等问题,影响了加速效果的进一步提升。针对上述问题,根据NDVI提取算法的特性,文中提出了一种基于GPU多流并发并行模型的NDVI提取算法。通过CUDA流和Hyper-Q特性,GPU多流并发并行模型可以使数据传输与弱相关计算、弱相关计算与弱相关计算之间达到重叠,从而进一步提高算法并行度及GPU资源利用率。文中首先通过GPU多线程并行模型对NDVI提取算法进行优化,并对优化后的计算过程进行分解,找出包含数据传输及弱相关性计算的部分;其次,对数据传输和弱相关计算部分进行重构,并利用GPU多流并发并行模型进行优化,使弱相关计算之间、弱相关计算和数据传输之间达到重叠的效果;最后,以高分一号卫星拍摄的遥感影像作为实验数据,对两种基于GPU实现的NDVI提取算法进行实验验证。实验结果表明,与传统基于GPU多线程并行模型的NDVI提取算法相比,所提算法在影像大于12000*12000像素时平均取得了约1.5倍的加速,与串行提取算法相比取得了约260倍的加速,具有更好的加速效果和并行性。  相似文献   

7.
冷连轧动态过程混合智能建模方法   总被引:1,自引:0,他引:1  
针对具有非线性、多变量、强耦合、参数不确定等综合复杂特性的多机架冷连轧动态过程,在工作点附近建立基于轧制过程动态机理方程的线性状态空间模型,提出基于RBF 的轧机出口带钢速度模型以及机架间厚度延时估计方法,采用案例推理技术实现线性化多模型选择算法,研制了冷连轧动态过程的混合智能模型.使用某钢厂五机架四辊冷连轧机系统的实际生产过程数据进行仿真实验,在实际板厚控制系统的设定和轧件的扰动下,本文提出模型的各机架轧制力、冷轧板厚度和张力仿真结果与实际值的变化趋势相同,最大误差小于20%.  相似文献   

8.
冷轧带钢的生产模式正在向多品种、小批量、低库存转变,这直接导致了轧制过程中需要更频繁地切换品种规格。由于变规格过程中轧制工艺状态变化较大,传统机理模型加常规自学习和自适应方法很难保证规格切换后首卷产品设定精度。为提高变规格过程中轧制力预报精度,本文提出一种机理模型与轧制过程海量历史数据相融合的复合模型。该方法建立在轧制力理论模型的基础上,采用遗传算法优化BP神经网络的方法对模型轧制力进行校正。使用该算法进行轧制力预报,使变规格后首卷钢轧制力预报的平均相对误差控制在±5.5%内,远高于常规机理模型的设定精度,该方法具有现场应用价值。  相似文献   

9.
基于催化原理的传感器在矿井环境工作时,受内在外在因素的干扰,测量的可燃气体浓度值存在误差过大的问题。设计了基于列文伯格-马夸尔特(L-M)训练算法及反向传播(BP)神经网络的传感器无效数据过滤器。通过离线采集传感器响应特性曲线数据的方式构建网络模型,并用Matlab工具对模型进行仿真训练。综合对比分析L-M训练算法、拟牛顿训练算法、自适应线性回归(LR)动量梯度下降训练算法的收敛速度和误差性能。对比结果表明,基于L-M训练算法构建的BP神经网络模型收敛速度更快、误差值更小、效率更高,有利于矿用催化原理传感器无效检测非线性数据的过滤。  相似文献   

10.
摘要:针对采用单CPU CT图像重建时间长,采用CPU集群重建成本及能耗高的问题,本文提出了CPU多线程+GPU的异构重建模型。这种模型采用CPU多线程流水线模式,将整个任务分解为若干个处理阶段,相邻的两个阶段之间以循环缓存连接,上一阶段完成一次计算任务后将数据放到循环缓存里,然后继续下一次的计算任务,下一阶段探测到循环缓存里有数据后,从缓存里取出数据开始计算。各个任务是并行处理任务的,针对某一耗时瓶颈模块再采用GPU并行加速,充分发挥CPU和GPU的计算资源。CPU多线程+GPU模型相对于CPU多线程模型加速16.45倍,相对于串行CT图像重建加速20.5倍以上。将CPU多线程+GPU模型重建的图像与CPU串行程序重建的CT图像比较,数据结果在误差范围内,满足实验设计要求。本文提出的图像重建模型采用成本较低的GPU显卡就实现了性能大幅提升,大大降低了CT图像重建系统的成本及功耗,而成本及功耗的降低会引起CT医疗诊断费用的降低,最终惠及广大病患。  相似文献   

11.
基于OpenCL的图像积分图算法优化研究   总被引:1,自引:0,他引:1  
图像积分图算法在快速特征检测中有着广泛的应用,通过GPU对其进行性能加速有着重要的现实意义。然而由于GPU硬件架构的复杂性和不同硬件体系架构间的差异性,完成图像积分图算法在GPU上的优化,进而实现不同GPU平台间的性能移植是一件非常困难的工作。在分析不同CPU平台底层硬件架构的基础上,从片外访存带宽利用率、计算资源利用率和数据本地化等多个角度考察了不同优化方法在不同GPU硬件平台上对性能的影响。并在此基础上实现了基于OpenCL的图像积分图算法。实验结果表明,优化后的算法在AMD和NVIDIA CPU上分别取得了11.26和12.38倍的性能加速,优化后的GPU kernel比NVIDIA NPP库中的相应函数也分别取得了55.01%和65.17%的性能提升。验证了提出的优化方法的有效性和性能可移植性。  相似文献   

12.
在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了计算机的处理能力。性能测试结果表明,相对于优化后的CPU串行计算,多核CPU-GPU异构并行计算模型有强大的性能优势,特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行,获得了最高可达12倍的计算加速比。  相似文献   

13.
基于混沌优化支持向量机的轧制力预测   总被引:4,自引:0,他引:4  
针对带钢热连轧轧制力的精确预测问题,提出一种基于最小二乘支持向量机模型的预测算法.在分析最小二乘支持向量机数学预测模型的基础上,提出一种改进的结合遗传算法的变尺度混沌优化方法,以进行最优模型参数的搜索,利用实测在线数据对模型进行训练并进行轧制力预测,仿真结果表明,利用该方法可使轧制力预测精度得到提高,平均误差率从BP神经网络的±10%降到±5%以下,为进一步提高热连轧厚度控制精度提供了一种有效方法.  相似文献   

14.
为了加快准化正规化约束(normalized normal constraint,简称NNC)方法求解多目标优化问题的速度,将免疫算法与NNC方法相结合提出了基于免疫算法的NNC方法,简称免疫NNC(IANNC)方法.该方法利用免疫算法中的免疫接种技术,从相邻的乌托邦面上的点对应的单目标优化问题的优化过程中提取疫苗,对初始抗体群进行疫苗接种;使用克隆选择算法求解NNC方法中的单目标优化问题,进而使IANNC方法能够更快的获得多目标优化问题的Pareto解集.之后对IANNC方法的收敛性进行了分析.最后应用IANNC方法对冷连轧轧制规程进行多目标优化,结果表明与基于遗传算法的NNC方法相比,IANNC方法用较少的运行时间获得了更好的冷连轧轧制规程多目标优化问题的Pareto解集.  相似文献   

15.
PMVS(Patch-based Multi-View Stereo)三维重建算法被广泛应用于无人机航拍影像的三维场景重建中。针对PMVS三维重建算法计算量大、时间复杂度高的问题,提出了PMVS算法的CPU多线程和GPU两级粒度并行策略(Multithread and GPU Parallel Schema,MGPS),方法具体包括:基于GPU的PMVS算法特征提取和片面扩散的并行设计;多影像的GPU和CPU任务分配机制,以使得部分任务分配给CPU采用多线程并行,部分任务分配给GPU并行时,程序总运行时间最短。实验采用搭载24核CPU和NVIDIA Tesla K20 GPU的高性能服务器作为测试平台,针对分辨率为4081×2993的16幅无人机影像进行三维重建。实验结果表明,相比串行的PMVS算法,基于MGPS的PMVS算法取得4倍左右的加速比,其中特征提取最高加速13倍,计算误差在10%以内,该方法实现了更高效的PMVS三维重建。基于MGPS的PMVS算法还可用于文物保护、医学图像处理、虚拟现实等领域。  相似文献   

16.
王欣  王康健 《控制工程》2008,15(3):239-241
冷连轧中的参数预计算是一个非常复杂的模型系统,根据轧制的带钢数据,为轧制过程提供各种参数设定值。通过研究现场原有系统的计算模型和算法,分离出了用于各种模型参数的系数计算的神经网络结构和功能,从理论上研究了改进神经网络训练样本数据库和结构的方案。离线计算实验结果表明,酸轧参数自适应计算中的神经网络设计和应用,有效地改进了传统轧制模型的计算精度,对于提高带材的板形质量和性能具有重要作用。  相似文献   

17.
改进权重自适应GA及冷连轧轧制规程多目标优化   总被引:4,自引:1,他引:3  
针对聚合多目标优化方法的权重难以确定的问题,提出了一种改进的权重自适应方法,并以遗传算法为基础对冷连轧轧制规程进行多目标优化.首先,结合某冷轧厂实际的轧制规程优化过程,选取等功率裕量、轧制能耗及带钢打滑概率作为优化目标,建立了冷连轧轧制规程的多目标优化模型.然后将改进的权重自适应遗传算法(GA)应用于不同规格的带钢轧制规程多目标优化中,结果表明,与实际应用的轧制规程相比,该方法有效的降低了3个目标函数的值;与权重自适应GA相比,改进的权重自适应GA的针对性更强,同时重要性高的目标收敛速度更快.  相似文献   

18.
针对聚合多目标优化方法的权重难以确定的问题, 提出了一种改进的权重自适应方法, 并以遗传算法为基础对冷连轧轧制规程进行多目标优化. 首先, 结合某冷轧厂实际的轧制规程优化过程, 选取等功率裕量、轧制能耗及带钢打滑概率作为优化目标, 建立了冷连轧轧制规程的多目标优化模型. 然后将改进的权重自适应遗传算法(GA)应用于不同规格的带钢轧制规程多目标优化中, 结果表明, 与实际应用的轧制规程相比, 该方法有效的降低了3个目标函数的值; 与权重自适应GA相比, 改进的权重自适应GA的针对性更强, 同时重要性高的目标收敛速度更快.  相似文献   

19.
图像重映射(Remap)算法是典型的图像变化算法。在图像放缩、扭曲、旋转等领域有着广泛的应用。随着图片规模和分辨率的不断提高,对图形映射算法的性能提出了越来越高的要求。本文在充分考虑不同GPU平台硬件体系结构差异的基础上,系统研究了在OpenCL框架下图像映射(Remap)算法在不同GPU平台上的高效实现方式。并从片外内存访存优化,向量化计算,减少动态指令等多个优化角度考察了不同优化方法在不同GPU平台上对性能的影响,提出了在不同GPU平台间实现性能移植的可能性。实验结果表明,优化后的算法在不考虑数据传输时间的前提下,在AMD HD5850GPU上相对于CPU版本取得114.3~491.5倍的加速比,相对于CUDA版本(现有GPU算法的实现)得到1.01~1.86的加速比,在NIVIDIA C2050 GPU上相对CPU版本取得100.7~369.8倍的加速比,相对于CUDA版本得到0.95~1.58的加速比。有效验证了本文提出的优化方法的有效性和性能可移植性。  相似文献   

20.
扩展T-S模糊模型的PSO神经网络优化算法   总被引:2,自引:1,他引:1       下载免费PDF全文
针对机械设备具有模糊性和非线性的特点,提出了一种利用扩展T-S模糊模型的,自适应PSO算法和BP神经网络相结合的新型智能结构优化算法。通过自适应的高斯函数来更改基本T-S模糊模型中的隶属度函数,进而使用扩展的T-S模糊模型来调整PSO算法的参数。以BP 神经网络隐含层神经元数目为设计变量,提取训练后的均方误差作为评价函数,用改进后的粒子群算法进行寻优。把优化后的网络模型应用于轮盘结构优化中,实验表明,该方法在保证轮盘性能的同时,对其结构进行了重新优化,是一种可行的结构优化方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号