首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
郭锐  彭军  吴敏 《计算机工程与应用》2005,41(13):36-38,146
增强学习属于机器学习的一种,它通过与环境的交互获得策略的改进,其在线学习和自适应学习的特点使其成为解决策略寻优问题有力的工具。多智能体系统是人工智能领域的一个研究热点,对于多智能体学习技术的研究需要建立在系统环境模型的基础之上,由于多个智能体的存在,智能体之间的相互影响使得多智能体系统高度复杂,多智能体系统环境属于非确定马尔可夫模型,因此直接把基于马尔可夫模型的增强学习技术引入多智能体系统是不合适的。论文基于智能体间独立的学习机制,提出了一种改进的多智能体Q学习算法,使其适用于非确定马尔可夫环境,并对该学习技术在多智能体系统RoboCup中的应用进行了研究,实验证明了该学习技术的有效性与泛化能力,最后简要给出了多智能体增强学习研究的方向及进一步的工作。  相似文献   

2.
文章在矩阵寻优法的基础上加入了启发信息要素,提出了一种改进的动态寻优算法。文中给出了算法的基本过程与实现方法,并对启发信息的合理性予以论述。最后以城市交通仿真系统为平台,通过实验给出了此算法与全动态Dijkstra算法的性能比较,分析结果证实了改进矩阵算法方法具有较高的速度,验证了该方法的正确性和有效性。  相似文献   

3.
本文针对某钢厂的冷连轧机的厚调系统是否调到最佳状态,采用离散相似法以第一、二机架为例进行了数字仿真;采用单纯形法进行了参数寻优。文中还简介了仿真的离散相似法和最优化的单纯形法以及其应用中的有关问题,并给出了程序框图。  相似文献   

4.
孙增圻 《自动化学报》1987,13(5):397-400
本文给出了连续系统中计算二次型性能函数对反馈系数阵的一阶和二阶灵敏度的全套公式.它们可用于选择部分重要的状态反馈及部分状态反馈次优控制的梯度法寻优计算.  相似文献   

5.
本文将时间乘子二次型指标用于MINIMAX指标最优输出反馈调节器的设计,并对设计的闭环系统进行仿真研究。结果表明,文献[1]—[6]中关于在二次型指标中引入时间乘子后可降低系统超调的论述不完全正确。  相似文献   

6.
本文讨论的是PID优化控制系统中寻技术改造指标的选定问题.本文从指标的实用性和选择性两方面对各种寻优指标及过渡过程品质指标的比较,认为选用ITAE寻优指标,寻优PID控制参数比较理想,使用起来较方便.  相似文献   

7.
最优二次型渐近设计法及其应用   总被引:1,自引:0,他引:1  
本文探讨了用闭环系统预期特征值及特征向量确定加权阵,及依靠最优调节器的渐近特性确定Riccati代数方程迭代解起始阵的方法.据此提出了线性系统最优二次型渐近设计法,编写了设计程序,实验结果表明方法是可行的.  相似文献   

8.
遗传算法中参数选取及其在数据全局寻优中的应用   总被引:2,自引:0,他引:2  
对基于遗传算法的基本原理及其关键参数的选择进行了讨论,提出了遗传进化的选择过程中使用的淘汰率和保护率的改进方案,并分析了两类参数的选择对遗传算法收敛速度的影响,最后通过将其与Matlab软件结合,实现遗传算法在数据全局寻优中的应用。  相似文献   

9.
提出一种基于二次型运算和BP算法的计算神经网络模型.通过将输入向量分为若干等份的子向量,并运用二次型运算解决多线性空间的相互区分问题,消除了输入-隐含层的复杂网状连接结构,突出隐含神经元物理意义,从而实现了对传统三层BP神经网络结构的设计改进. 试验对比结果显示,经过改进的模型较标准BP收敛更快并且稳定.  相似文献   

10.
依照物体的电磁辐射特点,建立了针对不同地物的毫米波辐射特性数据库。该数据库可为仿真系统提供定标数据,可保存各类分析和计算结果。  相似文献   

11.
LQ最优控制系统加权矩阵Q的一种数值算法   总被引:6,自引:1,他引:6  
王耀青 《控制与决策》2000,15(5):513-517
利用LQ最优控制逆问题的参数化解,将求解对称、非负定加权矩阵Q的问题变为一类F-范数优化问题,给出一种求解LQ最优控制指标函数中的加权矩阵Q的简便而系统的方法。算法的优点在于任意给定一组自变量,通过解这类优化问题就可求得满足闭环特征要求的加权矩阵Q,而且具有良好的收敛性。  相似文献   

12.
林杰  万百五 《自动化学报》1988,14(6):401-408
本文研究了线性稳态大系统优化与控制问题中的二次等价性原理,证明了非退化的线性规划问题可以等价为正定二次规划问题,线性稳态控制问题可以等价为具有线性约束二次凸目标的稳态控制问题.基于等价性原理,本文提出了点凸化技术(PCT),用于凸化不能应用关联平衡法(IBM)的线性问题,最后给出应用例子,说明PCT在求解线性稳态大系统优化与控制问题中的应用.  相似文献   

13.
随机服务系统一般模型的仿真和应用   总被引:1,自引:0,他引:1  
本文提出了多服务台随机服务系统的一般模型,给出了仿真框图及通用计算程序.对某些系统的仿真结果进行理论分析和计算.分析表明:对有理论计算公式的系统,理论值和仿真结果基本一致;对难以用解析理论加以处理的系统,计算机仿真可提供数值解.最后介绍了该仿真模型在机械加工自动线设计中的应用.  相似文献   

14.
如图1曲线②所示,式(1)对应曲线①.由图1知,近似开关线②也可使系统快速无超调.但实际系统参数既测不准又不断漂移,为确保系统稳定工作在最优状态,本文给出了近似开关线与自寻最优相结合的方法:若由于某种原因实际近似开关线偏离为曲线③(图1),则在A′点切换后,状态将沿轨线④运动到c点,出现终端偏差△=oc,△值将被计算机检测并记忆.因曲线④与①几乎“平行”,故可用△来修正开关线,使h(ε—△,ε,r)=0,即把曲线③右移△并作为下次使用的开关线,使系统重获最优;反之,若实际开关线向右偏离,则h(ε+△,ε,r)=0.这样,系统借助微机可自寻最优开关线. 调速系统中,与电流相应的状态坐标是受限的.受限时最速控制综合函数为u~*(ε)  相似文献   

15.
邹左军  刘希 《自动化学报》1986,12(4):406-409
本文根据城市交通系统的特点,采用多级自寻最优控制方法1),设计了一种新型的城市交通控制方案.通过单点控制这一子系统的有效性的仿真实验及实地验证,说明其效果显著.  相似文献   

16.
控制系统最经济结构综合的应用研究   总被引:2,自引:0,他引:2  
本文从系统的机理分析和工程应用的角度,研究了控制系统最经济结构综合的物理意义和应用价值,提出了控制系统指定最经济结构的综合问题.通过对纸机控制系统最经济结构的综合和工程实施,表明综合的系统不仅投资少、性能好,而且结构简化,使系统便于实施和维修,提高了系统的可靠性和运转率.  相似文献   

17.
本文介绍由DJS-8数字机和HMJ-200模拟机组成的数模混合系统的特点以及它在自动飞行控制系统仿真研究中的应用.并通过一应用实例进一步说明了它的应用情况.  相似文献   

18.
赵希人 《自动化学报》1985,11(3):316-324
本文详细地分析了把卡尔曼滤波器用于船用惯导系统的问题.文中给出了简化状态方程的条件,提出了测定常值漂移的统计公式及卡尔曼滤波器用于惯导系统的一种工程方案,并给出了仿真结果.  相似文献   

19.
应用自校正滤波器的动态船舶定位系统设计   总被引:2,自引:0,他引:2  
海洋石油钻探船或考察船的动态定位控制系统需要有消除波浪运动影响的滤波器.本文提出了一个综合自校正滤波器和Kalman滤波器的方案以满足这一要求.用Kalman滤波器处理低频运动,用自校正滤波器处理高频运动以修正低频估计值,因此只需进行不太多的计算就可达到提高调节精度的目的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号