首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
针对模型自由的随机线性离散时间系统,通过Q 学习算法求解无限时间随机线性二次最优控制问题。首先根据贝尔曼最优性原理定义Q函数,通过值迭代算法的思想构造Q 学习算法;其次给出Q 学习算法的等价形式并证明其收敛性;最后通过一个仿真实例说明Q 学习算法的有效性。  相似文献   

2.
本文是在研究“随机经济系统最优预测”、“动态投入产出与经济系统最优控制”等问题基础上,进一步研究随机经济系统的最优估计与最优控制问题,利用Kalmao现代滤波理论导出了随机线性经济系统状态的最优估计,利用Bellman动态规划原理导出了线性二次经济系统的最优控制规律。由估计定理及最优控制律给出了随机线性经济系统最优估计与最优控制的一套算法。最后给出一个随机经济计划的例子。  相似文献   

3.
研究了一类连续时间广义随机仿射系统的线性二次(Linear Quadratic, LQ)控制问题.在定义了广义随机系统稳定性的相关概念后,通过一个线性矩阵不等式(Linear Matrix Inequality, LMI)给出了系统稳定性的条件.然后,利用Riccati方程法分别研究了有限时间广义随机仿射系统的LQ问题和无限时间广义随机系统的LQ问题,得到了有限时间最优反馈控制的存在条件等价于一个推广的微分Riccati方程和一个推广的倒向微分方程存在解,而对应的无限时间最优反馈控制的存在条件等价于一个推广的代数Riccati方程存在解,同时给出了最优反馈控制的显式表达及最优性能指标值.  相似文献   

4.
对于LQR(具有二次型性能指标的线性最优调节器)问题,求解最优控制律的关键在于求解黎卡堤方程.但对于时变系统,其求解变得相当复杂,从而影响了它的实际应用.本文提出用移位雅可比正交多项式求解,通过直接计算最优反馈律K(t)所需的状态转移矩阵,获得了一个计算K(t)的新方法,它将一个增广型的状态方程转化为一个简单的矩阵代数方程,从而避开了黎卡堤方程求解的困难,并使计算大为简化。  相似文献   

5.
研究了状态方程中有乘性噪声,并且观测有时滞的随机双线性系统二次滤波器设计问题。因乘性噪声导致系统参数矩阵具有随机性,并且观测方程有时滞,无法直接采用经典的Kalman滤波方法,所以本研究基于Kronecker代数方法,首先将原系统转化为包含原系统状态和观测及其二阶Kronecker积的线性增广系统;然后基于新息重组方法将增广系统转化为无时滞系统,并利用投影定理得到增广系统系统的线性最优滤波器;最后提取增广状态估计的前n个分量,从而得到原系统的二次最优滤波器。仿真结果表明该滤波器与现有的线性最优滤波器相比,估计精度提高27%,整体性能有较大提高。  相似文献   

6.
多元伪线性回归系统部分耦合多新息随机梯度类辨识方法   总被引:8,自引:0,他引:8  
针对多元伪线性滑动平均系统,讨论了多元增广随机梯度算法,为减小算法的计算量,将系统分解为一些子系统,给出了子系统增广随机梯度算法,利用耦合辨识概念和多新息辨识理论,推导了部分耦合(子系统)增广随机梯度算法、部分耦合(子系统)多新息增广随机梯度算法.进一步将提出的方法推广到多元伪线性自回归滑动平均系统,给出了部分耦合(子系统)广义增广随机梯度算法、部分耦合(子系统)多新息广义增广随机梯度算法.文中分析了多元增广随机梯度算法、部分耦合增广随机梯度算法、部分耦合多新息增广随机梯度算法的计算量.  相似文献   

7.
针对传统算法求解随机线性互补问题时需要给定初始点、计算梯度,并且解不唯一时无法获得多个最优解的困难,提出了求解随机线性互补问题的社会认知算法.将随机线性互补问题转化为含有随机变量的约束优化问题,并通过平均抽样逼近该随机约束优化问题,利用社会认知算法求解该优化问题.数值试验结果表明社会认知算法是求解随机线性互补问题的有效算法.  相似文献   

8.
建立了受控柔性转子系统在随机激励下的状态空间模型.基于线性二次型高斯控制和Kalman-Bucy滤波器理论,提出了在不完全状态信息条件下,转子系统在白噪声和有色噪声激励下振动主动控制的随机最优策略.以一个双盘悬臂柔性转子 轴承系统为例,通过数值方法研究了在El.Centro地震激励作用下采用随机最优策略对转子 轴承系统进行振动主动控制的有效性,并讨论了在性能指标中不同权函数对控制效果的影响.结果表明,提出的随机最优控制策略能够有效抑制转子系统的振动,控制效果随着与位移和速度相关的权矩阵Q中对应元素的增大而变好,随着与控制相关的权矩阵R中对应元素的增大而变差.  相似文献   

9.
目的研究在状态空间模型中的状态及控制矩阵中含有范数有界参数不确定线性离散系统的最优保价静态输出反馈控制问题. 方法给出了系统二次代价指标的一个上界,并利用拉格朗日乘子法优化了该界. 结果与结论给出了保证闭环系统二次稳定且使得二次代价指标界达到最小的静态输出反馈控制器存在的充分条件. 并提供了一个求解输出反馈增益的数值算法.  相似文献   

10.
研究了一类连续时间广义随机系统的多人Nash微分博弈问题.在定义了广义随机系统稳定性的相关概念后,通过一个线性矩阵不等式(linear matrix inequality, LMI)首先给出了系统稳定性的条件.然后,研究了有限时间和无限时间的广义随机系统的多人Nash微分博弈,利用Riccati方程法得到了均衡策略的存在条件等价于耦合的微分或代数Riccati方程存在解,并给出了均衡策略的显式表达及最优性能指标值.最后,将所得的结果应用于现代鲁棒控制中的随机H2/H控制问题,得到了鲁棒控制策略的存在条件及显式表达.  相似文献   

11.
通过对有限时间二次型最优调节器设计中矩阵Riccati微分方程的离散化,将微分方程化为代数方程。并将离散化后的代数方程通过变换使之成为矩阵Riccati代数方程的形式,利用MATLMI控制系统工具箱中计算无限时间二次型最优调节器的lqr()函数,编程求解各离散时刻的矩阵Riccati代数方程,从而得到矩阼Riccati微分方程的数值解以及二次型最优调节器最优控制的数值解.  相似文献   

12.
为了克服轮式移动机器人响应能力的有限性、保证轮式移动机器人快速跟踪给定的参考轨迹,本文充分利用预演信息(即提前获取的将来参考信息),设计预演控制策略、调节轮式移动机器人的驱动电压来控制机器人,使其快速跟踪给定的参考轨迹.首先,针对运动学模型设计虚拟控制器以保证轮式移动机器人能够渐近跟踪给定的参考轨迹.其次,建立了虚拟控制器的离散时间线性状态空间模型.再次,基于轮式移动机器人的动力学模型和虚拟控制器的线性模型,将轨迹跟踪控制问题等价转化成一个具有已知输入的线性二次调节问题.最后,基于Riccati方程的解,给出了最优预演控制策略的反馈增益.事实上,本文所提出的为虚拟控制器建立线性状态空间模型的方法适用于任意离散信息,这极大地方便了信息的处理与提前使用;另一方面,由于提前使用了参考信息,本文所提的预演控制策略能够快速地跟踪给定的参考轨迹.仿真实验以类正弦曲线为参考轨迹进行跟踪,结果表明:所提控制策略能使轮式移动机器人的速度与轨迹跟踪误差快速地趋于零,验证了所提预演控制算法的有效性.  相似文献   

13.
为更好地解决系统参数摄动和外负荷扰动等不确定性因素下离合器接合轨迹可变性及其跟踪偏差带来的接合过程问题,提出了离合器接合轨迹的优化及跟踪控制方法. 以装载机V型工况重载后退换挡中离合器接合过程为研究对象,建立冲击度和滑磨功相结合的二次型性能指标泛函,在干扰矩阵有参数化表达的非平稳随机项下,通过构造Hamiltonian函数并依据Pontryagin极大值原理和解析Riccati微分方程,得到时变最优控制律和权重系数调整下的可变扭矩最优轨迹;为提高非线性特性执行机构参数摄动下最优轨迹的跟踪精度,将接合过程品质优化问题转化为轨迹跟踪的单一目标问题,采用指数趋近律滑模控制方法设计的控制器实现了跟踪误差在0.3%以内的精准跟踪,用Lyapunov理论对其进行了稳定性分析. 数值仿真结果表明,该控制方法降低了离合器接合冲击度及滑磨功,有助于提高离合器接合过程品质,对解决同类问题具有理论性工程参考价值.  相似文献   

14.
研究了带有乘性噪声的线性时滞系统的局部最优预报估计和全局最优线性加权信息融合问题。 通过虚拟噪声补偿技术,将该问题转化为一类带有未知时变噪声的随机系统的状态最优估计问题。基于等价系统的新息重组分析及Hilbert空间上的投影定理,给出局部最优预报器设计,进而通过求解与各单传感器子系统有相同维数的Riccati方程得到多传感器分布式全局最优加权信息融合算法。与集中式融合估计算法相比,该方法无需扩维。最后通过一个仿真实例证明该算法的有效性。  相似文献   

15.
对有领导者的异构离散多智能体系统的最优一致性问题,提出了一种无模型的基于非策略强化学习的控制协议设计方法。由于异构多智能体系统的状态矩阵不同,其局部邻居误差的动态表达式比较复杂。与现有的多智能体系统分布式控制方案相比,所提算法减少了计算的复杂性。首先,建立由增广变量构造的多智能体系统全局邻居误差动态表达式。其次,通过二次型形式的值函数得到耦合贝尔曼方程和Hamilton?Jacobi?Bellman(HJB)方程。再次,求解耦合HJB方程的最优解,得到多智能体最优一致性的纳什均衡解,并给出纳什均衡证明。从次,基于无模型的非策略Q学习算法,求解多智能体最优一致性的纳什均衡解。最后,利用批判神经网络结构,结合梯度下降法实现了所提出的算法,并通过仿真实例验证了算法的有效性。  相似文献   

16.
文章在完备的金融市场下,构造了带有负债和风险资产的连续时间的均值一方差投资组合选择模型。假定风险资产的价格过程由布朗运动加跳所驱动,而负债的价格过程则是由带有漂移的布朗运动驱动,并且考虑风险资产与负债之间的关系。其最终的目标是最大化期望终端财富同时最小化其方差。在连续时间的情形下,运用随机最优控制理论解决资产与负债的管理问题。即,通过使用一般的随机线性二次控制方法得到最优控制策略。  相似文献   

17.
为了减小随机激励作用下转子系统的振动, 提出了一种用于振动控制的随机最优控制策略.基于线性二次型高斯控制理论, 给出了转子系统在白噪声激励作用下振动控制的随机最优控制规律,并通过成形滤波器把有色噪声变为白噪声,得到了有色噪声激励作用下的随机最优控制规律. 通过求解方差方程,用数值方法对对随机激励作用下的转子系统的位移响应方差进行了研究.结果表明, 该控制策略作用下转子圆盘中心的位移响应方差仅为没有控制策略作用下对应位移响应方差的16.7%. 该控制策略能够有效地抑制转子系统的振动. 转子圆盘中心的位移响应方差随着随机激励功率谱密度的增大而增大.  相似文献   

18.
0 INTRODUCTIONItisallknownimportanceofcontrolequationsandadjointequationsinproblemofoptimalcontrol .General ly ,controlequationsandadjointequationsarefoundbyestablishingHamiltonianfunctionaccordingtoPontryagin’smaximumprinciple .Butitisdifficulttoderivet…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号