期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	5篇
免费	1篇
国内免费	27篇

专业分类

电工技术	1篇
机械仪表	1篇
自动化技术	31篇

出版年

2023年	2篇
2022年	3篇
2021年	2篇
2020年	2篇
2019年	1篇
2018年	3篇
2017年	2篇
2016年	2篇
2015年	2篇
2014年	1篇
2013年	7篇
2012年	1篇
2010年	1篇
2009年	3篇
2007年	1篇

排序方式： 共有33条查询结果，搜索用时 93 毫秒

[首页] « 上一页 [1] [2] [3] 4

31.

基于因果建模的强化学习控制:现状及展望

孙悦雯柳文章孙长银《自动化学报》2023,49(3):661-677

基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下(例如存在混杂因子或非平稳环境)评估策略的性能,提升算法的泛化性.本文旨在探讨基于因果建模的强化学习控制技术(以下简称因果强化学习)的最新进展,阐明其与控制系统各个模块的联系.首先介绍了强化学习的基本概念和经典算法,并讨论强化学习算法在变量因果关系解释和迁移场景下策略泛化性方面存在的缺陷.其次,回顾了因果理论的研究方向,主要包括因果效应估计和因果关系发现,这些内容为解决强化学习的缺陷提供了可行方案.接下来,阐释了如何利用因果理论改善强化学习系统的控制与决策,总结了因果强化学习的四类研究方向及进展,并整理了实际应用场景.最后,对全文进行总结,指出了因果强化学习的缺点和待解决问题,并展望了未来的研究方向. 相似文献

32.

基于数据ADP算法的一类带有执行器饱和的未知离散时间系统最优跟踪控制

宋睿卓肖文栋孙长银《自动化学报》2013,39(9):1413-1420

针对一类带有执行器饱和的未知动态离散时间非线性系统, 提出了一种新的最优跟踪控制方案. 该方案基于迭代自适应动态规划算法, 为了实现最优控制, 首先建立了未知系统动态的数据辨识器. 通过引入M网络, 获得了稳态控制的精确表达式. 为了消除执行器饱和的影响, 提出了一个非二次的性能指标函数. 然后提出了一种迭代自适应动态规划算法获得最优跟踪控制的解, 并给出了收敛性分析. 为了实现最优控制方案, 神经网络被用来构建数据辨识器、计算性能指标函数、近似最优控制策略和求解稳态控制. 仿真结果验证了本文所提出的最优跟踪控制方法的有效性. 相似文献

33.

分数阶奇异系统容许性的充分必要条件 总被引：3，自引：0，他引：3

余瑶焦壮孙长银《自动化学报》2013,39(12):2160-2163

探讨了阶数在（0,1）区间的分数阶奇异系统的容许性条件. 文中首先给出了正则性,无脉冲性和容许性的定义,然后给出了分数阶奇异系统容许性的充分必要条件,最后通过数值仿真的例子来说明我们给出的容许性条件. 相似文献

[首页] « 上一页 [1] [2] [3] 4