基于异步优势执行器评价器的自适应PID控制 |
| |
引用本文: | 段友祥,任 辉,孙歧峰,闫亚男.基于异步优势执行器评价器的自适应PID控制[J].计算机测量与控制,2019,27(2):70-73. |
| |
作者姓名: | 段友祥 任 辉 孙歧峰 闫亚男 |
| |
作者单位: | 中国石油大学华东计算机与通信工程学院,,, |
| |
基金项目: | “十三五”重大专项(No.2017ZX05009-001 No.2016ZX05011-002);中央高校基本科研业务费(No.18CX02020A) |
| |
摘 要: | 自适应PID较好地解决了传统PID无法自整定参数的问题,已成为控制领域内的研究热点。研究基于异步优势执行器评价器(Asynchronous Advantage Actor-Critic,A3C)算法设计了一种新的自适应PID控制器。该控制器利用A3C结构的多线程异步学习特性,并行训练多个执行器评价器(Actor-Critic,AC)结构的智能体,每个智能体采用多层前馈神经网络逼近策略函数和值函数实现在连续动作空间中搜索最优的参数整定策略,以达到最佳的控制效果。与已有的多种自适应PID控制器性能对比分析结果表明该方法具有收敛速度快,自适应能力强的特点。
|
关 键 词: | 深度强化学习 异步优势执行器评价器 自适应PID |
收稿时间: | 2018/7/23 0:00:00 |
修稿时间: | 2018/8/18 0:00:00 |
The adaptive PID controller based on Asynchronous Advantage Actor-Critic learning |
| |
Abstract: | |
| |
Keywords: | deep reinforcement learning Asynchronous Advantage Actor-Critic adaptive PID control |
|
| 点击此处可从《计算机测量与控制》浏览原始摘要信息 |
|
点击此处可从《计算机测量与控制》下载全文 |
|