基于强化学习的四旋翼无人机控制律设计 |
| |
作者姓名: | 梁晨 刘小雄 张兴旺 黄剑雄 |
| |
作者单位: | 西北工业大学自动化学院,西安710072;西北工业大学自动化学院,西安710072;西北工业大学自动化学院,西安710072;西北工业大学自动化学院,西安710072 |
| |
基金项目: | 航空科学基金资助( 201905053003);陕西省飞行控制与仿真技术重点实验室资助 |
| |
摘 要: | 目前四旋翼无人机大部分都采用经典控制方法进行控制律的设计,然而控制参数的选择和对被控对象数学模型的依赖一直是经典控制方法设计中需要克服的问题;针对此问题,采用了一种基于深度强化学习算法Deep Q Network的无人机控制律设计方法,以四旋翼姿态角和姿态角速率作为三层神经网络的输入数据,最终输出动作值函数,再根据贪婪策略进行动作的选取,通过与环境的不断交互,智能体根据奖惩信息来更新神经网络的权值,使得智能体朝着获得累积回报最大值的方向选取动作;仿真结果表明在经过强化学习训练之后,四旋翼姿态角能够快速准确地跟踪上参考指令的变化,证明了基于强化学习的四旋翼无人机控制律的可行性,从而避免了传统控制方法对控制参数的选择与控制模型的依赖。
|
关 键 词: | 强化学习(RL) 四旋翼无人机 控制律 |
收稿时间: | 2020-06-13 |
修稿时间: | 2020-07-08 |
本文献已被 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机测量与控制》浏览原始摘要信息 |
|
点击此处可从《计算机测量与控制》下载全文 |
|