基于驾驶员模型的六足机器人自主 / 协同决策 |
| |
引用本文: | 陈潇磊,尤 波,李佳钰,丁 亮,董 正.基于驾驶员模型的六足机器人自主 / 协同决策[J].仪器仪表学报,2023,44(4):91-100. |
| |
作者姓名: | 陈潇磊 尤 波 李佳钰 丁 亮 董 正 |
| |
作者单位: | 1. 哈尔滨理工大学黑龙江省复杂智能系统与集成重点实验室,2. 哈尔滨理工大学先进制造智能化技术教育部重点实验室;3. 哈尔滨工业大学机器人技术与系统国家重点实验室 |
| |
基金项目: | 国家自然科学基金青年项目(51905136)、国家自然科学基金面上项目(52175012)、国家自然科学基金重点项目(91948202)资助 |
| |
摘 要: | 重载六足机器人在野外地形环境移动作业时的决策智能水平亟待提高。然而,当机器人在尚未形成合理的决策结构层次时,直接采用其与环境进行交互方式进行常规的强化学习训练,将导致机器人的行为决策过于发散。因此,本文首先利用一种符合驾驶员决策逻辑的分步训练神经网络,得到驾驶员的决策经验模型,使机器人快速形成自主决策智能。此外,为融合人机决策优势,本文基于合作博弈理论,提出一种消除人机协同决策指令冲突的方法。搭建面向重载六足机器人人机协同决策的半物理仿真实验系统,开展实验的结果表明,机器人通过学习驾驶员先验模型和自主训练,其决策效果可接近驾驶员决策水平,同时人机协同决策指令可有效弥补单智能体决策指令的缺陷,在规则沟壑地形下协同决策指令的碰撞率指标优于驾驶员单智能体指令23.8%,障碍地形下协同决策指令的能量消耗指标优于机器自主单智能体指令34.1%。
|
关 键 词: | 六足机器人 协同决策 驾驶员先验模型 半物理仿真 神经网络 |
|
| 点击此处可从《仪器仪表学报》浏览原始摘要信息 |
|
点击此处可从《仪器仪表学报》下载全文 |
|