基于深度强化学习的人机协作组装任务分配 |
| |
引用本文: | 熊志华,陈昊,王长生,岳明,侯文彬,徐斌.基于深度强化学习的人机协作组装任务分配[J].计算机集成制造系统,2023(3):789-800. |
| |
作者姓名: | 熊志华 陈昊 王长生 岳明 侯文彬 徐斌 |
| |
作者单位: | 1. 大连理工大学汽车工程学院;2. 华晨宝马汽车有限公司;3. 大连理工大学宁波研究院 |
| |
基金项目: | 国家自然科学基金资助项目(52072057)~~; |
| |
摘 要: | 为适应人机协作组装任务分配日趋复杂的任务结构和高维的任务状态空间,提出了一种基于深度强化学习的人机协作组装任务分配方法。首先,将人机协作组装任务分配形式化为强化学习问题,设计了4通道帧图进行任务分配环境状态的表示,并构建了通用化的组装闯关游戏模拟环境。其次,为解决深度Q网络(DQN)算法频繁的情节重启导致探索效率低下的问题,提出了存档机制及其改进算法Archive DDQN(Double DQN),并介绍了利用该算法与模拟环境交互以进行人机协作组装任务分配的流程方法。最后,通过2种不同难度的组装模拟环境进行对比实验,验证了所提出方法的有效性。
|
关 键 词: | 深度强化学习 存档机制 人机协作 任务分配 生产组装 |
|
|