基于人机交互的强化学习与实验研究 |
| |
引用本文: | 刘芳,苏剑波,席裕庚. 基于人机交互的强化学习与实验研究[J]. 模式识别与人工智能, 2003, 16(3) |
| |
作者姓名: | 刘芳 苏剑波 席裕庚 |
| |
作者单位: | 上海交通大学,自动化系,智能机器人系统与技术研究中心,上海,200030 |
| |
摘 要: | 本文研究具有人机交互能力的强化学习算法.通过人机交互给出操作者对学习结果的性能评价,智能体系统能获得当前状态与目标状态距离的度量,有效地结合操作者的先验知识和专业知识,从而使智能体在状态空间中能进行更有效的搜索,简化复杂任务的学习过程.以猜数字游戏为例,利用提出的学习框架训练智能体具有猜数字的能力.实验结果表明,结合人机交互的强化学习算法大大提高了学习效率.加快了学习过程的收敛速度.
|
关 键 词: | 强化学习 人机交互 资格迹 |
HCI-BASED REINFORCEMENT LEARNING ALGORITHM AND EXPERIMENT |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|