首页 | 本学科首页   官方微博 | 高级检索  
     

动态模糊Q学习算法及嵌入式平台的实时实现
引用本文:卢永奎,许旻,李永新,杜华生,吴月华,杨杰. 动态模糊Q学习算法及嵌入式平台的实时实现[J]. 模式识别与人工智能, 2006, 19(4)
作者姓名:卢永奎  许旻  李永新  杜华生  吴月华  杨杰
作者单位:中国科学技术大学,精密机械与精密仪器系,合肥,230027;中国科学技术大学,精密机械与精密仪器系,合肥,230027;中国科学技术大学,精密机械与精密仪器系,合肥,230027;中国科学技术大学,精密机械与精密仪器系,合肥,230027;中国科学技术大学,精密机械与精密仪器系,合肥,230027;中国科学技术大学,精密机械与精密仪器系,合肥,230027
基金项目:国家高技术研究发展计划(863计划)
摘    要:介绍一种新的在线自适应的动态模糊Q强化学习算法.系统根据从环境中得到的反馈评估已进行的决策,给予奖励和惩罚,更新系统的Q值,在线自动调整模糊控制的结构与参数.根据系统当前的环境状态以及模糊控制强化学习的Q值来决定当前规则的动作输出,并由模糊推理产生连续输出的动作.扩展贪心搜索策略,确保控制规则的各个输出动作在学习初期都被搜索过,避免陷入局部最优解.将有效跟踪算法和后设学习规则相结合,有效提高系统学习速率.在嵌入式平台中实时控制的实现以及和相关研究结论的对比验证该算法的优越性.

关 键 词:模糊控制  在线自组织  Q强化学习  嵌入式系统  实时控制

Dynamic Fuzzy Q-Learning and Its Real-Time Application in Embedded System
LU Yong-Kui,XU Min,LI Yong-Xin,DU Hua-Sheng,WU Yue-Hua,YANG Jie. Dynamic Fuzzy Q-Learning and Its Real-Time Application in Embedded System[J]. Pattern Recognition and Artificial Intelligence, 2006, 19(4)
Authors:LU Yong-Kui  XU Min  LI Yong-Xin  DU Hua-Sheng  WU Yue-Hua  YANG Jie
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号