首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   4篇
  免费   1篇
冶金工业   1篇
自动化技术   4篇
  2010年   1篇
  2007年   2篇
  2006年   1篇
  2005年   1篇
排序方式: 共有5条查询结果,搜索用时 109 毫秒
1
1.
Option的自动发现与生成是递阶再励学习的难点之一,论文提出探索密度检测(ED)法,通过检测状态空间中的探索密度来发现并构建Option。和现有的方法相比具有和任务无关、不需要先验知识等优点;能很好地工作于完全未知的环境中;并且构造出的Option,在同一环境下不同任务间可以直接共享。  相似文献   
2.
在状态空间满足结构化条件的前提下,通过状态空间的维度划分直接将复杂的原始MDP问题递阶分解为一组简单的MDP或SMDP子问题,并在线对递阶结构进行完善.递阶结构中嵌入不同的再励学习方法可以形成不同的递阶学习.所提出的方法在具备递阶再励学习速度快、易于共享等优点的同时,降低了对先验知识的依赖程度,缓解了学习初期回报值稀少的问题.  相似文献   
3.
未知环境下基于传感器的移动机器人路径规划新方法   总被引:13,自引:0,他引:13  
孟江华  朱纪洪  孙增圻 《机器人》2005,27(4):319-324
提出了一种未知环境下机器人在线路径规划算法. 该算法在多数情况下比传统方法更具智能性和灵活性, 并且可以解决无边界环境中单方向无限延伸的障碍物的绕行问题.  相似文献   
4.
针对安钢威金斯气柜调平系统进行改造,确保调平系统的四点一线、六点一面;增加差压式液位计对活塞倾斜度进行实时在线监测。  相似文献   
5.
提出状态探索密度的概念,通过检测状态对智能体探索环境能力的影响来发现学习的子目标并构建对应的Option.用该算法创建Option的再励学习算法能有效提高学习速度.算法具有和任务无关、不需要先验知识等优点,构造出的Option在同一环境下不同任务间可以直接共享.  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号