期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	2篇
免费	0篇
国内免费	1篇

专业分类

一般工业技术	1篇
自动化技术	2篇

出版年

2015年	1篇
2009年	1篇
2002年	1篇

排序方式： 共有3条查询结果，搜索用时 456 毫秒

Keepaway抢球任务中基于策略重用的迁移学习算法

李学俊陈士洋张以文李龙澍《计算机科学》2015,42(4):190-193, 225

在RoboCup Keepaway中,球员使用强化学习能获得很好的高层策略.然而由于Keepaway任务的状态空间巨大,强化学习需要探索很多步才能收敛,学习过程十分耗时.针对这一问题,对于5v4规模的Keepaway任务,将策略重用技术应用于抢球球员高层决策的强化学习中,以实现迁移学习.首先合理设计了球员在4v3和5v4任务间的迁移学习方案及状态与动作空间的映射,然后提出了基于策略重用的迁移学习算法.实验表明,对于5v4任务,在训练时间约束下,迁移学习比强化学习获得了更短的任务完成时间和更高的抢断成功率,从而学习到了较优的高层策略.因此,为达到相同策略水平,迁移学习所需的训练时间明显比强化学习少. 相似文献

复杂包装专色设计中的工艺探讨 总被引：5，自引：5，他引：0

顾桓《包装工程》2002,23(2):46-47,50

分析了在复杂的包装专色设计中所涉及到的印前技术，提出了使用CorelDRAW进行相应处理的有效工艺方法。相似文献

基于多智能体强化学习的新强化函数设计

左国玉张红卫韩光胜《控制工程》2009,16(2)

为了提高强化学习算法在多智能体系统中的性能表现,针对典型的多智能体系统一Keepaway平台总是以失败告终的特点,受与之有相同特点的单智能体系统杆平衡系统所采用强化函数的启发,重新设计一种新的惩罚式的强化函数.新的强化函数在系统成功状态时设零值奖赏,失败状态时给与负值惩罚.基于新设计的强化函数的Sarsa(A)算法成功应用在Keepaway平台上.仿真结果表明,新设计的强化函数在一定参数条件下有效提高了强化学习算法栽Keepaway平台的性能表现.其最终的学习效果更好. 相似文献