排序方式: 共有12条查询结果,搜索用时 187 毫秒
1.
基于多Agent的并行Q-学习算法 总被引:1,自引:0,他引:1
提出了一种多Agent并行Q-学习算法.学习系统中存在多个Agent,它们的学习环境、学习任务及自身功能均相同,在每个学习周期内,各个Agent在各自独立的学习环境中进行学习,当一个学习周期结束后,对各个Agent的学习结果进行融合,融合后的结果被所有的Agent共享,并以此为基础进行下一个周期的学习.实验结果表明了该方法的可行性和有效性。 相似文献
2.
3.
主动的障碍物探测与避障行为控制一直是自主机器人的重点研究课题.在以往的研究中,机器人的视觉系统与电动机驱动系统住往是各自独立的构成控制体系,人们很少关注它们之间的关系,这样就从本质上割裂了两者之间的紧密耦合关系,减少了获取更多信息的途径.本文主要研究如何建立机器人视觉与电动机驱动系统关系的视觉与行为模型,通过这种紧密的耦合关系为机器人运动提供更丰富的信息来源.此外,在该模型的基础上引入了强化学习,引导机器人进行动态避障.实验表明该方法是可靠的,能够满足实时性要求. 相似文献
4.
彩色目标检测过程中由于环境光照的变化以及分布不均匀会造成物体反射光的改变,使得检测效率降低.彩色目标检测中最常见的光照影响是光照强度的改变和检测区域强度分布不均匀.本文对颜色生成基本过程进行考察,发现在很多应用中可以用简单的的DELTA函数近似传感器的响应函数.在此基础上用一个有限维向量量化光照变化,对像素进行补偿,提高对光照变化的适应能力.并用实际应用结果说明其合理性. 相似文献
5.
采购绩效领先者的成功准则 总被引:5,自引:0,他引:5
企业的赢利能力的提升,从本质来讲分为两个方面:"开源"与"节流";开源意味着创新,开发新的产品、新的技术、开辟新的市场.节流意味着"挖潜",有效的细化与控制企业各环节的成本. 相似文献
6.
7.
8.
9.
提出一种新的移动机器人泊位方法. 该方法采用一幅预先采集的参考图像定义机器人的期望泊位状
态(期望的位置和方向),利用尺度不变特征变换(SIFT)算法和基于双向BBF 的特征匹配算法实现泊位站当前图
像与参考图像之间的匹配以获取视觉反馈信息,基于极点伺服策略根据参考图像准直机器人,采用质心跟踪法防止
目标图像出视场,采用RANSAC 算法求解当前图像与参考图像间的仿射变换,利用一个末段控制策略实现精确泊
位.本文方法不需要环境模型或人工标记.室内环境下的实验结果证实了该方法的有效性. 相似文献
10.