排序方式: 共有9条查询结果,搜索用时 15 毫秒
1
1.
2.
Q学习算法是一种最受欢迎的模型无关强化学习算法.本文通过对Q学习算法进行合适的扩充,提出了一种适合于多agent协作团队的共享经验元组的多agent协同强化学习算法,其中采用一种新的状态行为的知识表示方法使得状态行为空间得到缩减,采用相似性变换和经验元组的共享使得学习的效率得到提高.最后将该算法应用于猎人捕物问题域.实验结果表明该算法能够加快多个猎人合作抓捕猎物的进程,有利于协作任务的成功执行,并能提高多agent协作团队的协作效率,因此该算法是有效的. 相似文献
3.
4.
5.
复杂维修系统的动力学行为仿真 总被引:1,自引:0,他引:1
装备维修系统是复杂的动力学系统,其不同构成之间的相互作用导致维修系统的动态变化。从信息的角度看,维修需求的变化是驱动整个系统运作的关键,从而为实现维修系统的有效管理和控制,必须深入理解维修系统变化的内在动力学行为,特别是系统的暂态行为。系统仿真方法为分析暂态行为提供了可能,为此论文考虑了两级维修体制下一类装备的维修系统,分析了其运作过程并由此设计和实现了相应的仿真框架和算法。算例的仿真结果表明了仿真框架和算法的有效性,并揭示了传统随机过程方法所未能展示的维修系统的非线性动力学行为。 相似文献
6.
研究了多阶段任务下包含多种维修策略的复杂维修系统的动力学行为问题,通过分析系统的状态转移,基于补充变量方法和密度演化思想,建立了以状态概率密度表示的系统动态行为的偏微积分方程,给出了以装备可用度和维修活动发生频度为指标的维修系统效能的计算表达式,探讨了与此相关的装备小修次数优化过程。由于密度演化方法兼顾了装备维修系统的微观和宏观两个层次,可用于描述和分析维修系统的运作过程,分析得到的状态概率密度信息能解释系统的运作规律,从而可用之于实现维修系统的优化和控制。 相似文献
7.
文章阐述了小绞车安装固定的重要性,并详细介绍了各种轨道运输小绞车安装固定的技术要求,认为轨道运输小绞车的固定关系到煤矿辅助运输的安全,必须加强小绞车安装固定过程的施工控制,才能消除掩蔽工程的质量隐患,保证运输安全。 相似文献
8.
本文针对一类追求系统得益最大化的协作团队的学习问题,基于随机博弈的思想,提出了一种新的多Agent协同强化学习方法。协作团队中的每个Agent通过观察协作相识者的历史行为,依照随机博弈模型预测其行为策略,进而得出最优的联合行为策略。 相似文献
9.
以下一代自动测试系统为研究对象,介绍了它的研制背景,分析了自动测试系统体系结构的开放性要求;简述了关键单元的筛选标准和发展过程,指出了基于关键单元建立的开放式体系结构的意义;研究了硬件结构组成及测试程序集的开发和运行的技术模型,说明了敏捷快速全球作战保障演示验证项目和关键单元的标准制定情况,为我军发展下一代自动测试系统提供参考. 相似文献
1