排序方式: 共有2条查询结果,搜索用时 15 毫秒
1
1.
针对双足机器人行走过程中的步态稳定控制问题,提出一种改进深度Q网络的深度强化学习方法.首先,将深度Q网络算法与确定性策略梯度相结合,提出用修正Double-Q网络优化操作一评论网络的评论网络,给出一种改进的深度Q网络;然后,建立双足机器人连杆模型,在常规的平整路面上将改进的深度Q网络用于作为智能体的双足机器人进行步态控制训练.MATLAB仿真结果表明,与深度Q网络和深度确定性策略梯度算法相比,所提算法有更好的训练速度且其回报曲线具有良好的平滑性.在CPU训练下,经过20 h左右深度强化学习能够完成智能体训练.双足机器人在较小的力矩和长距离下能够稳定快步行走. 相似文献
2.
文章对比分析了我国与发达国家关于馆际互借规则的制定,提出了我国在馆际互借规则制定方面所存在的不足,以及未来所努力的方向。 相似文献
1