排序方式: 共有1条查询结果,搜索用时 62 毫秒
1
1.
为了解决增程式电动轻卡辅助动力单元(auxiliary power units, APU)和动力电池之间能量的合理分配问题,在Simulink中建立面向控制的仿真模型,并提出一种基于双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient, TD3)算法的实时能量管理策略,以发动机燃油消耗量、电池荷电状态(state of charge, SOC)变化等为优化目标,在世界轻型车辆测试程序(world light vehicle test procedure, WLTP)中对深度强化学习智能体进行训练。仿真结果表明,利用不同工况验证了基于TD3算法的能量管理策略(energy management strategy, EMS)具有较好的稳定性和适应性;TD3算法实现对发动机转速和转矩连续控制,使得输出功率更加平滑。将基于TD3算法的EMS与基于传统深度Q网络(deep Q-network,DQN)算法和深度确定性策略梯度(deep deterministic policy gradient, DDPG)算法进行对比分析,结果... 相似文献
1