基于改进深度强化学习的HEV能量分配策略研究 |
| |
引用本文: | 吴忠强,马博岩.基于改进深度强化学习的HEV能量分配策略研究[J].计量学报,2023(12):1863-1871. |
| |
作者姓名: | 吴忠强 马博岩 |
| |
作者单位: | 燕山大学工业计算机控制工程河北省重点实验室 |
| |
基金项目: | 河北省自然科学基金(F2020203014); |
| |
摘 要: | 以并联式混合动力汽车(HEV)为研究对象,建立整车需求功率及动力系统模型,提出一种基于改进深度强化学习(DRL)的能量分配策略。通过改进DRL中的双延迟深度确定性策略梯度(TD3)算法,引入双重回放缓冲区,提出DRB-TD3算法以提升原算法的采样效率。设计了基于规则的约束控制器并嵌入到DRL结构中,以消除不合理的转矩分配。在UDDS行驶工况下,以基于动态规划(DP)的能量分配策略性能作为基准进行仿真实验。实验结果表明,与深度确定性策略梯度(DDPG)算法以及传统TD3算法相比,DRB-TD3算法收敛性能最佳,收敛效率分别提高了61.2%和31.6%;所提出的能量分配策略相比于基于DDPG和基于TD3的能量分配策略,平均燃油消耗分别降低了3.3%和2.3%,燃油经济性达到基于DP的95.2%,效果最佳,且电池荷电状态(SOC)能够保持在一个较好的水平,有助于延长电池的使用寿命。
|
关 键 词: | 并联式混合动力汽车 能量分配策略 深度强化学习 TD3算法 荷电状态 |
|
|