基于改进深度强化学习的HEV能量分配策略研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于改进深度强化学习的HEV能量分配策略研究

引用本文：	吴忠强,马博岩.基于改进深度强化学习的HEV能量分配策略研究[J].计量学报,2023(12):1863-1871.

作者姓名：	吴忠强马博岩

作者单位：	燕山大学工业计算机控制工程河北省重点实验室

基金项目：	河北省自然科学基金(F2020203014)；

摘要：	以并联式混合动力汽车(HEV)为研究对象，建立整车需求功率及动力系统模型，提出一种基于改进深度强化学习(DRL)的能量分配策略。通过改进DRL中的双延迟深度确定性策略梯度(TD3)算法，引入双重回放缓冲区，提出DRB-TD3算法以提升原算法的采样效率。设计了基于规则的约束控制器并嵌入到DRL结构中，以消除不合理的转矩分配。在UDDS行驶工况下，以基于动态规划(DP)的能量分配策略性能作为基准进行仿真实验。实验结果表明，与深度确定性策略梯度(DDPG)算法以及传统TD3算法相比，DRB-TD3算法收敛性能最佳，收敛效率分别提高了61.2%和31.6%;所提出的能量分配策略相比于基于DDPG和基于TD3的能量分配策略，平均燃油消耗分别降低了3.3%和2.3%,燃油经济性达到基于DP的95.2%,效果最佳，且电池荷电状态(SOC)能够保持在一个较好的水平，有助于延长电池的使用寿命。
关键词：	并联式混合动力汽车能量分配策略深度强化学习 TD3算法荷电状态