基于深度强化学习的电-气区域综合能源系统安全校正控制决策方法 |
| |
引用本文: | 彭寒梅,胡磊,谭貌,李金果,苏永新.基于深度强化学习的电-气区域综合能源系统安全校正控制决策方法[J].电网技术,2024(3):1019-1030. |
| |
作者姓名: | 彭寒梅 胡磊 谭貌 李金果 苏永新 |
| |
作者单位: | 1. 湘潭大学自动化与电子信息学院;2. 湖南省多能协同控制技术工程研究中心(湘潭大学) |
| |
基金项目: | 国家自然科学基金项目(51777179);;湖南省自然科学基金项目(2020JJ4580)~~; |
| |
摘 要: | 电–气区域综合能源系统电、气相互耦合与影响,使得其安全校正控制难度大且对快速性要求高,为此,提出一种基于深度确定性策略梯度(deepdeterministicpolicy gradient,DDPG)算法的安全校正控制决策方法。首先,进行系统多能流与变量分析,建立安全校正控制的目标与约束条件。然后,构建基于DDPG的安全校正控制模型,设计目标奖励和各种约束条件奖励,提出结合基于综合灵敏度的安全校正知识经验设计目标奖励函数,使调整具有方向性,且目标奖励考虑能量枢纽(energy hub,EH)的经济效益及其可再生能源消纳;通过智能体离线训练,使其能够在线做出实时最优的安全校正控制策略,预先产生专家经验数据集存放于经验回放池,提高训练速度和收敛性。最后,通过含EH电–气区域综合能源系统仿真算例验证了所提方法的有效性。
|
关 键 词: | 电–气区域综合能源系统 安全校正控制 深度强化学习 综合灵敏度 能量枢纽 |
|