基于深度强化学习算法的风光互补可再生能源制氢系统调度方案 |
| |
引用本文: | 梁涛,孙博峰,谭建鑫,曹欣,孙鹤旭.基于深度强化学习算法的风光互补可再生能源制氢系统调度方案[J].高电压技术,2023(6):2264-2275. |
| |
作者姓名: | 梁涛 孙博峰 谭建鑫 曹欣 孙鹤旭 |
| |
作者单位: | 1. 河北工业大学人工智能与数据科学学院;2. 河北建投能源投资股份有限公司;3. 河北科技大学电气工程学院 |
| |
摘 要: | 风光可再生能源制备“绿氢”是实现能源低碳化的重要途径,但风能、太阳能的波动性、间歇性等问题会使系统存在“弃风、弃光”现象。为解决该问题,构建了可再生能源并网制氢系统,针对传统CPLEX需要精准预测数据、基于状态控制法的监控策略控制效果不够理想的缺点,将协调控制转化为序列决策问题,采用深度强化学习连续近端策略优化算法进行解决。在发电量、负荷等多种因素变化的情况下,设计了适合解决可再生能源制氢系统调度问题的深度强化学习模型(renewable energy to hydrogen-proximal policy optimization,R2H-PPO),经过足够的训练后能够实现在线决策控制,并与日前控制方案和基于状态控制法的监控策略进行了对比,证明所采用方法避免了传统方案的不足,并能有效处理不同时刻、天气、季节的场景。结果证明了所提出的R2H-PPO方法的可行性和有效性。
|
关 键 词: | 可再生能源 制氢系统 深度强化学习 近端策略优化 运行优化 R2H-PPO |
|
|