融合电网运行场景聚类的多任务深度强化学习优化调度 |
| |
引用本文: | 邓柏荣,陈俊斌,丁巧宜,潘振宁,余涛,王克英,侯佳萱.融合电网运行场景聚类的多任务深度强化学习优化调度[J].电网技术,2023(3):978-990. |
| |
作者姓名: | 邓柏荣 陈俊斌 丁巧宜 潘振宁 余涛 王克英 侯佳萱 |
| |
作者单位: | 1. 华南理工大学电力学院;2. 广东省电网智能量测与先进计量企业重点实验室;3. 南方电网数字电网研究院有限公司 |
| |
基金项目: | 国家自然科学基金项目(U2066212); |
| |
摘 要: | “双碳”目标和新型电力系统建设背景下,新能源的高渗透率接入导致电力系统随机性显著增大、运行方式的分布复杂多样,传统单任务深度强化学习难以自适应源荷两侧的高随机性,调度决策难以满足新型电力系统对风光消纳、功率平衡需求。为此,该文提出融合电网运行场景聚类的多任务深度强化学习优化调度方法。该方法离线训练时利用空间聚类和决策树辨识海量调度运行数据的典型运行场景与重要特征,并构建甄别场景类别的多层感知机分类器;再依据场景类别建立和划分融合聚类多任务深度强化学习模型,从数据源到状态动作设计差异化训练各子任务学习器与模型;在线决策时利用分类器辨识有限运行数据的场景类别,调用模型快速求解实时调度任务,实现高随机场景下的多任务快速迁移学习,保证电力系统优化调度决策的最优性。该文通过算例验证了该方法的解的可行性与经济性。实验结果表明,融合电网运行场景聚类的多任务深度强化学习优化调度算法较单任务算法能够明显提升调度决策经济效益。
|
关 键 词: | 数据驱动模式 场景聚类 多任务深度强化学习 迁移学习 优化调度 |
|
|