基于HSARSA(λ)算法的水库长期随机优化调度研究 |
| |
作者姓名: | 李文武 刘江鹏 蒋志强 裴本林 李黄强 |
| |
作者单位: | 三峡大学电气与新能源学院,湖北宜昌443002;三峡大学梯级水电站运行与控制湖北省重点实验室,湖北宜昌443002;华中科技大学水电与数字化工程学院,湖北武汉4730074;宜昌宜能水电有限责任公司,湖北宜昌443000;国网湖北省电力有限公司宜昌供电公司,湖北宜昌443000 |
| |
基金项目: | 国家自然科学基金项目(51809098);梯级水电站运行与控制湖北省重点实验室(三峡大学)开放基金项目(2019KJX08) |
| |
摘 要: | 针对强化学习的SARSA算法在求解水库随机优化问题中存在的优化性能不高、收敛速度较慢的问题,提出采用基于强化学习的HSARSA(λ)算法进行求解。先在SARSA算法基础上引入效用迹函数得到SARSA(λ)算法,然后加入启发函数得到HSARSA(λ)算法,最后通过不断调整HSARSA(λ)算法的学习率α、折扣因子γ、衰减因子λ等参数求解水库长期随机优化调度问题。实例应用表明,HSARSA(λ)相较于SARSA、SARSA(λ)算法可提升求解精度,减少最优近似解寻优迭代次数,为水库随机优化调度问题提供了一种新的求解思路。
|
关 键 词: | 随机优化调度 强化学习 HSARSA(λ)算法 效用迹函数 启发函数 |
本文献已被 万方数据 等数据库收录! |
|