首页 | 本学科首页   官方微博 | 高级检索  
     

基于HSARSA(λ)算法的水库长期随机优化调度研究
引用本文:李文武,刘江鹏,蒋志强,裴本林,李黄强.基于HSARSA(λ)算法的水库长期随机优化调度研究[J].水电能源科学,2020,38(12):53-57.
作者姓名:李文武  刘江鹏  蒋志强  裴本林  李黄强
作者单位:三峡大学电气与新能源学院,湖北宜昌443002;三峡大学梯级水电站运行与控制湖北省重点实验室,湖北宜昌443002;华中科技大学水电与数字化工程学院,湖北武汉4730074;宜昌宜能水电有限责任公司,湖北宜昌443000;国网湖北省电力有限公司宜昌供电公司,湖北宜昌443000
基金项目:国家自然科学基金项目(51809098);梯级水电站运行与控制湖北省重点实验室(三峡大学)开放基金项目(2019KJX08)
摘    要:针对强化学习的SARSA算法在求解水库随机优化问题中存在的优化性能不高、收敛速度较慢的问题,提出采用基于强化学习的HSARSA(λ)算法进行求解。先在SARSA算法基础上引入效用迹函数得到SARSA(λ)算法,然后加入启发函数得到HSARSA(λ)算法,最后通过不断调整HSARSA(λ)算法的学习率α、折扣因子γ、衰减因子λ等参数求解水库长期随机优化调度问题。实例应用表明,HSARSA(λ)相较于SARSA、SARSA(λ)算法可提升求解精度,减少最优近似解寻优迭代次数,为水库随机优化调度问题提供了一种新的求解思路。

关 键 词:随机优化调度  强化学习  HSARSA(λ)算法  效用迹函数  启发函数
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号