首页 | 本学科首页   官方微博 | 高级检索  
     

基于强化学习的电动汽车换电站实时调度策略优化
引用本文:张文昕,栗然,臧向迪,严敬汝,祝晋尧. 基于强化学习的电动汽车换电站实时调度策略优化[J]. 电力自动化设备, 2022, 42(10)
作者姓名:张文昕  栗然  臧向迪  严敬汝  祝晋尧
作者单位:华北电力大学 电气与电子工程学院,河北 保定 071003;国网河北省电力有限公司电力科学研究院,河北 石家庄 050022;国网石家庄供电公司,河北 石家庄 050004
摘    要:随着电动汽车的应用推广,换电站的调度优化逐渐成为研究热点。传统的基于换电需求预测值的调度策略在实际应用中面临着难以适应动态干扰因素、预测误差累积等问题。为了解决这些问题,提出了一种基于带基线的蒙特卡罗策略梯度法的换电站实时调度策略,用于优化换电站的充放电策略以及响应电池数量。提出了带基线的蒙特卡罗策略梯度强化学习,并为换电站实时调度问题选取合适的状态空间和动作空间;设计了奖励函数对智能体进行离线训练,从电池状态数据、分时电价和排队电动汽车数量中学习得到最优策略网络;在离线训练好的模型基础上进行实时调度策略测试。基于换电站的服务可用率和经济效益验证了所提调度策略的有效性和经济性,算例结果表明所提策略能对电网负荷起到一定的削峰填谷作用。

关 键 词:电动汽车;换电站;强化学习;策略梯度;分时电价;实时调度

Real-time scheduling strategy optimization for electric vehicle battery swapping station based on reinforcement learning
ZHANG Wenxin,LI Ran,ZANG Xiangdi,YAN Jingru,ZHU Jinyao. Real-time scheduling strategy optimization for electric vehicle battery swapping station based on reinforcement learning[J]. Electric Power Automation Equipment, 2022, 42(10)
Authors:ZHANG Wenxin  LI Ran  ZANG Xiangdi  YAN Jingru  ZHU Jinyao
Affiliation:College of Electrical and Electronic Engineering, North China Electric Power University, Baoding 071003, China;Electric Power Research Institute of State Grid Hebei Electric Power Company, Shijiazhuang 050022, China; State Grid Shijiazhuang Electric Power Company, Shijiazhuang 050004, China
Abstract:
Keywords:electric vehicles   battery swapping station   reinforcement learning   policy gradient   time-of-use electricity price   real-time scheduling
点击此处可从《电力自动化设备》浏览原始摘要信息
点击此处可从《电力自动化设备》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号