首页 | 本学科首页   官方微博 | 高级检索  
     

基于先验知识的HVAC系统深度Q网络控制方法
作者姓名:韩智聪  王哲超  李可  马帅
作者单位:苏州科技大学电子与信息工程学院,江苏 苏州 215009;苏州科技大学江苏省建筑智慧节能实验室,江苏 苏州 215009
摘    要:强化学习方法在近年来被逐渐尝试应用于工程控制之中,并且展示出其强大的控制能力和潜力。强化学习算法虽然具有较好的控制性能,但是其控制策略的收敛需要建立在一段时间后的训练上,而这段时间在工程应用上可能会造成一些浪费。为了解决这一问题,提出了基于先验知识的DQN对暖通空调(HVAC)系统中的冷却水系统进行控制,将先验知识引入DQN算法的前期训练中,以减少训练时间,加速收敛,节约成本。基于先验知识的DQN算法不仅能够对系统进行有效的控制,并且能够比DQN更早地实现节能。

关 键 词:强化学习  先验知识  加速收敛  暖通空调
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号