基于先验知识的HVAC系统深度Q网络控制方法 |
| |
作者姓名: | 韩智聪 王哲超 李可 马帅 |
| |
作者单位: | 苏州科技大学电子与信息工程学院,江苏 苏州 215009;苏州科技大学江苏省建筑智慧节能实验室,江苏 苏州 215009 |
| |
摘 要: | 强化学习方法在近年来被逐渐尝试应用于工程控制之中,并且展示出其强大的控制能力和潜力。强化学习算法虽然具有较好的控制性能,但是其控制策略的收敛需要建立在一段时间后的训练上,而这段时间在工程应用上可能会造成一些浪费。为了解决这一问题,提出了基于先验知识的DQN对暖通空调(HVAC)系统中的冷却水系统进行控制,将先验知识引入DQN算法的前期训练中,以减少训练时间,加速收敛,节约成本。基于先验知识的DQN算法不仅能够对系统进行有效的控制,并且能够比DQN更早地实现节能。
|
关 键 词: | 强化学习 先验知识 加速收敛 暖通空调 |
本文献已被 万方数据 等数据库收录! |
|