基于深度强化学习的资源受限条件下的DIDS任务调度优化方法 |
| |
作者姓名: | 赵旭 黄光球 江晋 李巾 |
| |
作者单位: | 西安建筑科技大学管理学院,西安710055;西安工程大学电子信息学院,西安710048;西安建筑科技大学管理学院,西安710055;西安工程大学人文学院,西安710048;陕西省社会科学院,西安710061 |
| |
基金项目: | 国家自然科学基金项目(71874134);西安市科技计划项目(21XJZZ0024);陕西省教育厅专项项目(20JX014). |
| |
摘 要: | 在节点性能有限的边缘计算环境下进行分布式入侵检测系统(distributed intrusion detection system, DIDS)的任务分配,是一种典型的资源受限任务调度问题.针对该问题,提出基于深度强化学习的DIDS低负载任务调度方案.该方案将任务调度过程描述为马尔科夫决策过程(Markov decision process, MDP)并建立模型的相关空间和价值函数,找到保持DIDS低负载状态的最优策略.针对状态和动作空间过大且高维连续的问题,提出通过深度循环神经网络进行函数拟合.实验表明,所提出方案可使DIDS在网络变化中动态调节调度策略,保持系统整体的低负载,而安全指标没有明显降低.
|
关 键 词: | 资源受限 任务调度 深度强化学习 深度循环神经网络 入侵检测 边缘计算 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《控制与决策》浏览原始摘要信息 |
|
点击此处可从《控制与决策》下载全文 |
|