首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进Dueling DQN的多园区网络动态路由算法
引用本文:李国燕,史东雨,张宗辉.基于改进Dueling DQN的多园区网络动态路由算法[J].电子测量与仪器学报,2022,36(11):211-220.
作者姓名:李国燕  史东雨  张宗辉
作者单位:1.天津城建大学计算机与信息工程学院
基金项目:天津市科技计划(19YFZCGX00130)项目资助
摘    要:针对高度“中心”连接的多园区网络中,负载不均衡造成传输时延长和网络拥塞问题,提出一种基于自适应多采样机制的决斗深度强化网络(adaptive multi-sampling Dueling deep Q-network, AMD-DQN)动态路由优化算法。首先,在网络模型中引入决斗网络(dueling DQN)的思想,同时对多层感知器组成结构进行中心化处理改进,防止高估计价值函数;然后,经验回放机制采用了自适应多采样机制,该机制融合了随机、就近和优先采样方式,根据负载情况进行自适应调整,并根据权值概率随机选取采样模式;最后,利用AMD-DQN网络结构结合强化学习信号和随机梯度下降来训练神经网络,选出每步最大价值动作,直至传输成功。实验结果表明,相比传统的DQN和Dueling DQN算法,AMD-DQN算法平均时延为128.046 ms,吞吐量达到5.726个/s,有效减少了数据包的传输时延,提高了吞吐量,同时从5个方向对拥塞程度进行评价,取得了较好的实验结果,进一步缓解了网络的拥塞。

关 键 词:动态路由  深度强化学习  决斗网络  自适应多采样经验回放

Dynamic routing algorithm for multi campus network based on improved Dueling DQN
Li Guoyan,Shi Dongyu,Zhang Zonghui.Dynamic routing algorithm for multi campus network based on improved Dueling DQN[J].Journal of Electronic Measurement and Instrument,2022,36(11):211-220.
Authors:Li Guoyan  Shi Dongyu  Zhang Zonghui
Affiliation:1.School of Computer and Information Engineering, Tianjin Chengjian University
Abstract:
Keywords:dynamic routing  deep reinforcement learning  fighting network  adaptive multisampling empirical playback
点击此处可从《电子测量与仪器学报》浏览原始摘要信息
点击此处可从《电子测量与仪器学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号