一种基于深度强化学习的TCP网络拥塞控制协议 |
| |
引用本文: | 卢光全,李建波,吕志强.一种基于深度强化学习的TCP网络拥塞控制协议[J].计算机应用与软件,2023(3):179-187. |
| |
作者姓名: | 卢光全 李建波 吕志强 |
| |
作者单位: | 青岛大学计算机科学技术学院 |
| |
基金项目: | 国家重点研发计划重点专项项目(2018YFB2100303);;山东省博士后创新人才支持计划项目(40618030001);;国家自然科学基金项目(61802216);;中国博士后基金项目(2018M642613); |
| |
摘 要: | 在面对网络变化时,传统的TCP拥塞控制协议因其固有的规则机制只能做出固定的动作,既未充分利用链路带宽,也未从历史经验中学习,并且在发生拥塞时带宽恢复所用时间较长。近年来基于强化学习的拥塞控制协议(Reinforcement Learning Congestion Control, RL-CC)虽然可以有效地从历史经验中学习,但是它没有考虑历史经验在时序上存在的因果关系。对这种因果关系进行隐式提取,提出一种基于时序卷积网络和强化学习的拥塞窗口自适应智能化拥塞控制协议(Temporal convolutional network and Reinforcement Learning Congestion Control, TRL-CC)。TRL-CC通过NS-3仿真不同带宽的网络环境。大量的仿真实验表明,与NewReno和RL-CC做对比,TRL-CC在吞吐量方面提升32.8%和8.5%,时延降低41.3%和12%。
|
关 键 词: | TCP AIMD 拥塞控制 强化学习 时序卷积网络 |
|
|