首页 | 本学科首页   官方微博 | 高级检索  
     

融合有效方差置信上界的Q学习智能干扰决策算法
引用本文:饶宁,许华,宋佰霖.融合有效方差置信上界的Q学习智能干扰决策算法[J].哈尔滨工业大学学报,2022,54(5):162-170.
作者姓名:饶宁  许华  宋佰霖
作者单位:空军工程大学 信息与导航学院,西安710077
摘    要:为进一步提升基于值函数强化学习的智能干扰决策算法的收敛速度,增强战场决策的有效性,设计了一种融合有效方差置信上界思想的改进Q学习智能通信干扰决策算法.该算法在Q学习算法的框架基础上,利用有效干扰动作的价值方差设置置信区间,从干扰动作空间中剔除置信度较低的干扰动作,减少干扰方在未知环境中不必要的探索成本,加快其在干扰动作...

关 键 词:干扰决策  强化学习  有效方差置信上界  Q学习  干扰动作剔除  马尔科夫决策过程
收稿时间:2020/10/26 0:00:00

Q-learning intelligent jamming decision algorithm based on efficient upper confidence bound variance
RAO Ning,XU Hu,SONG Bailin.Q-learning intelligent jamming decision algorithm based on efficient upper confidence bound variance[J].Journal of Harbin Institute of Technology,2022,54(5):162-170.
Authors:RAO Ning  XU Hu  SONG Bailin
Abstract:
Keywords:jamming decision-making  reinforcement learning  efficient upper confidence bound variance  Q-learning  jamming action elimination  Markov decision process
本文献已被 万方数据 等数据库收录!
点击此处可从《哈尔滨工业大学学报》浏览原始摘要信息
点击此处可从《哈尔滨工业大学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号