融合有效方差置信上界的Q学习智能干扰决策算法 Q-learning intelligent jamming decision algorithm based on efficient upper confidence bound variance期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

融合有效方差置信上界的Q学习智能干扰决策算法

引用本文：	饶宁,许华,宋佰霖.融合有效方差置信上界的Q学习智能干扰决策算法[J].哈尔滨工业大学学报,2022,54(5):162-170.

作者姓名：	饶宁许华宋佰霖

作者单位：	空军工程大学信息与导航学院,西安710077

摘要：	为进一步提升基于值函数强化学习的智能干扰决策算法的收敛速度,增强战场决策的有效性,设计了一种融合有效方差置信上界思想的改进Q学习智能通信干扰决策算法.该算法在Q学习算法的框架基础上,利用有效干扰动作的价值方差设置置信区间,从干扰动作空间中剔除置信度较低的干扰动作,减少干扰方在未知环境中不必要的探索成本,加快其在干扰动作...
关键词：	干扰决策强化学习有效方差置信上界 Q学习干扰动作剔除马尔科夫决策过程
收稿时间：	2020/10/26 0:00:00
Q-learning intelligent jamming decision algorithm based on efficient upper confidence bound variance

RAO Ning,XU Hu,SONG Bailin.Q-learning intelligent jamming decision algorithm based on efficient upper confidence bound variance[J].Journal of Harbin Institute of Technology,2022,54(5):162-170.

Authors:	RAO Ning XU Hu SONG Bailin

Abstract:

Keywords:	jamming decision-making reinforcement learning efficient upper confidence bound variance Q-learning jamming action elimination Markov decision process
本文献已被万方数据等数据库收录！
	点击此处可从《哈尔滨工业大学学报》浏览原始摘要信息
	点击此处可从《哈尔滨工业大学学报》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏