共查询到18条相似文献,搜索用时 62 毫秒
1.
2.
首先介绍了认知无线电技术产生的背景,以及强化学习的发展和应用于认知领域的优势;接着对强化学习的基本原理及其2个常见的模型Q-Learning和POMDP作了介绍,并对其模型定义、思想、所要描述的问题和使用的场景都做了较详细的阐述;然后针对这个方向最近几年的顶级会议和期刊论文,分析了其主要内容;通过最近几年的学术、会议论文中所述的研究现状及成果,说明强化学习的主要特点是能够准确、快速学习到最优策略,能够模拟真实环境,自适应性强,提高频谱感知、分配效率,从而最大化系统吞吐量,这些优势充分证明了强化学习将是认知领域里一种很有前景的技术。 相似文献
3.
4.
5.
6.
7.
为了使认知用户可成功接入分配的频谱,进一步提高频谱利用率,提出了一种基于频谱聚合的分布式频谱分配算法(SADSA),该算法以图论着色为模型,算法过程考虑了认知用户的带宽需求和认知设备的最大聚合范围,仿真结果表明了该算法在认知用户接入率方面的优越性. 相似文献
8.
9.
10.
11.
12.
13.
In order to solve multi-objective optimization problem,a resource allocation algorithm based on deep reinforcement learning in cellular networks was proposed.Firstly,deep neural network (DNN) was built to optimize the transmission rate of cellular system and to complete the forward transmission process of the algorithm.Then,the Q-learning mechanism was utilized to construct the error function,which used energy efficiency as the rewards.The gradient descent method was used to train the weights of DNN,and the reverse training process of the algorithm was completed.The simulation results show that the proposed algorithm can determine optimization extent of optimal resource allocation scheme with rapid convergence ability,it is obviously superior to the other algorithms in terms of transmission rate and system energy consumption optimization. 相似文献
14.
在认知光通信网络中,能量检测方法因不需要知晓 主用户的参数而被广泛研究,但该方法在噪声波动情形下的感知性能有待提高。该文提出认 知用户根据光通信环境变化自动调整检测阈值的方法来提升低信噪比下的感知性能。融合中 心应用坐标搜索算示为认知用户提供最优控制参数。认知用户以中心阈值为基础,依据最优 参数及自身收集的能量动态设定检测阈值,并通与融合中心的信息交换,学习特定环境下的 最佳阈值。此外,参考了各认知用户在协作感知中的贡献差异,并设计新的权值计算方法来 体现该差异。仿真实验结果表明该文中的频谱感知方法对噪声波动有卓越的鲁棒性,提高检 测概率的同时降低了错误概率,在信噪比为-20dB时的检测概率仍 高达96.9%,远高于传统方法。 相似文献
15.
Cognitive radio is a new intelligent wireless communication technique for remedying the shortage of spectrum resource in recent years. Secondary users have to pay when they share available spectrum with primary users while price is an important factor in the spectrum allocation. Based on the game theory, an improved pricing function is proposed by considering the expectation of primary users. In this article, expectation represents the positivity of sharing spectrum with primary users. By introducing the positivity, price not only becomes different for different secondary users, but also can be adjusted according to the positivity. It is proved that the Nash Equilibrium of the new utility function exists. The simulation results show that spectrum sharing can not only be determined by the channel quality of secondary users, but also can be adapted according to the expectation of primary users. Besides, the proposed algorithm improves the fairness of sharing. 相似文献
16.
为了提升反向散射网络中物联网设备的平均吞吐量,提出了一种资源分配机制,构建了用户配对和时隙分配联合优化资源分配模型。由于该模型直接利用深度强化学习(Deep Reinforcement Learning,DRL )算法求解导致动作空间维度较高且神经网络复杂,故将其分解为两层子问题以降低动作空间维度:首先,基于深度强化学习算法,利用历史信道信息推断当前的信道信息以进行最优的用户配对;然后,在用户固定配对的情况下,基于凸优化算法,以最大化物联网设备总吞吐量为目标进行最优的时隙分配。仿真结果表明,与其他资源分配方法相比,所提资源分配方法能有效提升系统吞吐量,且有较好的信道适应性和收敛性。 相似文献
17.
将认知无线电中的动态频谱分配技术应用在无线传感网中,针对工作在ISM(industrial,scientific and medical)频段的无线传感网面临的频谱资源紧缺问题,提出一种基于改进自适应遗传算法的动态频谱分配方案.该算法以图论着色模型为基础,以最大带宽收益和最小切换频率为目标函数,在交叉和变异过程中采用自适应交叉概率和变异概率代替固定的交叉概率和变异概率.仿真结果表明,与传统遗传算法和颜色敏感图论着色算法相比,该算法可以实现提高频谱利用率、降低能量消耗的预期目标. 相似文献
18.
基于单频段多赢家拍卖的动态频谱分配 总被引:1,自引:0,他引:1
针对传统拍卖方法在认知无线网络动态频谱分配中的低效问题,提出了一种基于单频段多赢家拍卖的动态频谱分配算法。该算法在原始贪婪算法的基础上增加了多重贪婪策略,以较低的计算复杂度获得了较优的解;改进了VCG(vickery-clarke-groves)机制,在保留占优策略激励兼容特性的基础上,提高了卖家的收益,有效抑制共谋的发生。仿真结果表明,该算法的频谱分配效率接近最优分配效率,同时提高了拍卖的经济收益。 相似文献