共查询到19条相似文献,搜索用时 125 毫秒
1.
当Q学习应用于路径规划问题时,由于动作选择的随机性,以及Q表更新幅度的有限性,智能体会反复探索次优状态和路径,导致算法收敛速度减缓.针对该问题,引入蚁群算法的信息素机制,提出一种寻优范围优化方法,减少智能体的无效探索次数.此外,为提升算法初期迭代的目的性,结合当前栅格与终点位置关系的特点以及智能体动作选择的特性,设计Q表的初始化方法;为使算法在运行的前中后期有合适的探索概率,结合信息素浓度,设计动态调整探索因子的方法.最后,在不同规格不同特点的多种环境中,通过仿真实验验证所提出算法的有效性和可行性. 相似文献
2.
为了改善节点的学习策略,提高节点的应用性能,以数据收集为应用建立任务模型,提出基于Q学习和规划的传感器节点任务调度算法,包括定义状态空间、延迟回报、探索和利用策略等基本元素.根据无线传感器网络(WSN)特性,建立基于优先级机制和过期机制的规划过程,使节点可以有效利用经验知识,改善学习策略.实验表明,文中算法具备根据当前WSN环境进行动态任务调度的能力.相比其它任务调度算法,文中算法能量消耗合理且获得较好的应用性能. 相似文献
3.
本文针对四旋翼无人机吊挂系统空运过程中负载摆角的非线性最优调节问题, 提出了一种基于事件驱动的在线自适应轨迹规划策略. 在事件驱动的自适应评价网框架下, 利用神经网络的逼近学习能力得到吊挂负载摆动抑制的折现最优控制律. 同时结合该控制律进一步规划四旋翼无人机的飞行轨迹, 实现了对无人机位置的精确调节和吊挂负载摆动的快速抑制, 并且显著降低了无人机机载处理器的计算负担. 然后采用基于Lyapunov稳定性的分析方法, 证明了神经网络输出权值估计误差一致最终有界, 并证明了无人机位置跟踪误差和吊挂负载摆动运动的收敛. 最后, 通过飞行对比实验验证了所提出的轨迹规划策略的有效性. 相似文献
4.
由于无线传感器网络节点的能量主要消耗在数据的传输上,因此路由选择的有效性决定网络整体能量消耗的高低。本文将网络构建成一个多Agent系统,将系统建模成为一个离散Markov决策过程,使用基于性能势的Q学习算法寻找最优路由。在报酬函数的设定时综合考虑节点距离Sink节点的跳数、邻居节点密度和剩余能量等因素,以达到数据传输最短路径和节点能量消耗的折中。 相似文献
5.
针对传统路由算法不能很好解决无线传感器网络的能量消耗和负载均衡的问题,提出一种将路径跳数和能量消耗因素考虑在内的基于Q学习的能量负载均衡算法。通过多跳和残余能量来估计网络状态,从而找到复杂度最低的最优路由策略,得到的数据传输路径满足能量消耗最小与负载均衡两个条件,在降低网络能量消耗的同时也延长了网络的生存周期。实验结果表明了算法在节点存活个数、节点剩余能量分布和节点发送成功率方面均取得较好的效果,同时验证了算法可以降低能量消耗,延长网络的整体寿命。 相似文献
6.
为提高多无人机(Unmanned aerial vehicles, UAV)协同轨迹规划(Cooperative trajectory planning, CTP)效率, 在解耦序列凸优化(Sequential convex programming, SCP)方法基础上, 提出一种高效求解凸优化子问题的定制内点法. 首先引入松弛变量, 构建子问题的等价描述形式, 并推导该形式下的子问题最优性条件. 然后在预测−校正原对偶内点法的框架下, 构建一套高效求解最优性条件方程组的计算流程以降低子问题计算复杂度, 并利用约束矩阵特征提出一种快速计算原对偶搜索方向的方法以提高规划效率. 仿真结果表明, 在解耦序列凸优化框架下, 定制内点法可将协同轨迹规划耗时降低一个数量级, 达到秒级. 相似文献
8.
基于CC2530的ZigBee数据采集系统设计 总被引:1,自引:0,他引:1
为了使工业生产中的技术人员不用亲自去现场或者恶劣的环境就可以实时采集现场设备的数据信息及状态参数,结合ZigBee技术适用于数据采集系统的特点,首先在ZigBee技术的理论基础上介绍了数据采集系统采集数据的原理,然后详细讨论了基于CC2530芯片的数据采集节点的硬件设计方法及组网设计中的协调器建立网络、节点加入和脱离网络的软件设计方法,最后给出了该设计方案在LED路灯电压数据采集实验中的应用实例。实验结果表明这种设计方案不仅能有效地采集设备的各项数据,而且使系统的扩展、维护变得更加方便。 相似文献
9.
为提高无人机在观光农业混合型无线传感器网络中的数据采集效率,提出一种基于深度强化学习的无人机路径规划策略。基于社会力模型引入人流参量,结合Semi-Markov-Option分层强化学习方法以降低模型复杂度,基于Rainbow算法提出SMO-Rainbow(Semi-Markov-Option-Rainbow)路径规划策略。在ε-greedy探索策略中引入Tanh函数,提出AT-ε-greedy(adaptive-Tanh-greedy)策略,进一步平衡深度强化学习模型训练中的探索与利用阶段。实验结果表明,在观光农业场景中,所提路径规划策略与其它深度强化学习无人机路径规划策略相比,数据采集效率与训练稳定性均更优,有效降低了模型训练难度。 相似文献
10.
11.
无人机由于具有完全可控的移动性以及快速部署等优点,成为无线通信领域的研究热点。研究一种无人机支持的多播信道,利用无人机作为移动发射机向多个地面节点发送信息,在无人机的有限任务通信时间内,设计一种连续圆飞行轨迹方法。面向随机分布的多个地面节点,设定距离阈值对地面节点进行分组,通过求解新型旅行商问题确定无人机对各个分组的通信顺序,在满足无人机与地面节点通信覆盖需求的情况下,对圆心、无人机的飞行速度以及飞行半径进行求解,确定各个分组的圆形飞行轨迹,进而生成连续圆飞行轨迹。为实现吞吐量最大化目标,基于连续圆轨迹,在轨迹、功率一定情况下进行功率和轨迹优化,并通过交替联合优化无人机轨迹和功率以提高无人机对地通信系统整体性能。仿真结果表明,与基准方案相比,该方法系统吞吐量明显提高。 相似文献
12.
13.
针对当前强化学习算法在无人机升空平台路径规划任务中样本效率低、算法鲁棒性较差的问题,提出一种基于模型的内在奖励强化学习算法。采用并行架构将数据收集操作和策略更新操作完全解耦,提升算法学习效率,并运用内在奖励的方法提高智能体对环境的探索效率,避免收敛到次优策略。在策略学习过程中,智能体针对模拟环境的动态模型进行学习,从而在有限步内更好地预测状态、奖励等信息。在此基础上,通过结合有限步的规划计算以及神经网络的预测,提升价值函数的预测精准度,以利用较少的经验数据完成智能体的训练。实验结果表明,相比同样架构的无模型强化学习算法,该算法达到相同训练水平所需的经验数据量减少近600幕数据,样本效率和算法鲁棒性都有大幅提升,相比传统的非强化学习启发类算法,分数提升接近8 000分,与MVE等主流的基于模型的强化学习算法相比,平均分数可以提升接近2 000分,且在样本效率和稳定性上都有明显提高。 相似文献
14.
针对现有无人机(Unmanned Aerial Vehicle,UAV)风场估计方法中存在的计算复杂、需额外搭载传感器等问题,提出基于粗糙集遗传神经网络的无人机受风状态估计方法。该方法利用粗糙集分析方法对无人机上采集的姿态信息数据集进行约简;利用遗传算法全局搜索能力强的特点优化神经网络的初始权值;用简化的无人机数据集训练神经网络即得到所需神经网络风场估计模型。仿真结果表明,该方法具有较高的识别率以及较短的训练时间,证明了其在无人机风场估计上应用的有效性。 相似文献
15.
16.
17.
18.
19.
随着无人机的逐渐发展和使用范围的扩大,空域将变得越来越拥挤。把无人机系统融入有人机管制空域将是未来解决空域拥挤问题的必要手段之一。基于无人机性能特征和机载设备设施要求,结合有人机和无人机的延迟推导出二者之间的管制防撞间隔,并根据等效安全水平原则求出二者之间可行的目标安全水平。在Reich模型的基础上进行改进,从而建立有人机与无人机的侧向碰撞风险模型,再通过仿真算例对不同管制空域内的有人机和无人机之间进行风险评估,计算碰撞风险并与目标安全水平进行比较。仿真结果表明在1000 m以上的管制空域采用所推导的防碰撞间隔满足ICAO规定的碰撞风险要求,所以该间隔可以作为无人机融入有人机管制空域时的侧向间隔使用。 相似文献