共查询到20条相似文献,搜索用时 15 毫秒
1.
基于数字地形图移动机器人的GPS自主导航 总被引:1,自引:0,他引:1
本文将GPS技术应用于移动机器人的自主导航,根据移动机器人的运动特点,提出了基于数字地形图的移动机器人路径规划,通过GPS信号和超声传感信号的配合,实现准确快速的避障移动。 相似文献
2.
3.
针对目标驱动的视觉导航系统中由于导航的场景变化而导致智能体导航性能大大减弱的问题,提出了一种基于长短时记忆网络(Long Short-Term Memory, LSTM)的深度强化学习(Deep Reinforcement Learning, DRL)视觉导航模型。该模型通过输入当前状态和目标状态的RGB图像来实现视觉导航,在改进原有目标驱动视觉导航模型的基础上,基于历史状态信息,结合LSTM和通用后继表征(Universal Successor Representations, USR)对未来动作决策。在AI2-THOR仿真环境下进行实验,实验结果表明,所提出的模型训练智能体导航性能优异,与其他几种模型相比,平均路径长度减少约6%,平均碰撞率减少40%,模型收敛速度较快。 相似文献
4.
针对未知环境下的移动机器人导航,提出将最小二乘支持向量机与强化学习相结合的导航方法。首先以移动机器人CASIA-I和它的工作环境为实验平台,确定出强化学习的回报函数;然后利用基于滚动窗的最小支持向量机解决强化学习中的泛化问题。最后对所提方法进行了实验,实验结果表明所提方法能够避免导航陷入局部极小,并对未知环境具有较强的适应性。 相似文献
5.
6.
7.
8.
9.
阐述一种基于时间价值和深度强化学习的信号灯控制方法,实现对信号灯路口进行实时控制,并以最小化路口总的浪费时间价值为目标进行控制。通过仿真实验对比传统固定的信号灯控制方法,证明该方法能够大幅减少系统总浪费的时间价值。 相似文献
10.
为解决室内移动机器人导航过程中容易碰撞障碍物的问题,本文提出一种融合深度相机和激光雷达的室内移动机器人建图与导航方法,在机器人底盘上安装激光雷达、深度相机和里程计,利用Gmapping算法进行室内二维地图构建,同时用ROS中depthimage_to_laserscan功能包对深度图像进行二维投影,生成的二维栅格地图与... 相似文献
11.
12.
13.
14.
针对传统深度强化学习算法难以快速解决长时序复杂任务的问题,提出了一种引入历史信息和人类知识的深度强化学习方法,对经典近端策略优化(Proximal Policy Optimization, PPO)强化学习算法进行改进,在状态空间引入历史状态以反映环境的时序变化特征,在策略模型中基于人类认知增加无效动作掩膜,禁止智能体进行无效探索,提高探索效率,从而提升模型的训练性能。仿真结果表明,所提方法能够有效解决长时序复杂任务的智能决策问题,相比传统的深度强化学习算法可显著提高模型收敛效果。 相似文献
15.
随着第五代通信技术(5G)的发展,各种应用场景不断涌现,而网络切片可以在通用的物理网络上构建多个逻辑独立的虚拟网络来满足移动通信网络多样化的业务需求。为了提高移动通信网络根据各切片业务量实现资源按需分配的能力,本文提出了一种基于深度强化学习的网络切片资源管理算法,该算法使用两个长短期记忆网络对无法实时到达的统计数据进行预测,并提取用户移动性导致的业务数据量动态特征,进而结合优势动作评论算法做出与切片业务需求相匹配的带宽分配决策。实验结果表明,相较于现有方法,该算法可以在保证用户时延和速率要求的同时,将频谱效率提高约7.7%。 相似文献
16.
17.
18.
无线通信系统的信道开放性使其极易受到外部恶意干扰、通信链路质量难以保证,针对以上问题,本文设计了一种基于深度强化学习的多域联合干扰规避决策方法。该方法联合频域、功率域、调制编码域三个域的抗干扰手段进行干扰规避,在考虑系统性能的同时实现可靠通信。首先,将联合智能干扰规避问题建模为一个马尔可夫决策过程(MDP, Markov Decision Process),动作空间包含切换信道、功率控制、改变调制编码方式。然后,采用基于剪裁的近端策略优化算法(PPO-Clip, Proximal Policy Optimization-Clip)求解获得系统的最优联合干扰规避策略。PPO-Clip算法在多回合训练中以小数量样本迭代更新,避免了策略梯度算法中步长难以确定和更新差异过大的问题。最后,分别在扫频干扰、随机扫频干扰和智能阻塞干扰环境下验证了所提算法的有效性和可靠性。 相似文献
19.
深度强化学习作为统计学习常见算法,将其应用于智能网络安全防护设计环节将取得显著效果,以此规避智能网络安全风险。文章简要分析智能网络安全常见问题,根据对问题的分析研究,总结智能网络安全防护优化设计具体目标,经由设计网络状态集合、细化网络动作集合、规范设计回报函数、强化数据分析功能等设计步骤的落实,智能网络将充分发挥安全服务作用,由此维护网络安全。本文提出了可行性措施,期待提升网络安全防护的有效性。 相似文献
20.
先前的研究仅考虑仅仅存在认知车联网单一通信环境的问题,这样不能充分利用频谱资源。为了提高频谱利用率,提出一种适用于同时存在多个认知车辆的认知车联网环境的方法。同时为了提高认知车辆频谱接入的成功率,通过结合不同情况下的授权车辆和认知车辆的吞吐量设计了不同的反馈函数提出了一种改进的深度强化学习方法。所提出方法的性能明显优于传统的Q学习算法,能够更明显地提高频谱利用率,满足日益增长的车联网通信需求。 相似文献