共查询到19条相似文献,搜索用时 62 毫秒
1.
策略迭代是一种迭代地评估和改进控制策略的强化学习方法。采用最小二乘的策略评估方法可以从经验数据中提取出更多有用信息,提高数据有效性。针对在线的最小二乘策略迭代方法对样本数据的利用不充分、每个样本仅使用一次就被丢弃的问题,提出一种批量最小二乘策略迭代算法(BLSPI),并从理论上证明其收敛性。BLSPI算法将批量更新方法与在线最小二乘策略迭代方法相结合,在线保存生成的样本数据,多次重复使用这些样本数据并结合最小二乘方法来更新控制策略。将BLSPI算法用于倒立摆实验平台,实验结果表明,该算法可以有效利用之前的经验知识,提高经验利用率,加快收敛速度。 相似文献
2.
为实现复杂任务环境中多无人机的自主飞行, 本文采用改进的强化学习算法,设计了一种具有避碰避障功能的多无人机智能航迹规划策略。通过改进搜索策略、引入具有近似功能的神经网络函数、构造合理的立即回报函数等方法,提高算法运算的灵活性、降低无人机运算负担, 使得多无人机能够考虑复杂任务环境中风速等随机因素以及静态和动态威胁的影响, 自主规划出从初始位置到指定目标点的安全可行航迹。为了探索所提算法在实际飞行过程的可行性, 本文以四旋翼无人机为实验对象, 在基于ROS的仿真环境中验证了算法的可行性与有效性。 相似文献
3.
基于最小二乘法的K-NN航迹关联算法研究 总被引:1,自引:0,他引:1
航迹关联是分布式多平台数据融合系统中的一项关键技术,在民用空管系统、军用战场态势估计方面都有重要的应用。本文提出基于最小二乘法的K近邻域统计关联算法,用最小二乘法拟合航迹曲线,通过极大似然值来判断航迹是否关联。仿真实验表明这种算法在没有状态估计协方差的情况下是可行的。 相似文献
4.
针对复杂环境下无人机电力巡检航迹规划问题,从信息处理角度提出一种语义服务方法.构建一个具有环境态势感知、航迹构造和语义策略图模型的语义服务框架;利用巡检关联比重对实体对象进行空间划分,通过OWL形式化表示和J ena推理刻画巡检航线特征位置的因果关系,提出语义空间距离计算和基于强化学习的路径选择机制.研发语义服务模拟演... 相似文献
5.
《模式识别与人工智能》2005,18(5)
提出一种基于进化规划结合最小二乘法的自动模糊建模算法EPLSE.利用扩展Sugeno模型中的后件参数,对训练误差实现了二次修正,显著提高了建模精度并精简了模糊规则基.仿真部分应用EPLSE分别完成了对一个三输入非线性函数的建模和对Mackey-Glass混沌时间序列的预测,并与其他一些典型的模糊建模方法做了比较,结果表明该算法在提高建模精度以及精简结构方面具有较明显的优越性. 相似文献
6.
针对无人机飞行过程存在未知威胁使智能算法处理复杂度高,导致航迹实时规划困难,以及深度强化学习中调整DDPG算法参数,存在时间成本过高的问题,提出一种改进DDPG航迹规划算法.围绕无人机航迹规划问题,构建飞行场景模型,根据飞行动力学理论,搭建动作空间,依据非稀疏化思想,设计奖励函数,结合人工蜂群算法,改进DDPG算法模型... 相似文献
7.
提出一种基于最小二乘法的数字水印方法。该方法通过对线性方程组数值求解的过程实现对数字水印的嵌入和提取,并通过纠错码提高数字水印对攻击的抵抗力。实验数据表明该方法对于多种对数字水印的攻击有相当强的抵抗能力,是一种有较好的鲁棒性的数字水印方法。 相似文献
8.
无人机作为现代战争中广泛使用的设备,使无人机安全、准时完成任务。航迹规划就是针对各种任务需求,为无人机提供一条或多条可行航线,确保无人机处于自主飞行状态。本研究目的是研发通用性特征的无人机航迹规划与监控系统,在阐述设计该系统原则基础上,详细介绍无人机航迹规划与监控系统分层架构及用户控制层、数据管理层等,并提出开展各项测试。结果表明,所设计系统能顺利通过测试,达到实际应用的需求。 相似文献
9.
无线电导航是无人机传统导航模式,该模式的导航误差随时问积累;针对无线电导航系统由于非线性造成导航精度较低问题,提出了基于最小二乘估计的无线电导航方法;在研究非线性问题基础上构建了无线电导航系统模型;以航程推算为基准,进行了相应仿真计算分析;仿真分析表明基于最小二乘法的无线电导航系统能有效抑制非线性扰动,导航精度有较大提高. 相似文献
10.
针对无人机的三维航迹规划问题,提出了一种基于几何法的航迹规划算法.通过对无人机飞行航迹的分析,将无人机航迹看作是由一系列直线、圆弧和螺旋线的有序组成.研究了无人机最大过载系数、最大平飞速度、升限等性能与航迹可行性的关系,得出生成最优航迹的限定条件.讨论了几何法无人机航迹规划的步骤.按照几何原理对无人机航迹进行了规划,将无人战斗机的机动性能在航迹中充分体现出来.计算机仿真结果表明用几何法规划的航迹具有较好的适用性. 相似文献
11.
针对无人机跟踪目标的航迹规划问题,文章提出了一种双评估函数的改进A*算法;首先,根据无人机在跟踪目标时的飞行特点提出了航迹规划策略,并结合无人机的油耗、航迹长短和机动性能等约束条件来设计中间目标点的评估函数和航迹片段的评估函数;之后,采用加权法对A*算法进行改进,以使航迹的优化与时间耗费之间找到平衡点;同时,改进在Open表中插入与删除节点的方式,提高计算效率;最后,通过对跟踪航迹的仿真,表明该算法可以快速、有效地为无人机在跟踪目标时规划出优化的航迹. 相似文献
12.
本文介绍了交叉熵算法的基本原理、具体的建模方法、交叉熵算法的实时性和鲁棒性的特点,在实际应用中显示了良好的效果。鉴于军事侦察时间的紧迫性和空间的全面性的特点,依据无人机的具体应用技术特点,本文利用交叉熵算法对双架次的无人机的侦察路径进行规划,为路径规划提供了一种新的解决方法,并保证了侦察任务的路径规划在
在时间和效能上达到最优。 相似文献
在时间和效能上达到最优。 相似文献
13.
在无人飞行器航路规划问题的研究中,为提高航路规划的效率和精度,针对传统遗传算法收敛速度慢、易陷入局部最优、寻优精度较差的问题,提出了一种分层思想的解决方法.首先用链接图法描述规划环境,通过采用Dijkstra算法寻找初始最优航路,并利用航路编码技术对初始航路进行优化;然后在已有的研究成果上,提出一种集混沌优化、模拟退火、遗传算法为一体的改进遗传算法(CGASA),在解决多目标多约束优化问题时取得了较好的结果;最后综合考虑飞行器的机动性能、威胁因素、飞越目标进入角度等代价的选取,利用改进遗传算法调整导航点的位置得出了满足性能要求的航路. 相似文献
14.
15.
16.
基于遗传算法的输电线路无人机巡检路径规划 总被引:1,自引:0,他引:1
针对无人机有效、安全巡检输电线路的路径问题,提出了一种基于遗传算法的输电线路无人机巡检路径规划方法,采用极坐标编码方式对无人机巡检路径构造染色体;结合实际情况中的无人机巡检各种约束问题,设计了适合于无人机巡检路径规划的遗传算子;实验结果证明算法能综合考虑各种因素,提高了全局寻优能力,是解决实际输电线路无人机巡检路径规划问题的较好办法. 相似文献
17.
为提高多无人机(Unmanned aerial vehicles, UAV)协同轨迹规划(Cooperative trajectory planning, CTP)效率, 在解耦序列凸优化(Sequential convex programming, SCP)方法基础上, 提出一种高效求解凸优化子问题的定制内点法. 首先引入松弛变量, 构建子问题的等价描述形式, 并推导该形式下的子问题最优性条件. 然后在预测−校正原对偶内点法的框架下, 构建一套高效求解最优性条件方程组的计算流程以降低子问题计算复杂度, 并利用约束矩阵特征提出一种快速计算原对偶搜索方向的方法以提高规划效率. 仿真结果表明, 在解耦序列凸优化框架下, 定制内点法可将协同轨迹规划耗时降低一个数量级, 达到秒级. 相似文献
18.
针对当前强化学习算法在无人机升空平台路径规划任务中样本效率低、算法鲁棒性较差的问题,提出一种基于模型的内在奖励强化学习算法。采用并行架构将数据收集操作和策略更新操作完全解耦,提升算法学习效率,并运用内在奖励的方法提高智能体对环境的探索效率,避免收敛到次优策略。在策略学习过程中,智能体针对模拟环境的动态模型进行学习,从而在有限步内更好地预测状态、奖励等信息。在此基础上,通过结合有限步的规划计算以及神经网络的预测,提升价值函数的预测精准度,以利用较少的经验数据完成智能体的训练。实验结果表明,相比同样架构的无模型强化学习算法,该算法达到相同训练水平所需的经验数据量减少近600幕数据,样本效率和算法鲁棒性都有大幅提升,相比传统的非强化学习启发类算法,分数提升接近8 000分,与MVE等主流的基于模型的强化学习算法相比,平均分数可以提升接近2 000分,且在样本效率和稳定性上都有明显提高。 相似文献