首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
基于案例的自主式水下机器人全局路径规划的学习算法   总被引:4,自引:0,他引:4  
首次讨论了基于案例的学习方法在自主式水下机器人全局路径规划中的应用问题,基于案例的学习方法是一种增量式的学习过程,它根据过去的经验进行学习及问题求解。本文对基于案例的学习方法在自主式水下机器人的全局路径规划中的应用框架进行了初步研究,对案例属性的提取、案例的匹配和择优以及案例库的更新等问题提出了相应的算法,最后给出了几组仿真结果。  相似文献   

2.
提出了一种基于归一化径向基函数的自适应启发评价强化学习算法,用于异构无线网络系统中自主的动态频谱分配.该算法利用归一化径向基函数自适应构建状态空间,加快学习速度;利用自适应启发评价机制减少不必要的探索,提高学习效率.通过与无线环境交互,算法学会为不同接入网内的各个会话动态分配合适的频段.仿真结果表明,在同等网络条件下,该算法能获取更好的频谱利用率和服务质量,性能优于确定性频谱分配策略和一般的动态频谱分配策略.  相似文献   

3.
为了克服在基于案例推理中单一案例库检索的局限性,提出了基于贝叶斯信念网络的多案例库检索方法.该方法仅要求用户采用关键词对目标案例进行描述,通过贝叶斯信念网络计算关键词与各案例库的特征属性的匹配概率,以获得适应各案例库的完整的目标案例描述,然后对相应的案例库进行案例检索;将从多案例库中检索到的案例通过相似度线性归一处理后,结合目标案例描述的匹配概率获得与目标案例的最终相似度,统一排序后返回检索结果.最后通过航空企业的实际应用与性能分析进一步验证了多案例库检索方法的有效性.  相似文献   

4.
针对两轮机器人自平衡运动控制问题,提出了一种基于Boltzamnn机的Skinner操作条件反射学习机制作为机器人仿生自主学习的算法.该算法利用Boltzamnn机中Metropolis判据平衡Skinner操作条件反射学习中探索和利用的比例,并依据概率取向机制以一定的概率选择最优行为,从而使机器人在未知环境下可获得像人或动物一样的仿生自主学习技能,实现机器人的自平衡运动控制.最后,分别用基于Boltzamnn机的Skinner操作条件反射的学习算法和基于贪婪策略的Skinner操作条件反射的学习算法做了仿真实验并进行了比较.结果表明,基于Boltzamnn机的Skinner操作条件反射的学习算法能使机器人获得较强的运动平衡控制技能和较好的动态性能,体现了机器人的自主学习特性.  相似文献   

5.
以未知环境下多机器人学习为研究平台,因案例推理方法可存储以前的问题和解信息,用该方法的长期记忆特性可帮助粒子群优化算法更好地解决新的问题。在特定的仿真环境里,粒子群优化算法可训练机器人的几个基本行为,经过学习使机器人具有更好的鲁棒性和自适应学习能力。根据机器人不同行为在复杂环境下的性能指标,CBR可从案例库中选择特定的行为,并将其参数传送到粒子群优化算法的初始解库,从而加速整体的学习过程。利用机器人仿真软件MissionLab,采用基于行为的多机器人编队任务,用来测试该算法的有效性。仿真和实验结果表明,案例推理方法和粒子群优化算法相结合,使机器人获得更优的控制参数,同时在未知环境下的多机器人编队具有更好的性能。  相似文献   

6.
针对认知无线电系统参数重配置问题,提出了一种基于元胞量子蜂群算法和信道案例库的混合跨层认知决策引擎。该认知决策引擎充分考虑无线通信网络各层参数,以网络整体性能最优为优化目标;提出的元胞量子蜂群算法,利用双策略对种群进行混沌初始化,设计了基于元胞自动机原理和社会认知策略的快速量子旋转角调整策略用于实现引领蜂和跟随蜂的邻域搜索;构建基于信道增益的认知无线电参数案例库,用于实现快速决策。仿真结果表明,该认知决策引擎能够根据无线通信环境和用户需求的变化,动态的进行参数的重配置,同时其在收敛速度、收敛精度和算法稳定性上都明显优于基于二进制人工蜂群算法和量子遗传算法的认知决策引擎。  相似文献   

7.
针对无线异构链路环境中传统TCP协议拥塞控制机制效率较低的问题,提出一种基于ECN标记策略的优化算法.该算法针对常用的单一标记方法,在标记对象和标记位置中灵活地采用双向机制,有效提高了无线数据传输效率.用标准网络仿真软件NS-2进行仿真,结果显示该算法优于现有常用算法.  相似文献   

8.
为了实现无线接入网的高效节能,提出了一种业务量驱动的自主节能机制,包括基于业务量的节能时间域划分方法、阶段式的节能触发算法和节能恢复算法. 为了评估机制的有效性,提出了无线接入网能耗模型和评估方法. 基于现网的拓扑场景,对提出的自主节能机制进行仿真验证,结果表明,该机制能在保证区域业务质量和实现有效覆盖补偿的基础上,至少达到17.5%的节能效果,相比其他节能机制,能在均衡各方面性能的基础上达到很好的节能效果.  相似文献   

9.
针对室内无线传感器网络通信传输不稳定和定位精度较差的情况,提出了一种移动机器人自主动态定位系统,通过实时选择邻近信标节点,确定节点坐标构成的边界,绘制局部网格空间,实现机器人动态定位.利用接收信号强度指标实现测距,然后采用基于测距的改进近似三角形内点测试(APIT)算法完成定位,再使用卡尔曼算法修正定位误差.该方法适用于室内网络传输不稳定的实际情况,采用卡尔曼滤波器获得最优数据.实验结果表明,该移动机器人自主动态定位方法比基于网格的极大似然方法具有更好的精度和适应性.  相似文献   

10.
针对高负载无线传感器网络堵塞率比较高的问题,提出了一种基于蚁群策略的双信道传感器网络路由算法(CORA).该算法首先利用双信道通信模式降低了信道竞争过程中的数据碰撞和多播抑制几率;再利用最大感染球策略来压缩蚁群的寻路范围,进而降低网络的寻路能耗;借助分层图模型提出了一种两层网络联合优化的选路策略,该策略可将控制层中被堵塞的寻路业务有条件地下放在数据层中传输,从而降低网络的堵塞率和通信延迟.仿真结果表明,与一种基于蚂蚁策略的能量有效路由算法及一种基于蚁群策略的能量有效路由算法相比,CORA算法能将高负载网络下的堵塞率下调13%,且能有效降低数据包的平均通信时间和网络的通信能耗.  相似文献   

11.
离散对数在密码学上具有广泛的应用,但基于离散对数的密码算法都假定离散对效的计算是困难的.本文讨论计算离散对数的高位比特与计算离散对数的等价性,利用D.Boneh所提出的方法对密码学上通常使用的强素数讨论了离散对数的比特安全性,得到结论:如果离散对数的高位比特可以计算,那么存在计算离散对数的有效算法.  相似文献   

12.
针对认知无线电(CR)的智能学习研究需求,提出了一种基于最小二乘支持向量机(LSSVM)的CR学习、决策方法.通过遗传算法(GA)进行超参数搜索,建立适当的基于LSSVM的CR学习模型,利用历史案例进行LSSVM离线训练学习,获得知识来指导未来的决策.仿真结果表明,GA-LSSVM能在较少进化代数内搜索出合适的超参数,并且LSSVM学习决策方法能有效提高CR系统的性能.  相似文献   

13.
基于对向传播神经网络的人脸识别方法   总被引:2,自引:0,他引:2  
根据对向传播网络适于模式分类的特性,提出了基于对向传播网络的人脸识别方法。同时,为了克服对向传播网络在训练过程中的不稳定性,改进了对向传播网络的学习算法,并且以国际通用的ORL人脸库为对象进行实验研究。结果表明,选择合适的参数,就可以达到理想的识别效果。证明了基于对向传播网络的人脸识别方法是有效可行的。  相似文献   

14.
In order to improve the agility and applicability of trajectory planning algorithm for autonomous vehicles, this paper proposes a novel actor-critic based learning method for decision-making and planning in multi-vehicle complex traffic. It is the coupling planning of vehicle's path and speed thus to make the trajectory more flexible. First, generations from the decided action to the planned trajectory are described by the end-point of the trajectory. Then, the actor-critic based learning method is built to learn an optimal policy for the decision process. It can update the policy by the gradient of the current policy's advantage. In this process,features of the real traffic are carefully extracted by time headway(TH) and speed distribution. Reward function is built by the safety, efficiency and driving comfort. Furthermore, to make the policy network have better convergency, the policy network is modularized in two parts: the lane-changing network and the lane-keeping network, which decide the optimal end-point of the path and speed candidates respectively. Finally, the curved overtaking scenario and the interaction process with human driver are conducted to illustrate the feasibility and superiority. The results show that the proposed method has better real-time performance and can make the planned coupling trajectory more continuous and smoother than the existing rule-based method.  相似文献   

15.
针对自动驾驶车辆在行使中对目标路径跟踪精度不高、鲁棒性能较差等问题,提出了一种深度确定性策略梯度RF-DDPG(reward function-deep deterministic policy gradient)路径跟踪算法。该算法是在深度强化学习DDPG的基础上,设计DDPG算法的奖励函数,以此优化DDPG的参数,达到所需跟踪精度及稳定性。并且采用aopllo自动驾驶仿真平台,对原始的DDPG算法和改进的RF-DDPG路径跟踪控制算法进行了仿真实验。研究结果表明,所提出的RF-DDPG算法在路径跟踪精度以及鲁棒性能等方面均优于DDPG算法。  相似文献   

16.
提出一种基于博弈论的连续博弈无线资源管理算法,将博弈论数学模型应用于多输入-多输出系统无线资源管理中,把其中的参数映射为博弈论数学模型中的“局中人”,将参数变化描述为“局中人”博弈过程.在仿真中,比较该算法与传统联合波束成形及功率控制算法.仿真结果表明,该算法在节省发射功率的同时,可提高输出信干噪比,达到两者最佳均衡.同时可有效克服期望的导引矢量和实际的导引矢量不匹配问题,使天线能准确对准期望用户方向,并能抑制干扰方向的信号,起到“零陷”作用.  相似文献   

17.
随着人工智能技术的发展,深度神经网络广泛应用于人脸识别、语音识别、图片识别以及自动驾驶等领域.由于轻微的扰动就可以使深度神经网络出现错误分类,所以在有限的时间内实现特定的攻击效果是对抗攻击领域研究的重点之一.针对有目标对抗攻击算法中产生扰动时间久和扰动易被人眼观察的问题,基于Deepfool提出了在典型的卷积神经网络上...  相似文献   

18.
分层多管理者网络故障监控策略   总被引:2,自引:1,他引:1  
为了降低实时监控而增加的网络管理负担,提出一种分层多管理者网络故障监控策略.应用多代理马尔可夫决策过程,建立了一种新的多管理者网络故障监控机制,并给出了该机制下基于强化学习的轮询策略.采用这种基于多管理者的马尔可夫决策过程的分层网络故障管理技术,缩短了轮询次数,并能准确地发现网络故障,同时减少网络管理的信息开销.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号