首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 359 毫秒
1.
针对随机探索易于导致梯度估计方差过大的问题,提出一种基于参数探索的期望最大化(Expectation-maximization,EM)策略搜索方法.首先,将策略定义为控制器参数的一个概率分布.然后,根据定义的概率分布直接在控制器参数空间进行多次采样以收集样本.在每一幕样本的收集过程中,由于选择的动作均是确定的,因此可以减小采样带来的方差,从而减小梯度估计方差.最后,基于收集到的样本,通过最大化期望回报函数的下界来迭代地更新策略参数.为减少采样耗时和降低采样成本,此处利用重要采样技术以重复使用策略更新过程中收集的样本.两个连续空间控制问题的仿真结果表明,与基于动作随机探索的策略搜索强化学习方法相比,本文所提方法不仅学到的策略最优,而且加快了算法收敛速度,具有较好的学习性能.  相似文献   

2.
陈珂  洪银杰  陈刚 《软件学报》2012,23(6):1588-1601
基于可能世界的不确定集合的相似查询,从语义上或者从计算方法的角度来看,都有别于传统的确定型集合上的技术.由于集合中的项存在不确定性,即一个项出现在集合中是有一定概率的,使得传统处理集合的技术不再适用.提出了一个基于可能世界的集合期望相似度的度量公式.在期望的度量公式中,如果一对集合(X,Y)的期望相似度大于给定的阈值τ∈(0,1),则被称为相似集合对.一般的算法,在基于可能世界的情况下计算不确定集合的期望相似度,其复杂度是指数级的.提出了利用动态规划来计算集合期望相似度的算法,该算法的复杂度是多项式级别,极大地减少了计算时间.实验结果表明了基于该算法查询的可用性和高性能.  相似文献   

3.
不确定环境下移动机器人目标搜索问题中,目标在观测点被发现的概率常被设为理想的均匀分布,其路径优化指标通常为最短距离,但最短距离路径不等同于最优期望时间路径.针对此问题,本文提出了一种以期望时间为优化指标的概率多目标搜索算法.针对观测点的访问顺序不同会导致期望时间不同的现象,采用分层式路径优化策略.首先,构造一个新的非均匀目标分布概率测算模型;然后,在上层序列规划中,采用改进的改良圈算法生成期望观测点序列;最后,在下层特征地图的观测点间可行路径规划中,采用改进的快速随机生成树算法(GBC–RRT).实验结果表明:本文所提方法可显著缩短移动机器人目标搜索的期望时间,且能在目标不确定、非均匀分布的工作空间中得到最优期望时间的搜索路径.  相似文献   

4.
研究在汽车转向控制中遇到的、具有输出约束的一类非线性不确定系统的鲁棒采样 控制和鲁棒采样最优控制问题,结果表示为一些矩阵不等式.最后基于线性矩阵不等式,给出 了一个迭代算法和算例.数值计算实例证明了该算法的有效性.  相似文献   

5.
在多层屏幕空间环境光遮蔽算法中,为解决计算开销随深度缓存层数线性增长的问题,提出一种自适应的多层屏幕空间环境光遮蔽算法.首先分析部分采样点在所有深度缓存层上的深度变化幅度,估算出所需的采样层数Dmax;然后在其余采样点上进行多层计算,到Dmax层便停止.实验结果证明,该算法避免了在深度变化平缓区域进行无效的多层计算,以接近单层算法的绘制效率获得了和多层算法几乎完全相同的绘制效果.  相似文献   

6.
基于多项式的遥感图像快速几何校正   总被引:1,自引:0,他引:1  
遥感图像几何校正是遥感信息处理中的重要内容之一.提出了一种遥感图像的快速几何校正算法,该算法把畸变图像划分成多个子块,分别由多个处理块对子块进行重采样计算,在重采样计算上又使用最大限度地减少坐标变换的冗余计算方法.经实例证明了该算法能够有效地提高遥感图像的处理速度.  相似文献   

7.
《计算机工程》2017,(1):13-19
为提高移动云数据存储远程服务器的计算和存储能力,提出一种改进的移动云数据存储算法。利用表决数据分配和表决数据处理框架,构建考虑节点失效概率的重采样期望传播时间计算模型,并建立整合能源效率和容错性的表决动态网络。采用概率分布估计对动态网络模型进行存储路径优化,应用Gibbs采样解决分布估计的样本数据高维耦合和无监督训练问题。实验结果表明,与贪心算法、随机放置算法和分布估计算法相比,该算法具有更高的能源效率和存储可靠性。  相似文献   

8.
时滞系统采样迭代学习控制   总被引:3,自引:1,他引:2  
针对一类具有状态时滞的连续系统提出一种采样迭代学习控制算法。给出并证明了算法指数收敛的充分条件,该条件可保证系统输出无论在采样点或非采样点上,都能以指数收敛速率收敛至期望输出的一个与采样周期有关的误差范围内。仿真结果表明了该算法的有效性。  相似文献   

9.
基于动态网格划分的移动无线传感器网络定位算法   总被引:2,自引:1,他引:1  
定位技术是无线传感器网络中关键的基础支撑技术,目前提出了许多静态网络的节点定位算法,移动无线传感器网络的定位研究相对较少.针对定位节点和参考节点随机运动的网络模型,提出了一个基于动态网格划分的蒙特卡罗定位算法.算法中当接收的参考节点数超过一定阈值时使用最远距离节点选择模型,选出部分参考节点参与定位和信息转发,节约能耗.接着基于选择的或所有接收的参考节点构建采样区域,进行网格划分,使用网格单元数计算最大采样次数,在采样区域内采样并使用误差补偿的运动模型进行过滤,提高了采样效率,减少了计算开销,并保证了较好的定位精度.仿真实验表明算法在定位精度,计算开销、能耗等方面都具有较好的性能.  相似文献   

10.
针对传统随机路标图(PRM)算法对航迹规划的自由空间进行随机采样表现出的随机性,和在狭窄通道中可能出现的航迹无解问题,提出一种改进PRM的航迹规划算法。通过将障碍物的边界点作为确定采样点,并对栅格地图的自由空间建立最优可行区域,降低传统PRM算法随机采样点的分散性,使路径搜索具有明确性,以此来提高算法在时间和空间上的利用率。为验证算法的有效性,采用MATLAB仿真平台建立无人机二维和三维空间,进行航迹规划对比实验。实验结果表明:在三维空间中,改进PRM算法较传统PRM算法航迹规划时间降低2. 469%至5. 721%,航迹长度减少0. 89%至1. 54%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号