期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	2篇
免费	2篇

专业分类

综合类	1篇
自动化技术	3篇

出版年

2011年	3篇
2009年	1篇

排序方式： 共有4条查询结果，搜索用时 0 毫秒

基于倾向性分析的轨迹评测技术

金卓军钱徽朱淼良《浙江大学学报(工学版)》2011,45(10):1732-1737

通过逆向增强学习和策略不变条件下的回报函数变形原理,研究已有标准轨迹前提下的车辆轨迹评测问题,提出基于倾向性分析的轨迹评测技术.对于标准轨迹和评测轨迹应用逆向增强学习算法,分别求出两者相对应的特征权重,将特征权重在策略不变条件下分别扩展成线性子空间,通过计算由正交投影矩阵定义的子空间间距离得到对评测轨迹的评测值.在四轮车辆仿真实验中,针对几种典型的驾驶风格轨迹对该方法进行验证.实验结果表明,该方法能够对于避障评测轨迹按其与标准轨迹的差异给出评测结果,克服了相同策略对应回报函数不唯一性所带来的影响,有效解决了车辆轨迹之间难于定量比较的难题. 相似文献

基于轨迹分析的自主导航性能评估方法

下载免费PDF全文

王勇鑫钱徽金卓军朱淼良《计算机工程》2011,37(6):141-144

在马尔可夫决策模型框架下,提出一种基于轨迹分析的计算评估方法,通过分析驾驶回报设置和车辆轨迹的特征期望衡量自主导航系统的性能。假定回报函数是回报特征的线性组合,通过逼近不同的车辆自主驾驶策略,求解应用于沙盒场景的回报设置,从而仿真导航轨迹的特征期望。实验结果表明,该方法能对自主导航系统的轨迹数据实现定性和定量评估。相似文献

回报函数学习的学徒学习综述

金卓军钱徽陈沈轶朱淼良《智能系统学报》2009,4(3):208-212

通过研究基于回报函数学习的学徒学习的发展历史和目前的主要工作,概述了基于回报函数学习的学徒学习方法．分别在回报函数为线性和非线性条件下讨论,并且在线性条件下比较了2类方法——基于逆向增强学习（IRL）和最大化边际规划（MMP）的学徒学习．前者有较为快速的近似算法,但对于演示的最优性作了较强的假设;后者形式上更易于扩展,但计算量大．最后,提出了该领域现在还存在的问题和未来的研究方向,如把学徒学习应用于POMDP环境下,用PBVI等近似算法或者通过PCA等降维方法对数据进行学习特征的提取,从而减少高维度带来的大计算量问题．相似文献

改进的Online EM背景减除算法

下载免费PDF全文

王炜钱徽陈鹏金卓军《计算机工程》2011,37(4):201-202

为有效提取复杂场景中的运动前景,提出基于贝叶斯理论的Dirichlet共轭先验,结合在线最大似然估计(Online EM)改进基于高斯混合模型参数的背景减除算法.改进算法避免了陷入局部最值,在线自适应地调整高斯个数,并生成运动全景图,实验结果表明,该算法能有效提高前景检测率. 相似文献