首页 | 本学科首页   官方微博 | 高级检索  
     

水面无人艇自适应危险规避决策过程收敛性分析
引用本文:张汝波,唐平鹏,杨歌,李雪耀,史长亭.水面无人艇自适应危险规避决策过程收敛性分析[J].计算机研究与发展,2014(12).
作者姓名:张汝波  唐平鹏  杨歌  李雪耀  史长亭
作者单位:哈尔滨工程大学计算机科学与技术学院;大连民族学院机电信息学院;武汉第二船舶设计研究所;
基金项目:国家自然科学基金项目(60975071,61100005,60975019)
摘    要:水面无人艇(unmanned surface vehicle,USV)是一种重要的海洋自主机器人,当前正被广泛研究并逐渐应用于实际.然而USV的安全航行问题仍严重制约其自主性能的提高,尤其是在复杂海况下的危险规避问题亟待解决.以Sarsa在线策略强化学习算法为基础,提出了USV在复杂海况下的自适应危险规避决策模型,并以渐进贪心策略作为行为探索策略,证明了USV自适应危险规避决策过程能够以概率1收敛到最优行为策略.论证结果表明,采用在线策略强化学习算法提升USV在复杂海况下的危险规避性能是可行的.

关 键 词:水面无人艇  复杂海况  Sarsa在线策略强化学习  自适应危险规避决策过程  渐进贪心策略
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号