首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   4篇
  免费   0篇
金属工艺   2篇
水利工程   1篇
自动化技术   1篇
  2023年   1篇
  2007年   2篇
  2000年   1篇
排序方式: 共有4条查询结果,搜索用时 0 毫秒
1
1.
李保罗  蔡明钰  阚震 《控制与决策》2023,38(7):1835-1844
针对动态不确定环境下机器人执行复杂任务的需求,提出一种线性时序逻辑(linear temporal logic, LTL)引导的无模型安全强化学习算法,能在最大化任务完成概率的同时保证学习过程的安全性.首先,综合考虑环境中的不确定因素,构建马尔可夫决策过程(Markov decision process, MDP),再用LTL刻画智能体的复杂任务,将其转化为有多接受集的基于转移的有限确定性广义布奇自动机(transition-based limit deterministic generalized Büchi automaton, t LDGBA),并通过接受边界函数构建可记录当前待访问接受集的约束型tLDGBA (constrained tLDGBA,ctLDGBA);其次,构建乘积MDP用于强化学习搜索最优策略;最后,基于LTL对安全性的描述和MDP的观测函数构建安全博弈,并根据安全博弈设计安全盾机制保证系统在学习过程中的安全性.严格的分析证明了所提出的算法能获得最大化LTL任务完成概率的最优策略.仿真结果验证了LTL引导的安全强化学习算法的有效性.  相似文献   
2.
针对传统方法中权值分配不合理会导致某个目标下非支配解遗失的问题,提出了均值自适应法、均值波动自适应法以及均值调节与传统算式相结合的三种的方法,使遗传算法中权值系数的设置得到了很大程度的改善,一定程度上提高了多目标下遗传算法的优化性能,并通过在车桥厂实例中的应用,取得了良好的效果,证明了此种方法的可行性和有效性。  相似文献   
3.
随着科学技术的发展,机器人已经实现了控制的多样化和智能化,并在社会生活中扮演着越来越重要的角色。该课题设计并实现的是具备一定智能的礼仪机器人。它在外形上仿照了人的外形,集合了声、光、电等检测手段,可实现自动检测来宾,完成点头、转头、行走、与人握手以及基于语音识别的命令控制和人机对话等功能。文章主要论述的是该控制系统的硬件组成与软件实现。  相似文献   
4.
本文在总结葛洲坝集团公司建材、机电、化工三大工业产业的形成动因和发展历程的基础上,对其市场竞争力的体现和优劣进行了分析,提出了建立核心竞争力的重要性和基本原则,对提高三大产业竞争力的方式和方向作了有益的探讨,提出了以既有三大行业的基础为前提,以核心竞争力的建立为方向,以竞争力要素组织为手段,提高竞争力的政策建议。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号