排序方式: 共有44条查询结果,搜索用时 15 毫秒
11.
针对机器人足球比赛中智能体的智能性低、难以解决复杂问题的情况,提出慎思式的决策结构来提高智能体的自主水平,并将该结构应用到RoboCup中,仿真比赛的结果表明。这种慎思结构在RoboCup中的应用是可行、有效的。 相似文献
12.
13.
14.
15.
针对异构无线传感器网络节点性能存在差异和易受环境影响的特点,提出一种基于部分可观察Markov决策过程(partially observable markov decision process,POMDP)的实时休眠调度算法,使用状态转移函数和观察函数表示系统完成用户请求任务中存在的环境噪声和传输冲突等不确定性,使用回报函数表示采用不同调度策略对异构网络感知准确度和能量消耗的影响,采用基于当前信念点的在线求解算法求取最优策略。仿真结果表明:该算法能够平衡数据准确性与能量消耗,延长网络生存时间。 相似文献
16.
机器人规划是人工智能和机器人学研究的重要领域,目前的研究已经转向动态不确定环境下的规划。通过分析一种机器人规划系统,针对其信念更新时间消耗过大的问题,提出新的HPOMDPRS系统,给出新系统的基本模型和运行机制。 相似文献
17.
以RoboCup仿真机器人足球比赛中的多个智能体为研究对象,对Multi—Agent协作问题进行了研究。为了使Multi—Agent能够协同工作来完成复杂的任务,同时使Agent具有较高的智能性和反应性,提出了Multi—Agent层次协作模型。实验结果验证了以上研究的有效性。 相似文献
18.
减少能量消耗,延长网络生存时间,是无线传感器网络中路由协议要考虑的重要问题;在对LEACH协议和定向扩散协议进行分析的基础上,针对这两种协议中存在的问题,提出一种基于簇首定向扩散(CHDD)的路由协议;该协议改进了簇首选择算法,在簇首与sink节点之间采用定向扩散算法,该协议可以有效地延长整个网络的生存时间,仿真结果证明该协议的性能改进。 相似文献
19.
部分可观察Markov决策过程是通过引入信念状态空间将非Markov链问题转化为Markov链问题来求解,其描述真实世界的特性使它成为研究随机决策过程的重要分支.介绍了部分可观察Markov决策过程的基本原理和决策过程,提出一种基于策略迭代和值迭代的部分可观察Markov决策算法,该算法利用线性规划和动态规划的思想,解决当信念状态空间较大时出现的"维数灾"问题,得到Markov决策的逼近最优解.实验数据表明该算法是可行的和有效的. 相似文献
20.
在连续状态的部分可观察马尔可夫决策过程中,在线规划无法同时满足高实时性与低误差的要求.为此,提出一种基于后验信念聚类的在线规划算法.使用KL散度分析连续状态下后验信念之间的误差,根据误差分析结果对后验信念进行聚类,利用聚类后验信念计算报酬值,并采用分支界限裁剪方法裁剪后验信念与或树.实验结果表明,该算法能够有效降低求解问题的规模,消除重复计算,具有较好的实时性和较低的误差. 相似文献