首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
基于缩减信念状态的Conformant 规划方法   总被引:1,自引:0,他引:1  
魏唯  欧阳丹彤  吕帅 《软件学报》2013,24(7):1557-1570
Conformant 规划问题通常转化为信念状态空间的搜索问题来求解.提出了通过降低信念状态的不确定性来提高规划求解效率的方法.首先给出缩减信念状态的增强爬山算法,在此基础上,提出了基于缩减信念状态的Conformant 规划方法,设计了CFF-Lite 规划系统.该规划器的求解过程包括两次增强爬山过程,分别用于缩减信念状态和搜索目标.首先对初始信念状态作最大程度的缩减,提高启发函数的准确性;然后从缩减后的信念状态开始执行启发式搜索.实验结果表明,CFF-Lite 规划系统通过快速缩减信念状态降低了问题的求解难度,在大多数问题上,求解效率和规划解质量与Conformant-FF 相比,都有显著的提高.  相似文献   

2.
为压缩一致性规划的状态空间,并加快一致性规划的求解速度,将常量引入到一致性规划中,定义一致性规划中的常量,形成新的知识表示"多值一致性规划任务",定义多值一致性规划动作模型,提出一致性规划常量合成方法,给出一致性规划常量合成算法.该方法利用常量的特性在所有初始世界状态和所有实例动作中猜测、验证常量.理论分析和实验结果表明该算法能合成正确的一致性规划常量,生成多值一致性规划任务.为说明一致性规划常量的应用效果,把生成的多值一致性规划任务与规划解重用启发式结合求一致性规划解,并与规划系统CFF进行对比实验.实验结果表明求解质量和效率较高.  相似文献   

3.
研究了一致性规划任务信念状态空间的表示方法。针对一致性有限域表示(CPT-FDR)算法在任务生成阶段选择状态变量的不足,提出了一种基于初始状态中文字相容互斥的状态变量选择算法——MECV算法。CPT-FDR未考虑初始信念状态中文字的互斥性,产生冗余的编码信息,降低了编码的效率。MECV算法利用有用正负文字构造新的未覆盖事实集,提取初始信念状态中处于不同世界状态的文字组成互斥组,再编码状态变量。实验结果表明该算法能有效地压缩信念状态空间。  相似文献   

4.
近年来,规划中的学习问题重新受到了关注.如何通过学习机制改善现有规划器,使其能够可靠而令人信服地超越现有非学习的规划器的能力,仍然是一个尚未解决的难题.提出了面向规划问题和解的结构的基于学习的规划技术.该方法将先验知识表示成“子问题-规划片段”的形式.每次规划器成功找到解以后,根据问题的初始状态和目标状态,构造规划对象的初始子状态和目标子状态,构成子问题,并从规划解中抽取该子问题对应的规划片段.这些先验知识将被唯一记录并保存成先验知识库.新问题的求解首先从先验知识库中检索与当前求解问题相关的先验知识;然后,将这些先验知识经过例化、合并步骤后编码成句子;最后,将这些句子连同问题编码得到的句子作为SAT 求解器的输入,实现最终解的确定.实验使用了IPC 中的基准测试例子进行测试.实验结果表明,SOLP 算法求解速度与传统非学习的规划器相比具有明显优势,最佳情况下可达约80%的效率提升.  相似文献   

5.
智能规划器StepByStep的研究和开发   总被引:3,自引:0,他引:3  
吴向军  姜云飞  凌应标 《软件学报》2008,19(9):2243-2264
智能规划器是智能规划研究成果的重要表现形式,规划器的求解效率和规划质量是智能规划理论研究的直接反映.首先介绍智能规划器的一般结构和StepByStep规划器的总体结构,然后详细阐述StepByStep规划器各组成部分所采用的方法和策略,定义谓词知识树来提取领域知识.在谓词知识树的基础上定义谓词规划树,并用各种策略来提高规划树的生成效率.在谓词规划树的基础上设计StepByStep的规划策略,最后用8个规划器对3个具有代表性的基准规划领域及其规划问题进行实际的求解实验,分析了StepByStep规划器在求解效率和规划质量上的具体表现.实验数据表明,StepByStep规划器的规划策略对3个不同规划领域都具有很好的指导作用,验证了领域知识在规划求解过程中的实际价值.  相似文献   

6.
对于成像卫星的操作规划,如何高效求解其规划问题模型是一个十分关键的问题。针对基于规划域定义语言(PDDL)表示的成像卫星操作规划问题的求解,采用将基于命题式的PDDL语言描述的模型转化为多值变量模型的方法,建立了基于混合整数规划的问题求解模型,从而可以方便地采用混合整数规划的已有求解器进行求解,提高了问题的求解效率。对关键技术进行了分析,并设计了问题求解流程。仿真实验结果证明该方法是可行和适用的。  相似文献   

7.
在连续状态的部分可观察马尔可夫决策过程中,在线规划无法同时满足高实时性与低误差的要求.为此,提出一种基于后验信念聚类的在线规划算法.使用KL散度分析连续状态下后验信念之间的误差,根据误差分析结果对后验信念进行聚类,利用聚类后验信念计算报酬值,并采用分支界限裁剪方法裁剪后验信念与或树.实验结果表明,该算法能够有效降低求解问题的规模,消除重复计算,具有较好的实时性和较低的误差.  相似文献   

8.
为实现物流管理系统中的资源分配问题,分析了物流管理中任务的特点,提出了在应用multi-agent的物流系统中规划的表示方法,并提出了一种分布式求解方法。这种分布式方法是在对状态空间的层次分析基础上,利用状态空间结点之间的联系,实现求解中多agent相互促进的合作。  相似文献   

9.
为实现物流管理系统中的资源分配问题,分析了物流管理中任务的特点,提出了在应用multi-agent的物流系统中规划的表示方法,并提出了一种分布式求解方法.这种分布式方法是在对状态空间的层次分析基础上,利用状态空间结点之间的联系,实现求解中多agent相互促进的合作.  相似文献   

10.
以规划领域中的不确定状态转移系统作为研究对象,给出最小权值强规划解的概念,提出一种求最小权值强规划解的方法.该方法可以求解与动作代价相关的数值规划问题,在不确定状态转移系统的执行动作上增加权值来表示动作的代价,在此基础上设计求解最小权值强规划解的算法.实验结果表明,该算法能有效求解最小权值强规划解,且比用反向搜索方法求...  相似文献   

11.
基于模态逻辑D公理系统的Conformant规划方法   总被引:4,自引:0,他引:4  
2006年,conformant规划问题成为国际规划竞赛不确定性问题域中的标准测试问题,得到研究人员的广泛关注.目前,conformant规划系统都是将其看成信念状态空间上的启发式搜索问题予以求解.通过分析conformant规划问题的语法和语义,提出新的基于模态逻辑的规划框架.将其转换为模态逻辑D公理系统的一系列定理证明问题.提出2种基于模态逻辑的编码方式.构造相应的公理与推理规则形成模态公式集,保证对于D系统的定理证明过程等同于原问题的规划过程.并通过问题实例验证该方法的有效性.继基于SAT、CSP、线性规划、模型检测等求解技术的规划方法后,该规划框架是基于转换的规划方法的一种新的尝试.  相似文献   

12.
Planning graphs have been shown to be a rich source of heuristic information for many kinds of planners. In many cases, planners must compute a planning graph for each element of a set of states, and the naive technique enumerates the graphs individually. This is equivalent to solving a multiple-source shortest path problem by iterating a single-source algorithm over each source.We introduce a data-structure, the state agnostic planning graph, that directly solves the multiple-source problem for the relaxation introduced by planning graphs. The technique can also be characterized as exploiting the overlap present in sets of planning graphs. For the purpose of exposition, we first present the technique in deterministic (classical) planning to capture a set of planning graphs used in forward chaining search. A more prominent application of this technique is in conformant and conditional planning (i.e., search in belief state space), where each search node utilizes a set of planning graphs; an optimization to exploit state overlap between belief states collapses the set of sets of planning graphs to a single set. We describe another extension in conformant probabilistic planning that reuses planning graph samples of probabilistic action outcomes across search nodes to otherwise curb the inherent prediction cost associated with handling probabilistic actions. Finally, we show how to extract a state agnostic relaxed plan that implicitly solves the relaxed planning problem in each of the planning graphs represented by the state agnostic planning graph and reduces each heuristic evaluation to counting the relevant actions in the state agnostic relaxed plan. Our experimental evaluation (using many existing International Planning Competition problems from classical and non-deterministic conformant tracks) quantifies each of these performance boosts, and demonstrates that heuristic belief state space progression planning using our technique is competitive with the state of the art.  相似文献   

13.
《Artificial Intelligence》2006,170(6-7):507-541
Conformant planning is the task of generating plans given uncertainty about the initial state and action effects, and without any sensing capabilities during plan execution. The plan should be successful regardless of which particular initial world we start from. It is well known that conformant planning can be transformed into a search problem in belief space, the space whose elements are sets of possible worlds. We introduce a new representation of that search space, replacing the need to store sets of possible worlds with a need to reason about the effects of action sequences. The reasoning is done by implication tests on propositional formulas in conjunctive normal form (CNF) that capture the action sequence semantics. Based on this approach, we extend the classical heuristic forward-search planning system FF to the conformant setting. The key to this extension is an appropriate extension of the relaxation that underlies FF's heuristic function, and of FF's machinery for solving relaxed planning problems: the extended machinery includes a stronger form of the CNF implication tests that we use to reason about the effects of action sequences. Our experimental evaluation shows the resulting planning system to be superior to the state-of-the-art conformant planners MBP, KACMBP, and GPT in a variety of benchmark domains.  相似文献   

14.
给出了PPDDL一致性规划任务和有限域一致性规划任务的定义,扩展了非确定动作等相关语义,并在此基础上提出了一种将PPDDL表示的一致性规划任务转换为有限域表示的一致性规划任务的CFDR方法,实现了经典规划的FDR转换算法在一致性规划中的扩展。相比MCPT算法,主要改进了其中的合成不变量方法和任务生成方法,此外还增加了对于非确定动作效果的表示和处理。通过在标准的一致性规划域上的实验,证明了CFDR的适用性和有效性。  相似文献   

15.
一种基于非单调逻辑的模型管理方法   总被引:2,自引:0,他引:2  
蓝红兵  费奇 《自动化学报》1992,18(4):414-420
本文讨论了模型管理中不确定性的表达、传递、证据合成以及问题求解过程,提出了一种 基于非单调逻辑的模型管理方法:将模型结构形式的不确定性表示为由建模者或领域专家对 问题结构中未知或随机情形所作假设集支持的可能性命题;模型之间不确定性关系的管理通 过对假设环境的真值(一致性)保持和信度调整过程来实现,其依据是在问题求解过程中出现 的冲突情形或者是由决策人提供的有关命题或次判断.  相似文献   

16.
经典的AGM信念修正理论和以D-P假设为代表的迭代信念修正理论都是以完全指派为可能世界而进行的理论研究.把这些研究推广到有缺指派的领域中与完全指派为每个原子命题符号都指派真假值不同,有缺指派是一个三值指派,它可以为每个原子命题符号指派真、假和不确定三值之一.以有缺指派为可能世界,对D-P系统进行了推广,证明了相应的表示定理.  相似文献   

17.
主要研究一阶部分可观测马尔可夫决策过程的近似求解方法。给出了一阶信念、一阶信念粒度、流关键度的概念;提出了基于流关键度的粒度归结方法,统一一阶信念粒度;提出了一阶信念粒度距离度量方法,提出FO-PBVI方法,将PBVI提升到抽象层面。通过Tiger和Tag实验对方法进行了验证分析,通过实验可见FO-PBVI方法能够很好地适应问题规模的变化,能够求解较大规模的规划问题。  相似文献   

18.
Logical filtering is the process of updating a belief state (set of possible world states) after a sequence of executed actions and perceived observations. In general, it is intractable in dynamic domains that include many objects and relationships. Still, potential applications for such domains (e.g., semantic web, autonomous agents, and partial-knowledge games) encourage research beyond intractability results.In this paper we present polynomial-time algorithms for filtering belief states that are encoded as First-Order Logic (FOL) formulas. Our algorithms are exact in many cases of interest. They accept belief states in FOL without functions, permitting arbitrary arity for predicates, infinite universes of elements, and equality. They enable natural representation with explicit references to unidentified objects and partially known relationships, still maintaining tractable computation. Previous results focus on more general cases that are intractable or permit only imprecise filtering. Our algorithms guarantee that belief-state representation remains compact for STRIPS actions (among others) with unbounded-size domains. This guarantees tractable exact filtering indefinitely for those domains. The rest of our results apply to expressive modeling languages, such as partial databases and belief revision in FOL.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号