首页 | 本学科首页   官方微博 | 高级检索  
     

在部分观测环境下学习规划领域的派生谓词规则
引用本文:饶东宁,蒋志华,姜云飞,邓玉辉.在部分观测环境下学习规划领域的派生谓词规则[J].计算机学报,2015(7).
作者姓名:饶东宁  蒋志华  姜云飞  邓玉辉
作者单位:1. 广东工业大学计算机学院 广州 510090
2. 暨南大学信息科学与技术学院计算机科学系 广州 510632
3. 中山大学信息科学与技术学院软件研究所 广东 510275
基金项目:Our work is supported by the Fundamental Research Funds for the Central Universities,the National Natural Science Foundation of China,the Guangdong Natural Science Foundation (Nos.S2013020012865,S2011040001427).These projects are involved into developing methods and tools for automatically acquiring action models and derived predicate rules, and also applying the learned results into real applications.Both of action models an
摘    要:文中提出了一种在部分观测环境下学习规划领域的派生谓词规则的方法。在规划领域描述语言(PDDL)中,派生谓词用来描述动作的非直接效果,是规划领域模型和搜索控制知识的重要组成部分。然而,对于大多数规划领域而言,从无到有地构造派生谓词规则是不容易的。因此,研究自动获取派生谓词的推导规则是有意义的。已有研究工作提出通过修订一个初始的不完备的领域理论来获取推导规则的方法,但是它们的主要缺点在于待学习谓词的训练例的数量非常少,这是因为训练例按照非常有限的方式来生成。而更本质的原因在于它们假设环境是不可观测的。其实,在现实生活中很多动作的非直接效果是可以观测的,或者通过简单的目测或者通过专门的工具。因此文中提出增加观测来反映动作的非直接效果,以便增加待学习谓词的训练例数目从而改善学习的精准度。此外,为了补充一些在归纳学习过程中学习不到的谓词,文中还提出了一个后处理方法来使得学习到的规则在语义上更完整。通过在派生谓词基准领域上的实验表明,文中所提出的方法是可行有效的。更深远的意义在于,文中的研究工作有利于规划领域的自动建模或者控制知识的自动获取的研究与实现。

关 键 词:人工智能  自动规划  派生谓词  规则学习  部分观测

Learning Derived Predicate Rules for Planning Domains under Partial Observability
RAO Dong-Ning,JIANG Zhi-Hua,JIANG Yun-Fei,DENG Yu-Hui.Learning Derived Predicate Rules for Planning Domains under Partial Observability[J].Chinese Journal of Computers,2015(7).
Authors:RAO Dong-Ning  JIANG Zhi-Hua  JIANG Yun-Fei  DENG Yu-Hui
Abstract:
Keywords:artificial intelligence  automated planning  derived predicates  rule learning  partial observability
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号