期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

从WSBPEL程序中学习Web服务的不确定动作模型 总被引：7，自引：0，他引：7

饶东宁蒋志华姜云飞吴康恒《计算机研究与发展》2010,47(3):445-454

智能规划是一种比较有前途的Web服务组合(WSC)方法.用规划进行WSC需要Web服务(WS)的动作模型,而让工程师来写它却很困难.考虑到现存WSC解决方案多用Web服务业务流程语言(WSBPEL)手工编写,可从现存方案中提取动作模型.由于WS本身有不确定性,且现存方案中蕴含对WS的语义要求,所以学习的应是体现流程语义且包含条件效果的不确定动作模型.为此,先将WSBPEL程序转成保留流程语义的标签转换系统(LTS);然后将动作模型学习技术扩展到包括条件效果的不确定规划(NDP),并从LTS中学习动作模型.实现了ARMS-WS系统,它可从WSBPEL程序中学习WS的不确定动作模型. 相似文献

2.

在部分观测环境下学习规划领域的派生谓词规则

饶东宁蒋志华姜云飞邓玉辉《计算机学报》2015,(7)

文中提出了一种在部分观测环境下学习规划领域的派生谓词规则的方法。在规划领域描述语言（PDDL）中,派生谓词用来描述动作的非直接效果,是规划领域模型和搜索控制知识的重要组成部分。然而,对于大多数规划领域而言,从无到有地构造派生谓词规则是不容易的。因此,研究自动获取派生谓词的推导规则是有意义的。已有研究工作提出通过修订一个初始的不完备的领域理论来获取推导规则的方法,但是它们的主要缺点在于待学习谓词的训练例的数量非常少,这是因为训练例按照非常有限的方式来生成。而更本质的原因在于它们假设环境是不可观测的。其实,在现实生活中很多动作的非直接效果是可以观测的,或者通过简单的目测或者通过专门的工具。因此文中提出增加观测来反映动作的非直接效果,以便增加待学习谓词的训练例数目从而改善学习的精准度。此外,为了补充一些在归纳学习过程中学习不到的谓词,文中还提出了一个后处理方法来使得学习到的规则在语义上更完整。通过在派生谓词基准领域上的实验表明,文中所提出的方法是可行有效的。更深远的意义在于,文中的研究工作有利于规划领域的自动建模或者控制知识的自动获取的研究与实现。相似文献

3.

部分观测环境下的时态动作模型学习方法

刘胜赵彤洲蔡敦波《计算机工程与应用》2018,54(2):29-39

已有的动作模型学习方法针对确定的或不确定的瞬时动作,而未考虑动作模型中的时态关系。提出了在部分观测环境下自动学习时态动作模型的方法。设计了学习动作持续时间表达式一般形式的两阶段线性回归方法。通过分析命题时间戳设计了动作前提、效果与动作之间时态关系算子的构建算法。在“国际智能规划竞赛”的规划问题集上进行了实验,结果表明了该方法的有效性。相似文献

4.

对不确定规划中观测约简的进一步研究

饶东宁蒋志华姜云飞朱慧泉《软件学报》2009,(5)

从3个方面改进了不确定规划（non—deterministic planning,简称NOP）中的观测约简：一是如何找最小观测集合（minimal observation set,简称MOS）,二是如何在观测代价不均等时找最优观测集合（iptimal observation set,简称OOS）,三是如何找到容错的OOS．通过MOS问题和图论中的最小覆盖集问题（minimal set cover,简称MSC）的类似性,可证MOS是NP难的问题,还可参考MSC算法得出时间复杂性不超过O（2^mm^2）且不低于Ω（2^m-1）的算法,其中m是观测的个数．通过使用整数规划（integer programming,简称IP）技术,可找到OOS以及容错的OOS．可以证明,上述算法能够保证找到解,并且能够保证解的最优性．相似文献

5.

对不确定规划中观测约简的进一步研究 总被引：2，自引：1，他引：2

饶东宁蒋志华姜云飞朱慧泉《软件学报》2009,20(5):1254-1268

从3个方面改进了不确定规划(non-deterministic planning,简称NDP)中的观测约简:一是如何找最小观测集合(minimal observation set,简称MOS),二是如何在观测代价不均等时找最优观测集合(optimal observation set,简称OOS),三是如何找到容错的OOS.通过MOS问题和图论中的最小覆盖集问题(minimal set cover,简称MSC)的类似性,可证MOS是NP难的问题,还可参考MSC算法得出时间复杂性不超过O(2^mm²)且不低于Ω(2^m?1)的算法,其中m是观测的个数.通过使用整数规划(integer programming,简称IP)技术,可找到OOS以及容错的OOS.可以证明,上述算法能够保证找到解,并且能够保证解的最优性. 相似文献

6.

智能规划中基于遗传算法的动作模型学习 总被引：4，自引：0，他引：4

赖志锋姜云飞《计算机学报》2007,30(6):945-953

在动作间的状态未知条件下,利用遗传算法,从不完整的领域描述和规划实例中学习动作模型,并且设计了AMLS-GA(Action Model Learning System Based on Genetic Algorithm)系统来具体实现这一思想.作者为每一个动作构建一个可能谓词集,这个谓词集覆盖了动作前提表、增加表和删除表中的所有谓词.采用二进制编码的方式,把动作模型编码成GA搜索空间中的一个假设,学习过程是在标准的遗传算法框架下进行的.把学习结果的正确性定义为尽可能多的解释规划实例,并且通过实验的方法对比学习到的模型与专家预定义模型之间的差别.实验结果表明,算法能在较短的时间内,学习到一个逼近专家描述的动作模型. 相似文献

7.

不确定观测下离散事件系统的可诊断性

文习明余泉常亮王驹《软件学报》2017,28(5):1091-1106

从系统诊断的角度来看,可诊断性是离散事件系统的一个重要性质.其要求系统发生故障后经过有限步的观测可以检测并隔离故障.为简单起见,对离散事件系统可诊断性的研究大都假定观测是确定的,即观测到的事件序列与系统实际发生的可观测事件序列一致.而在实际应用中,由于感知器的精度、信息传输通道的噪声等原因,获取的观测往往是不确定的.本文重点研究观测不确定条件下离散事件系统的可诊断性问题.首先,扩展了传统可诊断性的定义,定义了观测不确定条件下的可诊断性.接着,分别给出各类观测不确定条件下的可诊断性判定方法.而在更一般的情况下,各类观测不确定可能共同存在.因此,最后给出一般情况下的可诊断性判定方法. 相似文献

8.

不确定观测滤波及在无线传感器网络中的应用

许成刚《计算机应用与软件》2014,(4):133-137,164

比较几种具有代表性的基于卡尔曼滤波框架的带有不确定观测的滤波算法。比较它们的数学模型和算法实现,并将它们应用于无线传感器网络目标跟踪。仿真结果显示不同模型下的不确定观测滤波方法滤波效果不同,多步丢包模型在无线传感器网络中应用于移动目标跟踪具有优越的跟踪性能。相似文献

9.

一种三元逻辑相关不确定推进模型

邱玉辉罗旭东《计算机科学》1995,22(1):18-20

相似文献

10.

不确定系统的不确定项观测器设计 总被引：1，自引：0，他引：1

李文林李钧涛《控制理论与应用》2007,24(6):933-937

为了克服常规用不确定项的界估计来设计控制器带来的保守性和动态性能差的弊端,本文就连续的和离散的不确定系统,分别提出了不确定项的观测器设计方案.通过引入分布和离散加权平均的概念,对这两种观测器的观测误差精度进行了分析估算,从数学上证明了所得的观测值在加权平均意义下是无偏的.此外,通过适当选择观测器反馈增益,可以得到满意的误差估计精度.把该方法应用到一个控制系统中,仿真结果表明所提出的观测器能很好的估计不确定项和改进闭环系统动态性能. 相似文献

11.

深度学习模型可解释性的研究进展

下载免费PDF全文

化盈盈张岱墀葛仕明《信息安全学报》2020,5(3):1-12

深度学习在很多人工智能应用领域中取得成功的关键原因在于,通过复杂的深层网络模型从海量数据中学习丰富的知识。然而,深度学习模型内部高度的复杂性常导致人们难以理解模型的决策结果,造成深度学习模型的不可解释性,从而限制了模型的实际部署。因此,亟需提高深度学习模型的可解释性,使模型透明化,以推动人工智能领域研究的发展。本文旨在对深度学习模型可解释性的研究进展进行系统性的调研,从可解释性原理的角度对现有方法进行分类,并且结合可解释性方法在人工智能领域的实际应用,分析目前可解释性研究存在的问题,以及深度学习模型可解释性的发展趋势。为全面掌握模型可解释性的研究进展以及未来的研究方向提供新的思路。相似文献

12.

A Model of Partially Observable State Game and its Optimality

Matteo Golfarelli Nicolas Meuleau 《Applied Intelligence》2001,14(3):273-284

In this paper we present a model of two-players partially observable state-game and study its optimality. The model is inspired by the practical problem of negotiation in a multi-agent system and formulates, from a the game theory point of view, the so-called contract net protocol. It covers a wide variety of real problems including some simple card games such as blackjack, and many negotiation and bargaining situations. The results that follow are valid for non-zero-sum games as well as for zero-sum games. Basically, we establish and prove the relation between partially observable state games and some classical (single-state) bi-matrix games. If the original state game is zero-sum, then the equivalent bi-matrix game is so. 相似文献

13.

Learning Hierarchical Task Models from Input Traces

下载免费PDF全文

Chad Hogg Héctor Muñoz‐Avila Ugur Kuter 《Computational Intelligence》2016,32(1):3-48

We describe HTN‐MAKER , an algorithm for learning hierarchical planning knowledge in the form of task‐reduction methods for hierarchical task networks (HTNs). HTN‐MAKER takes as input a set of planning states from a classical planning domain and plans that are applicable to those states, as well as a set of semantically annotated tasks to be accomplished. The algorithm analyzes this semantic information to determine which portion of the input plans accomplishes a particular task and constructs task‐reduction methods based on those analyses. We present theoretical results showing that HTN‐MAKER is sound and complete. Our experiments in five well‐known planning domains confirm the theoretical results and demonstrate convergence toward a set of HTN methods that can be used to solve any problem expressible as a classical planning problem in that domain, relative to a set of goal types for which tasks have been defined. In three of the five domains, HTN planning with the learned methods scales much better than a modern classical planner. 相似文献

14.

Learning Intelligent Behavior in a Non-stationary and Partially Observable Environment

SelÇuk şenkul Faruk Polat 《Artificial Intelligence Review》2002,18(2):97-115

Individual learning in an environment where more than one agent exist is a chal-lengingtask. In this paper, a single learning agent situated in an environment where multipleagents exist is modeled based on reinforcement learning. The environment is non-stationaryand partially accessible from an agents' point of view. Therefore, learning activities of anagent is influenced by actions of other cooperative or competitive agents in the environment.A prey-hunter capture game that has the above characteristics is defined and experimentedto simulate the learning process of individual agents. Experimental results show that thereare no strict rules for reinforcement learning. We suggest two new methods to improve theperformance of agents. These methods decrease the number of states while keeping as muchstate as necessary. 相似文献

15.

从规划解中学习一阶派生谓词规则 总被引：4，自引：0，他引：4

饶东宁蒋志华姜云飞刘强《计算机学报》2010,33(2)

派生谓词是描述动作非直接效果的主要方式.但是由人类专家设计的派生谓词规则(即领域理论)不能保证总是正确或者完备的,因此有时很难解释一个观察到的规划解为什么是有效的.结合归纳学习与分析学习的优点,文中提出一种称为FODRL(First-Order Derived Rules Learning)的算法,在不完美的初始领域理论的引导下从观察到的规划解中学习一阶派生谓词规则.FODRL基于归纳学习算法FOIL(First-Order Inductive Learning),最主要的改进是可以使用派生谓词的激活集来扩大搜索步,从而提高学习到的规则的精确度.学习过程分为两个步骤:先从规划解中提取训练例,然后学习能够最好拟合训练例和初始领域理论的一阶规则集.在PSR和PROME-LA两个派生规划领域进行实验,结果表明,在大部分情况下FODRL比FOIL(甚至包括其变型算法FOCL)学习到的规则的精确度都要高. 相似文献

16.

个性化学习路径推荐综述

云岳代欢张育培尚学群李战怀《软件学报》2022,33(12):4590-4615

近年来,伴随着现代信息技术的迅猛发展,以人工智能为代表的新兴技术在教育领域得到了广泛应用,引发了学习理念和方式的深刻变革.在这种大背景下,在线学习超越了时空的限制,为学习者“随时随地”学习提供了更多的可能性,从而得到了蓬勃发展.然而,在线学习中师生时间、空间分离的特征,导致教师无法及时掌握学生的学习状态,一定程度上制约了在线学习中教学质量的提升.面对多元化的学习需求及海量学习资源,如何迅速完成学习目标、降低学习成本、合理分配学习资源等问题成为限制个人和时代发展的重大问题.然而,传统的“一刀切”的教育模式已经不能满足人们获取知识的需求了,需要一个更高效、更科学的个性化教育模式,以帮助学习者以最小的学习成本最大限度地完成学习目标.基于以上背景,如何自动高效识别学习者特征,高效地组织和分配学习资源,为每一位学习者规划个性化路径,成为面向个体的精准化教育资源匹配机制研究中亟待解决的问题.系统地综述并分析了当前个性化学习路径推荐的研究现状,并从多学科领域的角度分析了对于同一问题的不同研究思路,同时也归纳总结了当前研究中最为主流的核心推荐算法.最后,强调当前研究存在的主要不足之处. 相似文献