期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘振张志政《计算机科学》2015,42(1):220-226

动作模型学习可以使Agent主动适应动态环境中的变化,从而提高Agent的自治性,同时也可为动态域建模提供一个初步模型,为后期的模型完善和修改提供了基础.通过结合归纳逻辑程序设计(Inductive Logic Program-ming,ILP)和回答集程序设计(Answer Set Programming,ASP),设计了一个学习B语言描述的动作模型算法,该算法可以在混合规模的动态域中进行学习,并采用经典规划实例验证了该学习算法的有效性. 相似文献

2.

从规划解中学习一阶派生谓词规则 总被引：4，自引：0，他引：4

饶东宁蒋志华姜云飞刘强《计算机学报》2010,33(2)

派生谓词是描述动作非直接效果的主要方式.但是由人类专家设计的派生谓词规则(即领域理论)不能保证总是正确或者完备的,因此有时很难解释一个观察到的规划解为什么是有效的.结合归纳学习与分析学习的优点,文中提出一种称为FODRL(First-Order Derived Rules Learning)的算法,在不完美的初始领域理论的引导下从观察到的规划解中学习一阶派生谓词规则.FODRL基于归纳学习算法FOIL(First-Order Inductive Learning),最主要的改进是可以使用派生谓词的激活集来扩大搜索步,从而提高学习到的规则的精确度.学习过程分为两个步骤:先从规划解中提取训练例,然后学习能够最好拟合训练例和初始领域理论的一阶规则集.在PSR和PROME-LA两个派生规划领域进行实验,结果表明,在大部分情况下FODRL比FOIL(甚至包括其变型算法FOCL)学习到的规则的精确度都要高. 相似文献

3.

部分观测环境下的时态动作模型学习方法

下载免费PDF全文

刘胜赵彤洲蔡敦波《计算机工程与应用》2018,54(2):29-39

已有的动作模型学习方法针对确定的或不确定的瞬时动作，而未考虑动作模型中的时态关系。提出了在部分观测环境下自动学习时态动作模型的方法。设计了学习动作持续时间表达式一般形式的两阶段线性回归方法。通过分析命题时间戳设计了动作前提、效果与动作之间时态关系算子的构建算法。在“国际智能规划竞赛”的规划问题集上进行了实验，结果表明了该方法的有效性。相似文献

4.

在部分观测环境下的不确定动作模型学习

饶东宁蒋志华姜云飞《软件学报》2014,25(1):51-63

近年来,动作模型学习引起了研究人员的极大兴趣.可是,尽管不确定规划已经研究了十几年,动作模型学习的研究仍然集中于经典的确定性动作模型上.提出了在部分观测环境下学习不确定动作模型的算法,该算法可应用于假定人们对转移系统一无所知的情形下进行,输入只有动作-观测序列.在现实世界中,这样的场景很常见.致力于动作是由简单逻辑结构组成的、且观测以一定频率出现的一类问题的研究.学习过程分为3个步骤：首先,计算命题在状态中成立的概率;然后,将命题抽取成效果模式,再抽取前提;最后,对效果模式进行聚类以去除冗余.在基准领域上进行的实验结果表明,动作模型学习技术可推广到不确定的部分观测环境中. 相似文献

5.

基于约束逻辑规划和遗传算法的柔性调度

李岩吴智铭《控制与决策》2002,17(3):297-300

根据柔性生产环境的特点，描述了约束逻辑规划（CLP）和遗传算法（GA）在解决调度问题中的应用框架。CLP的解决作为满足约束的调度问题的起始解，保证了初始解的合理性。把CLP用作计算每一代样本的约束检验手段，有利于在遗传算法的搜索中获得更好的解和更高的解算效率。最后对一个规模足够大的调度实例进行了计算。相似文献

6.

基于STRIPS的领域知识提取策略 总被引：4，自引：0，他引：4

吴向军姜云飞凌应标《软件学报》2007,18(3):490-504

提出了谓词之间的一种相似关系,并用该相似关系得到可实现某谓词的动作集.利用该动作集中所有动作的公共前提谓词和公共效果谓词,提取出隐含在动作描述中的领域知识,并给出了描述领域知识的一种形式化方法.最后,对具体的规划问题,可利用领域知识判断出初始状态或目标状态中存在的矛盾.该领域知识的提取策略已应用于智能规划器StepByStep之中,所获取的领域知识对选择待实现的谓词提供了必要的理论依据. 相似文献

7.

基于遗传算法的主体规划实现

杨艳梅赵逢禹《计算机工程与设计》2008,29(11):2888-2889

面向主体的软件开发是计算机科学与技术领域的一项重要技术.近年来,在主体体系结构,主体规划、主体通信语言等方面的研究已经得到了一系列进展.探讨了主体规划的实现问题,提出将遗传算法的思想用在主体每一步的动作的选择中.给出了基于遗传算法的主体规划算法,并结合一个应用实例展示了具体的实现过程. 相似文献

8.

求解全局优化问题的混合智能算法 总被引：3，自引：0，他引：3

李宏焦永昌张莉《计算机工程与应用》2006,42(16):9-11,18

把序列二次规划作为遗传算法的一个局部搜索算子,嵌入到实数编码遗传算法中,构成一种基于序列二次规划和实数编码遗传算法的高效的混合智能算法。该方法充分利用序列二次规划法的强局部搜索能力和遗传算法的全局收敛性,使得混合算法的全局收敛性得到改善并且减少了计算量。数值实验结果表明,混合算法是高效可靠的。相似文献

9.

基于谓词/变迁网的Agent规划研究

下载免费PDF全文

钟珊常晋义陈秋亚朱丹香《计算机工程》2011,37(7):204-206,209

为解决规划形式化系统中动态、异步和并发等特征难以被表示的问题,提出一种使用谓词/变迁网表示Agent规划问题的形式化方法,利用谓词/变迁网的动态、异步、并发等特征表示规划问题,同时将抑制弧引入谓词/变迁网,并将 Agent的动作分为2类基本动作,即普通动作和测试动作,通过这2种动作的组合可以构成各种复杂动作。实例建模验证了采用带抑制弧的谓词变迁网表示Agent规划的可行性。相似文献

10.

基于神经网络和遗传算法的机器人动态避障路径规划 总被引：8，自引：0，他引：8

陈华华杜歆顾伟康《传感技术学报》2004,17(4):551-555

文中提出了基于神经网络和遗传算法的动态环境下机器人动态避障路径规划方法,机器人工作空间动态环境信息的神经网络模型,并利用该模型建立机器人动态避障与神经网络输出的关系,然后将需规划路径的二维编码简化成一维编码,并把动态避障要求和最短路径要求融合成一个适应度函数.通过对算法进行实验仿真,结果表明提出的动态路径规划方法是正确和有效的. 相似文献

11.

多Agent协作的强化学习模型和算法 总被引：2，自引：0，他引：2

刘菲曾广周宋言伟《计算机科学》2006,33(12):156-158

结合强化学习技术讨论了多Agent协作学习的过程，构造了一个新的多Agent协作学习模型。在这个模型的基础上，提出一个多Agent协作学习算法。算法充分考虑了多Agent共同学习的特点，使得Agent基于对动作长期利益的估计来预测其动作策略，并做出相应的决策，进而达成最优的联合动作策略。最后，通过对猎人。猎物追逐问题的仿真试验验证了该算法的收敛性，表明这种学习算法是一种高效、快速的学习方法。相似文献

12.

一种鲁棒性的少样本学习方法

代磊超冯林杨玉亭尚兴林苏菡《小型微型计算机系统》2021,(2):340-347

少样本学习是目前机器学习研究领域的一个热点,它能在少量的标记样本中学习到较好的分类模型.但是,在噪声的不确定环境中,传统的少样本学习模型泛化能力弱.针对这一问题,提出一种鲁棒性的少样本学习方法RFSL(Robust Few-Shot Learning).首先,使用核密度估计(Kernel Density Estimation,KDE)和图像滤波(Image Filtering)方法在训练集中加入不同的随机噪声,形成多个不同噪声下的训练集,并分别生成支持集和查询集.其次,利用关系网络的关系模块通过训练集端到端地学习多个基分类器.最后,采用投票的方式对各基分类器的最末Sigmoid层非线性分类结果进行融合.实验结果表明,RFSL模型可促进小样本学习快速收敛,同时,与R-Net以及其他主流少样本学习方法相比,RFSL具有更高的分类准确率,更强的鲁棒性. 相似文献

13.

信度网中条件概率表的学习 总被引：6，自引：1，他引：5

邢永康沈一栋《计算机科学》2000,27(10):88-92

一、引言信度网B的学习包括结构B(?)的学习和条件概率表B_p的学习。因果马尔可夫条件原理表明:如果图形G是一个随机变量集合X的因果图,那么图形G也是该随机变量集合的联合概率分布所对应的信度网的结构图。根据这一原理,在实际应用中,可以利用领域相似文献

14.

Machine learning by imitating human learning 总被引：1，自引：1，他引：0

Kuo-Chin Chang Tzung-Pei Hong Shian-Shyong Tseng 《Minds and Machines》1996,6(2):203-228

Learning general concepts in imperfect environments is difficult since training instances often include noisy data, inconclusive data, incomplete data, unknown attributes, unknown attribute values and other barriers to effective learning. It is well known that people can learn effectively in imperfect environments, and can manage to process very large amounts of data. Imitating human learning behavior therefore provides a useful model for machine learning in real-world applications. This paper proposes a new, more effective way to represent imperfect training instances and rules, and based on the new representation, a Human-Like Learning (HULL) algorithm for incrementally learning concepts well in imperfect training environments. Several examples are given to make the algorithm clearer. Finally, experimental results are presented that show the proposed learning algorithm works well in imperfect learning environments. 相似文献

15.

一种增量贝叶斯分类模型 总被引：40，自引：0，他引：40

宫秀军刘少辉史忠植《计算机学报》2002,25(6):645-650

分类一直是机器学习，模型识别和数据挖掘研究的核心问题，从海量数据中学习分类知识，尤其是当获得大量的带有类别标注的样本代价较高时，增量学习是解决该问题的有效途径，该文将简单贝叶期方法应用于增量分类中，提出了一种增量贝叶斯学习模型，给出了增量贝叶斯推理过程，包括增量地修正分类器参数和增量地分类测试样本，实验结果表明，该算法是可行的和有效。相似文献

16.

一种基于高阶累积量的因果结构学习算法

廖伟国《计算机应用研究》2023,40(6):1702-1707

从观测数据中学习因果结构具有重要的应用价值。目前,一类学习因果结构的方法是基于函数因果模型假设,通过检验噪声与原因变量的独立性来学习因果结构。然而,该类方法涉及高计算复杂度的独立性检验过程,影响结构学习算法的实用性和鲁棒性。为此,提出了一种在线性非高斯模型下,利用高阶累积量作为独立性评估的因果结构学习算法。该算法主要分为两个步骤,第一个步骤是利用基于条件独立性约束的方法学习到因果结构的马尔可夫等价类,第二个步骤是定义了一种基于高阶累积量的得分,该得分可以判别两个随机变量的独立性,从而可以从马尔可夫等价类中搜索到最佳独立性得分的因果结构作为算法的输出。该算法的优势在于：a)相比基于核方法的独立性检验,该方法有较低的计算复杂度;b)基于得分搜索的方法,可以得到一个最匹配数据生成过程的模型,提高学习方法的鲁棒性。实验结果表明,基于高阶累积量的因果结构学习方法在合成数据中F₁得分提高了5%,并在真实数据中学习到更多的因果方向。相似文献

17.

Computer-supported negotiation of course content

Roland Hübscher 《Computers & Education》2009,53(3):726-732

Students learn more effectively with personally meaningful tasks. Thus, students learn more if they have a say in deciding what specific topics and examples are being discussed in class. Naturally, the instructor knows what topics are important to cover in a course and which ones might be optional. Finding the right balance between students’ preferences and the instructor’s requirements is not so easy and thus may prevent this kind of shared control of the classroom from being realized. This article describes how the instructor’s and students’ interests can be used to generate a list of course topics that satisfies both parties. However, instead of adding technology to the classroom, technology is used to improve the classroom experiences. Specifically, it is shown how course topics can be assigned to specific students maximizing what is meaningful to the students and satisfies the course parameters as defined by the instructor. This problem can be formulated as a variation of the linear assignment problem and solved with a binary linear program. Results from actual and simulated courses are discussed and generalizations of the topic assignment problem presented. 相似文献

18.

A genetic network programming with learning approach for enhanced stock trading model

Yan Chen Shingo Mabu Kaoru Shimada Kotaro Hirasawa 《Expert systems with applications》2009,36(10):12537-12546

In this paper, an enhancement of stock trading model using Genetic Network Programming (GNP) with Sarsa Learning is described. There are three important points in this paper: First, we use GNP with Sarsa Learning as the basic algorithm while both Technical Indices and Candlestick Charts are introduced for efficient stock trading decision-making. In order to create more efficient judgment functions to judge the current stock price appropriately, Importance Index (IMX) has been proposed to tell GNP the timing of buying and selling stocks. Second, to improve the performance of the proposed GNP-Sarsa algorithm, we proposed a new method that can learn the appropriate function describing the relation between the value of each technical index and the value of the IMX. This is an important point that devotes to the enhancement of the GNP-Sarsa algorithm. The third point is that in order to create more efficient judgment functions, sub-nodes are introduced in each node to select appropriate stock price information depending on the situations and to determine appropriate actions (buying/selling). To confirm the effectiveness of the proposed method, we carried out the simulation and compared the results of GNP-Sarsa with other methods like GNP with Actor Critic, GNP with Candlestick Chart, GA and Buy&Hold method. The results shows that the stock trading model using GNP-Sarsa outperforms all the other methods. 相似文献

19.

基于行为能力约束的服务动态授权管理研究

陈喆梁员宁《计算机应用研究》2011,28(6):2233-2238

针对传统基于语义服务动态合成的低效率和授权管理的有效性不高,提出了基于行为能力约束的服务动态授权管理方法。该方法借助数学优化模型,对服务合成的路径进行了描述,根据成份服务间的约束关系,提出了协同应用服务动态合成算法。基于行为能力约束,将服务合成的语义推理进行预先处理,探索构成协同应用服务的最小行为能力,根据服务请求用户所拥有的行为能力与协同应用服务所需的最小行为能力的关系进行判断授权,避免了用户提出服务请求时的大规模空间搜索和服务语义间的推理计算问题。实验结果分析表明,该方法提高了服务授权管理的自动化程度和有效性,并且具有较高的动态适应能力。相似文献

20.

Learning to teach with worked-out examples: a computer-based learning environment for teachers 总被引：1，自引：0，他引：1

T.S. Hilbert A. Renkl S. Schworm † S. Kessler‡ & K. Reiss‡ 《Journal of Computer Assisted Learning》2008,24(4):316-332

Abstract Learning from worked-out examples has been shown to be very effective in initial cognitive skill acquisition. In order to fully exploit the potential of example-based learning, teachers should, however, know how to effectively employ such examples in classroom instruction. Therefore, we have designed a computer-based learning environment in which mathematics and science teachers learn how to effectively employ worked-out examples. The learning environment was developed according to approved design criteria. The topics that are addressed in the learning environment were chosen in response to the results of a needs assessment that analysed schoolbooks and classroom videos, and took interviews with teachers into account. In experiments as well as in several teacher trainings on example-based learning, the computer-based learning environment was evaluated and improved accordingly. On a more general level, our research and development project showed that a computer-based learning programme could be a sensible tool that supports follow-up work in teacher training contexts. 相似文献