首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
基于路径引导知识启发的强化学习方法   总被引:1,自引:0,他引:1  
为了提高强化学习算法的运行效率和收敛速度,提出了一种基于路径引导知识启发的强化学习方法PHQL。采用PHQL方法,不需要提前植入先导知识,agent在每一轮学习过程中更新Q表的同时,各个状态的路径知识也自主地建立起来并逐步修正和优化。算法利用已经获得的路径知识来指导和加速agent以后的强化学习过程,以减少agent学习过程的盲目性。分析了PHQL算法的探索、利用和启发3种行为的执行概率以及行为选取方法,提出一种行为选择概率随时间渐变的算法。以一个路径搜索问题为实例,对PHQL方法进行了验证、分析并与几种相关的强化学习算法进行了性能对比。实验结果表明,作者提出的方法对学习过程具有明显的加速作用,收敛性能有了较大的提高。  相似文献   

2.
以魔幻屋魔术工作室为案例,探索新创企业不同发展阶段所需的创业知识及最优的创业学习方式.研究发现:新创企业在创建期所需的创业知识主要为分析创业环境和获取合法性的知识,而运营管理新企业以及与战略决策相关的知识则分别在存活期和成长期占据主导地位.创业学习方式的合理选择有利于提高创业知识的获取效率,经验学习、认知学习和实践学习在创业过程中扮演着不同的作用.认知学习有利于新创企业获取规制合法性,对规范、认知合法性的获取作用不明显.经验学习主要作用于早期阶段,随着创业活动的开展,认知学习和实践学习的作用越来越明显.  相似文献   

3.
基于知识的分层遗传算法   总被引:2,自引:0,他引:2  
传统遗传算法缺乏对进化过程知识的有效提取和利用,存在早熟收敛.在遗传算法的种群进化层上,引入文化算法的信度空间,提出一种具有知识引导功能的分层遗传算法.算法由底层种群进化层和上层知识进化层构成.结合遗传操作过程,提取4类知识并给出具体定义.详细阐述了联系上下层的样本选取函数、知识更新函数和进化引导函数,并提出一种基于地势知识轮盘赌选择的新型个体替代策略.针对3组标准测试函数的仿真结果表明,4类知识在不同进化阶段对种群的影响程度不同.状况知识在进化早期起主导作用,规范知识和地势知识在某局部优势区域具有较强引导作用,历史知识引导搜索区域脱离局部较优点,从而有效避免早熟收敛,提高进化效率.  相似文献   

4.
基于马尔科夫过程的强化学习作为一种在线学习方式,能够很好地应用于单智能体环境中.但是由于强化学习理论的限制,在多智能体系统中马尔科夫过程模型不再适用,因此强化学习不能直接用于多智能体的协作学习问题.本文提出了多智能体协作的两层强化学习方法.该方法主要通过在单个智能体中构筑两层强化学习单元来实现.第一层强化学习单元负责学习智能体的联合任务协作策略,第二层强化学习单元负责学习在本智能体看来是最有效的行动策略.所提出的方法应用于3个智能体协作抬起圆形物体的计算机模拟中,结果表明所提出的方法比采用传统强化学习方法的智能体协作得更好.  相似文献   

5.
基于分布式问题协同求解过程,分析了基于知识的协同设计过程建模,提出了一种集知识处理、行为规划、任务调度、动态监控、数据通信等功能为一体的智能Agent集成化结构,最后应用知识处理方法介绍了智能Agent结构份布式知识表示与推理、数据通信以及公共数据接口的实现过程。  相似文献   

6.
结合FMS故障诊断专家系统的实际开发,针对故障诊断专家系统中的知识自动获取问题,提出了概念库的管理方式,设计了一种自学习系统,本文研究了学习模块的知识表达问题,提出了一种混合式的知识表达方式,即语义网络和模糊产生式规则相结合的方式,同时介绍了学习过程的搜索问题及推理策略。  相似文献   

7.
分析了教师隐性知识和隐性知识库的特点,提出在英语教学过程中引入CKM策略对教师隐性知识进行管理,设计了教师隐性知识库的结构,制定了基于隐性知识CKM策略的英语学习共同体构建方案,并研究了该学习共同体的运行过程及相关技术.  相似文献   

8.
智能学习引擎的研究   总被引:1,自引:0,他引:1  
随着计算机和网络技术的飞速发展,基于网络架构的智能学习系统中知识规则的研究已经成为了一个重要的研究领域.针对智能学习系统提出了智能学习引擎的概念,介绍了智能学习引擎的设计方法.如何查找前序知识点和预测后续知识点,并结合了形式概念对具有偏序关系的知识点进行了研究.  相似文献   

9.
针对状态机决策模型不能有效处理冰雪环境下丰富的上下文信息和不确定因素影响等问题,构建了一种基于深度Q网络算法(DQN)的深度强化学习智能体。使用运动规划器对该智能体进行增广,将基于规则的决策规划模块和深度强化学习模型整合在一起,建立了DQN-planner模型,从而提高了强化学习智能体的收敛速度和驾驶能力。最后,基于CARLA模拟仿真平台对DQN模型和DQN-planner模型在低附着系数冰雪路面上的驾驶能力进行了对比实验,分别就训练过程和验证结果进行了分析。  相似文献   

10.
介绍了一种基于学习的智能模糊控制器,它采用自学习模糊控制方式,克服了常规模糊控制器的缺点,控制效果良好  相似文献   

11.
为了有效利用少量先验信息提高多视角数据聚类效果,提出了一种基于距离度量学习的半监督多视角谱聚类算法(简称ML-SMC)。首先,利用距离度量学习引入先验信息,将多视角数据映射到反映先验约束条件的空间.然后,根据相似性构造每个视角的视图,将多视角聚类问题转化为最小正则割的图划分问题。实验结果表明:ML-SMC算法聚类结果的精度优于3种经典的多视角聚类算法和4种半监督单视角聚类算法。并且通过利用少量先验信息ML-SMC算法能够有效提高聚类效果。  相似文献   

12.
以前基于支持度一置信度框架的关联规则挖掘算法都是先用支持度做为阈值对搜索结果进行剪枝 ,产生频繁集 ,再针对频繁集产生关联规则 ,这就是频繁关联规则。然而在很多应用中 ,诸如 :鉴别相似的Web文件、网络中入侵检测等 ,有许多有趣的关联规则仅有很少的支持度。在本文中 ,针对这种情况 ,提出了一种可以挖掘非频繁项之间有趣规则的算法 ,此算法先用相似度作为兴趣度度量对算法结果进行剪枝  相似文献   

13.
AnIntelligentApproachtoModelManipulation inDSSHANShixin;HUANGTiyun;LIUXiuqing(韩世欣,黄梯云,刘秀清)(CollegeofManagement,HarbinInstitut...  相似文献   

14.
针对如何使用数据挖掘技术分析指导用户改善学习行为的问题,提出了一种基于兴趣度关联规则的学习行为分析方法.首先,采用K-means聚类方法快速归纳出用户的学习状态; 其次,通过含兴趣度的关联规则算法获得学习行为与学习效果之间的强规则; 最后,以edX平台提供的用户学习数据为例对算法进行了验证.结果表明:含兴趣度指标的算法所获得的强规则数目比传统关联规则算法缩减了40.9%,同时该方法能够得出学习行为因素与学习效果之间的具体关系,有利于指导用户改善学习行为.  相似文献   

15.
主题学习网站是一个以主题知识为导向、资源性的网上协作学习系统,它能为"项目教学"活动的开展提供一个开放、交互与协作化的网络教学平台。将智能代理技术应用于主题学习网站中,构建出具有代理服务功能的主题学习网站,更有效地帮助学生进行个性化的自主学习,是人工智能在网络教学中应用的探索。  相似文献   

16.
在战略模拟系统中,采用清晰、明确关系的术语和具有一定智能辅助功能的主动服务对模拟系统发展具有重要现实意义。运用基于本体的知识服务能有效提高系统之间的互操作,促进知识共享,增强服务的主动性、智能性;总结了近年来本体、知识服务学科领域的研究成果;提出了战略模拟系统中知识服务的概念结构、方法手段和需要重点解决的问题。  相似文献   

17.
协同过滤技术是推荐系统最具价值的核心技术之一,它能够深入地挖掘用户潜在的兴趣爱好并向用户做出比较合理的推荐;但是冷启动、数据稀疏性、可扩展性等问题依然制约该技术在实际推荐系统的应用。针对冷启动和数据稀疏性等问题,文章提出了一个基于近邻传播聚类的混合协同过滤推荐模型。该模型首先基于物品的标签属性进行聚类,挖掘出同类的物品并计算相似物品之间的关联程度,然后基于历史交互数据计算物品的相似度矩阵,最后按照一定权重混合构成一个物品相似度,并以此为用户进行推荐。与传统协同过滤推荐模型相比,该模型不仅提高了推荐精确度,而且改善了物品的召回率,能为用户提供更好的推荐体验。  相似文献   

18.
传统的语义信息检索是基于检索词语义的匹配,无法满足检索不确定的、不完整的信息以及对检索结果进行聚类处理,因此,提出将模糊本体引入语义信息检索方法。该方法以本体技术先建立领域语义模型,各概念的隶属度加到语义建模的过程中,并提供语义标注;以模糊推理方式对概念、公理等本体进一步处理,从而便于计算机计算处理。能够提高在语义信息检索中对模糊信息进行检索的查准率、查全率,采用聚类技术对检索结果进行聚类,以达到智能化检索的目的。  相似文献   

19.
论述了机械设备智能诊断系统的学习机制及其实现方法,重点研究了基于诊断行为的机器学习问题,提出了不确定性知识的评估方法及评估函数.  相似文献   

20.
针对认知无线电(CR)的智能学习研究需求,提出了一种基于最小二乘支持向量机(LSSVM)的CR学习、决策方法.通过遗传算法(GA)进行超参数搜索,建立适当的基于LSSVM的CR学习模型,利用历史案例进行LSSVM离线训练学习,获得知识来指导未来的决策.仿真结果表明,GA-LSSVM能在较少进化代数内搜索出合适的超参数,并且LSSVM学习决策方法能有效提高CR系统的性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号