共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
3.
4.
本文总结当前仿真机器人足球中强化学习的研究进展,系统阐述在仿真机器人足球不同决策层次中使用强化学习的不同方法,针对仿真机器人足球的特点讨论当前使用的几种对环境状态空间进行泛化的方法,并展望今后强化学习在仿真机器人足球中的主要应用方向. 相似文献
5.
机器人足球智能控制系统分析与设计 总被引:1,自引:0,他引:1
高青斌 《计算机工程与应用》2004,40(10):75-77
该文结合智能控制理论和多智能体系统理论分析了基于多智能体系统(MABS)的分级递阶智能控制系统结构,并将该控制结构用于机器人足球系统,提出了机器人足球系统的分级递阶智能控制结构,并运用基于人工神经网络的模糊控制系统为足球机器人真正实现智能化控制提供了一种可行的控制方案。 相似文献
6.
多智能体强化学习及其在足球机器人角色分配中的应用 总被引:2,自引:0,他引:2
足球机器人系统是一个典型的多智能体系统, 每个机器人球员选择动作不仅与自身的状态有关, 还要受到其他球员的影响, 因此通过强化学习来实现足球机器人决策策略需要采用组合状态和组合动作. 本文研究了基于智能体动作预测的多智能体强化学习算法, 使用朴素贝叶斯分类器来预测其他智能体的动作. 并引入策略共享机制来交换多智能体所学习的策略, 以提高多智能体强化学习的速度. 最后, 研究了所提出的方法在足球机器人动态角色分配中的应用, 实现了多机器人的分工和协作. 相似文献
7.
从宏观和微观论多智能体系统与足球机器人系统体系结构 总被引:4,自引:0,他引:4
在半自主型的MAS组织结构的基础上,建立具有Agent、逻辑Agent与物理Agent的异构体系,从微观和宏观两种技术路线分析了多智能体系统 (MAS)的组织结构和Agent的体系结构,提出了一种足球机器人系统的分层知识、分层推理的体系结构模型,可简化推理过程,又增强推理能力,提高足球机器人的应变能力和实时性. 相似文献
8.
机器人足球与足球机器人 总被引:1,自引:0,他引:1
机器人足球与足球机器人是最近几年在国际上迅速开展起来的高技术对抗活动,虽然历史不长,但由于它集高新技术、娱乐比赛于一体,是密切理论联系实际的极富生命力的成长点,所以引起了社会的广泛关注和极大兴趣. 相似文献
9.
10.
11.
韩伟 《模式识别与人工智能》2008,21(1):111-115
针对Q学习状态空间非常大,导致收敛速度非常慢的问题,给出一种基于边界样本协调的多智能体在线合作学习方法,使得智能体在特定的子空间上进行特化并通过边界状态上的开关函数相互协调,从而能够较快地学习到局部最优.仿真实验表明该方法能够取得比全局学习更好的在线学习性能. 相似文献
12.
基于WEB的虚拟教学系统综述 总被引:6,自引:1,他引:6
在基于WEB的虚拟教学环境中,学生和老师可以不受时间和空间的限制,进行信息共享和交流,协同合作完成教学任务。文章结合计算机支持的协同工作 (Computer Support Cooperative Work)技术、虚拟现实(virtual reality)技术和IEEE上关于协同合作之间信息传输的标准,从基于WEB的虚拟教学环境的产生需求、特征、结构框架以及协同合作信息的传输这几个方面对基于WEB的虚拟教学系统的研究情况进行综述,讨论了存在的一些问题。 相似文献
13.
为有效使用大量未标注的图像进行分类,提出一种基于半监督学习的图像分类方法。通过共同的隐含话题桥接少量已标注的图像和大量未标注的图像,利用已标注图像的Must-link约束和Cannot-link约束提高未标注图像分类的精度。实验结果表明,该方法有效提高Caltech-101数据集和7类图像集约10%的分类精度。此外,针对目前绝大部分半监督图像分类方法不具备增量学习能力这一缺点,提出该方法的增量学习模型。实验结果表明,增量学习模型相比无增量学习模型提高近90%的计算效率。关键词半监督学习,图像分类,增量学习中图法分类号TP391。41IncrementalImageClassificationMethodBasedonSemi-SupervisedLearningLIANGPeng1,2,LIShao-Fa2,QINJiang-Wei2,LUOJian-Gao31(SchoolofComputerScienceandEngineering,GuangdongPolytechnicNormalUniversity,Guangzhou510665)2(SchoolofComputerScienceandEngineering,SouthChinaUniversityofTechnology,Guangzhou510006)3(DepartmentofComputer,GuangdongAIBPolytechnicCollege,Guangzhou510507)ABSTRACTInordertouselargenumbersofunlabeledimageseffectively,animageclassificationmethodisproposedbasedonsemi-supervisedlearning。Theproposedmethodbridgesalargeamountofunlabeledimagesandlimitednumbersoflabeledimagesbyexploitingthecommontopics。Theclassificationaccuracyisimprovedbyusingthemust-linkconstraintandcannot-linkconstraintoflabeledimages。TheexperimentalresultsonCaltech-101and7-classesimagedatasetdemonstratethattheclassificationaccuracyimprovesabout10%bytheproposedmethod。Furthermore,duetothepresentsemi-supervisedimageclassificationmethodslackingofincrementallearningability,anincrementalimplementationofourmethodisproposed。Comparingwithnon-incrementallearningmodelinliterature,theincrementallearningmethodimprovesthecomputationefficiencyofnearly90%。 相似文献
14.
CMAC学习性能及泛化性能研究综述 总被引:1,自引:0,他引:1
小脑模型清晰度控制器(CMAC)是一种局部学习前馈网络,结构简单,收敛速度快,易于实现。从其每个神经元来看,各神经元之间是一种线性关系,但从总体结构来看,网络是一种非线性映射关系。而且模型从输入开始就存在一种泛化能力。网络的学习和泛化能力一直是研究热点,因此,该文将对CMAC网络的泛化能力、学习能力以及一些改善途径进行多方面的综合性的讨论。文章最后还将给出一种改善CMAC泛化能力的训练策略,它不仅避免了学习干扰问题加快了学习速度而且可以通过提高训练循环次数增加训练样本量。通过MATLAB仿真发现这种训练策略可以改善CMAC网络的泛化能力。该方法简单有效是可行的。 相似文献
15.
16.
医学数据标注成本高昂,不同研究中心提供的脑影像数据间存在分布差异,无法有效整合,影响预测模型性能.针对此问题,文中提出基于多图核的迁移学习方法,将不同的图核用于挖掘脑网络结构信息并衡量脑网络间的相似性.提出多核学习框架,提高迁移模型的性能.在自闭症谱系障碍(ASD)多中心数据集上验证文中方法可有效利用脑网络数据的结构信息.多核学习框架也可综合不同图核的优点,进一步提高方法在脑网络数据上的分类性能. 相似文献
17.
学习过程评价既可实时监控学习的每一个步骤,也可有效发挥评价的反馈与调节、激励与促进作用.由于贝叶斯分类方法综合了先验信息和样本数据的概率分布,因此将其应用于数字化学习过程评价,具有较高的科学性,是数据挖掘技术与教育管理相结合的有益探索.实验结果表明,评价客观、一致,具有较高准确性. 相似文献
18.
针对标记分布学习算法忽略标记相关性信息及数据存在异常和噪声值的情况,文中提出基于低秩表示的标记分布学习算法(LDL-LRR).利用特征空间的基线性表示样本信息,实现对原始特征空间数据的降维.将低轶表示(LRR)迁移至标记空间,对模型施加低秩约束,把握数据的全局结构.分别使用增广拉格朗日乘子法和拟牛顿法求解LRR和目标函数,再通过最大熵模型预测标记分布.在10个数据集上的对比实验表明,LDL-LRR性能良好,效果稳定. 相似文献
19.
基于分类的链接预测方法中,由于链接未知节点对的大规模性与不确定性,选择可靠负例成为构造链接预测分类器的难点问题.为此,文中提出基于正例和无标识样本(PU)学习的链接预测方法.首先,提取节点对的拓扑信息以构造样本集.再利用社区结构确定候选负例的分布,基于分布进行多次欠采样,获得多个候选负例子集,集成多个负例集与正例集中构建的分类器选择可靠负例.最后基于正例与可靠负例构造链接预测分类器.在4个网络数据集上的实验表明文中方法预测结果较优. 相似文献
20.
以问题解决为基础的探究式学习法是目前比较受学生欢迎的一种学习方法.试图分析该方法的特征、设计原则和注意点,同时探讨该方法在<管理信息系统>课程中的应用.实践表明,该方法比传统教学法具有更好的效果. 相似文献