首页 | 本学科首页   官方微博 | 高级检索  
     

具有行为强化学习能力的人工生命进化模型设计
引用本文:张军,郑浩然,王煦法. 具有行为强化学习能力的人工生命进化模型设计[J]. 计算机工程, 2000, 26(10): 11-13,50
作者姓名:张军  郑浩然  王煦法
作者单位:中国科学技术大学电子科学与技术系,合肥 230026
基金项目:国家自然科学基金项目(69671029)、中国科技大学青年科学基金项目
摘    要:人工生命进化模型设计的关键问题是学习与进化之间的关系,在自主体生存期内的学习过程可以通过不同的遗传方式指导个体行为的进化。该文利用进化算法和人工神经网络的研究方法,设计了两种不同的人工生命自主体的进化模型,模型解决了先天的遗传进化和后天的个体神经系统强化学习的有机结合问题,并且得出结论认为,强化学习有助于自主体适应复杂的外部环境,同时学习也可以直接或间接地使该适应性成为自主体遗传基因上的固定成分。

关 键 词:人工生命 行为强化学习 进化模型 神经网络
文章编号:1000-3428(2000)10-0011-03

Study of the Behavior Reinforcement Learning in Artificial Life Evolutionary Models
ZHANG Jun,ZHENG Haoran,WANG Xufa. Study of the Behavior Reinforcement Learning in Artificial Life Evolutionary Models[J]. Computer Engineering, 2000, 26(10): 11-13,50
Authors:ZHANG Jun  ZHENG Haoran  WANG Xufa
Abstract:One key problem in artificial life evolutionary model is the interaction between learning and evolution. The learning process that occurs over the lifetime of an individual can snide the evolution of that individual's species and its behavior through two distinctive methods: Baldwin Effect and Lamarckian Inheritance with different genetic propagation. We proposed two evolutionary models combined with reinforcement learning, and interpreted the importance of the changing role of learning and evolution in the whole process. By comparing the effectiveness of our models, we conclude that reinforcement learning helps individual adapting to complex environment, and learning can directly or indirectly make that adaptation become genetically fixed.
Keywords:Artificial life  Reinforcement learning  Baldwin effect
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号