首页 | 本学科首页   官方微博 | 高级检索  
     

基于增强学习的代理谈判模型
引用本文:张化祥,黄上腾. 基于增强学习的代理谈判模型[J]. 计算机工程, 2004, 30(10): 137-139
作者姓名:张化祥  黄上腾
作者单位:上海交通大学计算机科学与工程系,上海,200030;上海交通大学计算机科学与工程系,上海,200030
摘    要:利用增强学习的Q-leanling理论,构造了一个基于时间信念、价格信念和状态期望Q值的代理谈判模型。将代理交互报价的过程看成代理选择报价行动,实现状态的迁移,可以计算出代理在不同状态采取行动的Q值。代理可以通过修改信念函数及时问贴现率来调整报价。该文实现了谈判模型的报价算法,并从理论和实验数据两方面进行了分析比较。

关 键 词:代理  增强学习  报价  时间信念  价格信念
文章编号:1000-3428(2004)10-0137-03

Agent Negotiation Model Based on Reinforcement Learning
ZHANG Huaxiang,HUANG Shangteng. Agent Negotiation Model Based on Reinforcement Learning[J]. Computer Engineering, 2004, 30(10): 137-139
Authors:ZHANG Huaxiang  HUANG Shangteng
Abstract:An agent negotiation model based on enforcement learning, time belief, price belief and state expected Q value is developed. The alternative pricing process of agents is considered as state transition, and the Q value of the state-action pair can be computed. By modifying belief functions and time discount rate, agent can adjust its pricing. The algorithm of negotiation pricing is implemented.
Keywords:Agent  Reinforcement learning  Pricing  Time belief  Price belief
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号