共查询到19条相似文献,搜索用时 62 毫秒
1.
本文讨论非齐时折扣马氏决策规划最优策略的结构、性质和最优策略集,指出最优策略在一切可行路径均采用最佳措施(行动);若π(t n)={π^(t n),π1(t n),…}为t+n时刻最优策略,n=0,1,2,…,则π^*(t){π0^(t),π0^(t 1),π0^(t 2),…}也是t时刻最优策略,构造了一个最优策略的等价类∏^*(t),∏^*(t)中策略的凸组合仍为最优。 相似文献
2.
3.
讨论非齐时离散时间马尔科夫决策规划折扣准则下方差最小最优策略.为此目的,首先讨论了非负损失时的最优策略;在报酬绝对平均相对有界或非负损失下,证明了方差最小最优策略问題等价于一个非负损失折扣马氏决策规划;给出了存在方差最小最优策略的充要条件和寻求此最优策略的有限阶段逼近. 相似文献
4.
郭世贞 《昆明理工大学学报(自然科学版)》1985,(3)
本文讨论非齐时折扣马氏决策规划,给出了最优策略的充要条件,在非负损失情形证明了对任意ε>0存在马氏策略是ε-β最优策略;若存在最优策略,则存在马氏策略为最优。 相似文献
5.
本文研究一类非齐时无界报酬折扣马氏决策规划,对任意的初始时刻t∈T,证明了对任给的ε>0,存在确定性马氏决策略π~(?)={f_t,f_(t+1),……}是ε最优的,给出了存在最优策略的充要条件。 相似文献
6.
建立了一类转移概率依赖于历史的有限阶段决策规划模型(即有限阶段非马氏决策规划模型),并对其ε最优策略问题进行了讨论.给出相应的最优方程,证明了确定性ε最优策略的存在性,最后得到求ε最优策略的算法并证明了该算法的有效性. 相似文献
7.
8.
9.
胡奇英 《西安电子科技大学学报(自然科学版)》1992,19(1):72-83
论文讨论折扣因子依赖于(i,a)的非时齐马氏决策规划,提出了两组报酬无界的假设,证明了时齐正、负动态规划中的结论在这里都成立。最后讨论了此模型的最优策略性质。 相似文献
10.
曾庆宁 《西安电子科技大学学报(自然科学版)》1989,16(1):112-121
本文将处理多目标规划的模糊解法用于折扣多目标马氏决策规划,在两种特殊情况下,讨论了求解折扣多目标马氏决策规划(ε)模糊最优策略的方法。 相似文献
11.
将连续时间标量值折扣马氏决策模型(简记为MDP)的主要结果(最优方程,平稳策略优势,最优策略)均在向量值模型中作了推广,使标量值模型成为其特款. 相似文献
12.
秦叔明 《云南工业大学学报》1996,12(2):89-94
本文讨论了一类非时齐马氏决策模型向时齐马氏决策模型的转化问题,从而得到若πt是非时齐模型的k(k≥1)矩ε(ε≥0)最优策略,则由其导出的时齐策略是相应的时齐模型的k(k≥1)矩Si-ε(ε≥0)最优策略的结论. 相似文献
13.
王先甲 《武汉大学学报(工学版)》1993,(5)
在讨论公理化生产可能集概念的基础上,对已知生产活动观测集的生产单元的生产可能集的构造形式给出了证明。提出了最优生产函数的概念并建立了确定最优生产函数的数学规划模型。本文提出的最优生产函数反映了生产行为的目的性。对多投入、多产出过程提出的两种最优生产函数是广泛意义下的生产函数,它们是点到集合的映射。 相似文献
14.
15.
对控制变量为非线性的松弛系统的时间最优控制问题进行讨论.运用泛函分析空间理论中集值函数,扩展或类推得到了不同松弛系统可达集相同的结论,并且较好地解决了最优控制的存在性及必要条件.在此基础上,推广了前人的工作,其中系统的控制量可以有多个(组),所用泛函分析中集值函数的处理方法比传统的更简洁. 相似文献
16.
讨论了一生中有3个阶段(卵、幼虫及成虫)的单种群生长模型,且该种群为自食系统,即成虫会对卵进行捕食.得到了正平衡点全局渐近稳定的充分条件,分别给出了仅收获卵和仅获成年种群的最优收获策略. 相似文献
17.
讨论了一生中有3个阶段(卵、幼虫及成虫)的单种群生长模型,且该种群为自食系统,即成虫会对卵进行捕食.得到了正平衡点全局渐近稳定的充分条件,分别给出了仅收获卵和仅获成年种群的最优收获策略. 相似文献
18.
该文在研究了区间线性规划问题相关理论的基础上,引人区间线性规划问题的最优解和强最优解的定义,提出了区间线性规划问题的最优解与强最优解的充要条件,并通过算例说明了该方法的可行性。 相似文献
19.
该文指出了前人定义的区间线性规划最优解所在区间存在的问题,用反例说明其不足之处,给出了求任一介于区间线性规划问题任一最优值对应最优解的算法。 相似文献