首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
半Markov决策过程的数值迭代优化   总被引:1,自引:1,他引:0  
针对半Markov决策过程在紧致行动集上的数值迭代优化,提出了折扣和平均准则下直接基于等价无穷小生成子的统一的标准数值迭代算法,并证明了其收敛性。另外,讨论了两种性能准则下统一的异步数值迭代算法,包括Gauss-Seidel异步迭代和随机异步迭代,特别是基于样本轨道仿真的数值迭代等,并运用性能势思想对上述算法进行改进。结果表明,该算法可直接适用于连续时间Markov决策过程。最后通过一个数值例子来比较各种算法的特点。  相似文献   

2.
运用基于性能势的M步向前(look-ahead)异步策略迭代算法研究了半Markov决策过程(SMDP)优化问题。首先给出了基于性能势理论求解的一种M步向前策略迭代算法。该算法不仅对标准策略迭代算法和一般的异步策略迭代算法都适用,而且对SMDP在折扣和平均准则下的优化也是统一的;另外给出了两种性能准则下基于即时差分学习的M步向前仿真策略迭代。最后通过一个数值算例比较了各种算法的特点。  相似文献   

3.
本文给出了多阶段决策过程方程的迭代算法的一种收敛速度。  相似文献   

4.
一类多阶段决策过程方程迭代算法的收敛速度   总被引:1,自引:0,他引:1  
通过适当的映射,把一类多阶段决策过程方程的迭代算法的收敛性和收敛速度化为一个差分方程ιk 1=Ψ(tk)中的级数∑^∞k=0tk收敛性和收敛速度。  相似文献   

5.
在管网维修时,为了实现合理有效地利用有限的资金目标,提出了基于半Markov过程的维修资金分配优化模型。模型的目标函数是求系统可靠性即整个系统各管段加权长期可靠性和的最大值。在该维护程序中使用了水力可靠性来确定管段的权重。并以实例说明如何利用这个模型进行实际的运算。  相似文献   

6.
工业过程稳态优化中的PD型迭代学习控制   总被引:4,自引:0,他引:4  
论述在工业过程的稳态优化中,施行迭代学习控制的思想方法,给出了一种PD型迭代学习算法,分析了算法收敛性,数字仿真结果表明这种控制方法对抑制超调,加快动态响应,减小优化过程对工业生产过程的影响是行之有效的。  相似文献   

7.
研究了决策评估的一个新的方面,即过程评估,并设计了一套进行过程评估的定量评价模型,为决策监督和控制提供了一种科学的方法,以保证决策的正确性。  相似文献   

8.
工业过程稳态优化中的PID型迭代学习控制   总被引:5,自引:0,他引:5  
给出一种PID型迭代学习算法,对工业过程稳态优化中的动态施行迭代学习控制,加快了动态响应,提高了控制效果。从理论上分析了算法的收敛性,并给出数字仿真结果。  相似文献   

9.
工程迭代设计的过程管理研究   总被引:1,自引:0,他引:1  
运用设计结构矩阵建立工程迭代设计的过程管理模型,以并行迭代子模型廓清迭代过程的结构和核心元素,以串行迭代子模型计算迭代时间。汽车质量问题案例证实了该方法对于工程迭代设计过程管理的有效性。  相似文献   

10.
通过对有关决策理论与实践的分析和研究,提出了决策过程的评估理论及评估的数学模型,设计了评估的指标体系和数据处理方法,并通过实例加以论证  相似文献   

11.
一种有限时段Markov决策过程的强化学习算法   总被引:4,自引:0,他引:4  
研究有限时段非平稳的Markov决策过程的强化学习算法。通过引入一个人工吸收状态,把有限时段问题变为无限时段问题,从而可利用通常的强化学习方法来求解。在文献[3]提出的算法思想基础上,提出了一种新的有限时段非平稳的Markov决策过程的强化学习算法,并用无完全模型的库存控制问题进行了实验。  相似文献   

12.
13.
不同时刻虹膜图像的采集状态不同,因此单一识别算法在多类别虹膜识别中的准确率可能较差。本文提出了基于决策粒子群优化与稳定纹理的虹膜二次识别算法。首先,使用6种图像处理算法提取稳定纹理特征。由Gabor滤波与Hamming距离组成首次识别,Haar小波与BP神经网络组成第二次识别,以顺序结构完成多类别虹膜的二次识别。根据马尔可夫决策过程与不同的虹膜库,自适应优化Gabor滤波和神经网络。结果表明,该算法可以有效提高虹膜识别的准确率。  相似文献   

14.
本文以Fourier变换为主要讨论手段,考察了一类双曲型方程问题的数值解,并给出了求此类问题数值解的一种迭代方法。  相似文献   

15.
台车凝固过程的数值模拟和工艺优化   总被引:1,自引:2,他引:1  
针对具体台车铸件进行了凝固过程温度场的数值模拟,简述了计算过程的原理方法,根据模拟结果,对原铸件的生产工艺进行了优化,并按优化后的工艺过程组织实际生产,获得了较为满意的结果。  相似文献   

16.
介绍了“基础工程优化决策计算机咨询系统”软件的开发与研制,内容包括系统的构成、功能和相关技术。该软件可为用户对地基处理方法和基础形式进行决策时提供咨询服务,以便快及时地作出经济合理的决策。  相似文献   

17.
在2种迭代程序的基础上研究了4种迭代程序收敛的等价性,且就迭代参数αn≤k3L(L+2),βn≤k4(L+1)(L+2)的情形证明了k_强增生映射的4种等价性.研究结果极大地改进和推广了近期的许多重要结论.  相似文献   

18.
在迭代参数仅满足lim supn→∞βn〈1/L(L+1),lim n→∞an=0和∑n=0^+∞an=+∞的条件下,证明了Banach空间中的垂Ф-压缩算子的Mann迭代和Ishikawa迭代收敛性是等价的.所得的结果改进和推广了其他一些相关的研究成果.  相似文献   

19.
本文通过将一类双曲型方程问题转换成偏微分方程组的初始问题,使用Fourier变换考察了它的解,并给出了求该类方程问题近似解的一种迭代方法。  相似文献   

20.
在一种新的准则概率阈值准则下讨论马尔可夫决策的最优解的算法问题.在该准则下,采用基于未来阈值的方法,求解马尔可夫最优策略.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号