排序方式: 共有72条查询结果,搜索用时 15 毫秒
51.
针对传统Actor-critic (AC) 方法在求解连续空间序贯决策问题时收敛速度较慢、收敛质量不高的问题, 提出一种基于对称扰动采样的AC算法框架. 首先, 框架采用高斯分布作为策略分布, 在每一时间步对当前动作均值对称扰动, 从而生成两个动作与环境并行交互; 然后, 基于两者的最大时域差分(TD) 误差选取Agent 的行为动作, 并对值函数参数进行更新; 最后, 基于两者的平均常规梯度或增量自然梯度对策略参数进行更新. 理论分析和仿真结果表明, 所提框架具有较好的收敛性和计算效率.
相似文献52.
空位种子极大地提高了生物分子序列比对的灵敏度,但不适合大量存在插入和删除字符的序列.在空位种子的基础上,提出了带插入-删除的生物序列比对种子,进一步提高了生物序列比对的效率.实验表明,采用最优搜索算法可以有效地在给定约束条件下寻找到最优的插入-删除种子,并且插入-删除种子比同长度的最优空位种子具有更高的生物序列比对敏感... 相似文献
53.
54.
55.
56.
57.
针对主动队列管理(AQM)研究中缺乏系统的理论分析的问题,引入最优控制理论进行分析,得到了主动队列管理的数学模型,该模型包括两个差分方程,分别描述队列长度和平均队列长度的变化;给定目标函数,以分组丢弃概率为控制变量,将主动队列管理的优化问题转化为动态规划问题,给出优化策略。 相似文献
58.
提出了一种改进的立体云模拟方法,用Navier-Stokes流体方程描述云的运动规律,同时考虑大气运动条件下云的特性,建立云的运动模型。在云的实时渲染方面,基于太阳光照方向和天气状况提出了一种简单的光照模型,大幅度地提高了云的渲染速度。此外,使用改进的环状Impostor技术来提高大范围云层的渲染速度。基于上述理论模型,利用实验室自主图形引擎开发了一套三维云仿真插件,广泛应用于各种实时仿真和科技娱乐项目中。该方法绘制的云具有规模大、真实感强、渲染速度快的特点。 相似文献
59.
60.
针对硬件面积、价格成本、功耗、实时性和可靠性多目标优化的一类嵌入式系统软硬件划分问题,提出了一种采用多属性决策技术的求解方法。首先对可靠性指标进行了转换,通过改进的最短路径算法获得满足约束的Pareto方案集合;然后,采用基于组合权重的TOPSIS算法对多个划分方案进行评价排序,得到最优的多目标划分解;最后,通过一个实例验证了本方法的有效性和可行性。 相似文献