期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	22篇
免费	0篇
国内免费	19篇

专业分类

综合类	7篇
武器工业	1篇
自动化技术	33篇

出版年

2003年	1篇
2002年	2篇
2001年	2篇
2000年	4篇
1999年	6篇
1998年	5篇
1997年	2篇
1996年	3篇
1995年	3篇
1994年	3篇
1993年	1篇
1992年	1篇
1989年	1篇
1988年	2篇
1987年	1篇
1985年	1篇
1984年	1篇
1983年	1篇
1982年	1篇

排序方式： 共有41条查询结果，搜索用时 31 毫秒

[首页] « 上一页 [1] [2] 3 [4] [5] 下一页 » 末页»

21.

A NEURAL NETWORK BASED METHOD FOR DYNAMICAL HIERARCHICAL OPTIMIZATION OF A CLASS OF LARGE-SCALE SYSTEMS

侯增广高慧琪吴沧浦《自动化学报》1998,24(２):1

相似文献

22.

Q学习算法中网格离散化方法的收敛性分析 总被引：6，自引：1，他引：5

蒋国飞高慧琪吴沧浦《控制理论与应用》1999,16(2):194-198

Ｑ学习算法是Ｗａｔｋｉｎｓ提出的求解信息不完全马尔可夫决策问题的一种强化学习方法,要用Ｑ学习算法来求解有连续状态和决策空间的随机最优控制问题,则需要先离散化问题的状态和决策空间,在本文中,我们证明了在满足一定的Ｌｉｐｓｃｈｉｔｚ连续性和有关集合为紧集的条件下,随着网格密度的增加,空间离散化后Ｑ学习算法求得的最优解依概率１收敛于原连续问题的最优解。相似文献

23.

基于神经网络的一类大系统动态递阶优化方法

侯增广高慧琪吴沧浦《自动化学报》1998,24(2):160-165

提出了一种用于求解离散时间大系统动态递阶优化问题的神经网络模型 (LHONN),该网络以全集成化为特征:1)各子系统的动态方程嵌入相应的局部优化网络中, 使得网络结构具有较低的维数,易于硬件实现;2)其上级协调网络和局部优化网络的求解过程同时进行,优化求解速度高,适宜于实时系统优化. 相似文献

24.

一种新的非线性规划神经网络模型 总被引：1，自引：0，他引：1

杨若黎吴沧浦《自动化学报》1996,22(3):293-300

提出一种新型的求解非线性规划问题的神经网络模型.该模型由变量神经元、Lagrange 乘子神经元和Kuhn-Tucker乘子神经元相互连接构成.通过将Kuhn-Tucker乘子神经元限制在单边饱和工作方式,使得在处理非线性规划问题中不等式约束时不需要引入松弛变量,避免了由于引入松弛变量而造成神经元数目的增加,有利于神经网络的硬件实现和提高神经网络的收敛速度.可以证明,在适当的条件下,文中提出的神经网络模型的状态轨迹收敛到与非线性规划问题的最优解相对应的平衡点. 相似文献

25.

多指标动态规划的交互式满意置换率法

赵蔚吴沧浦《自动化学报》1994,20(6):694-701

提出了一种新的求解多指标动态规划问题的算法,它是由多目标静态规划的交互式满意置换率法[1]推广得到的.通过增加附加状态变量进行数学模型转换,将单指标动态规划问题转化为静态规划问题,再进行迭代.这样既减少了计算量,又使各指标间的置换关系易于求得.所提方法在人机交互过程中对决策者的要求不高,对于一类常见的多指标动态规划问题, 可以迅速获得满意的解. 相似文献

26.

机器人动力学的快速实时计算

李长金吴沧浦《机器人》1988,(1)

本文给出了一种相对于机器人各臂坐标系,计算 Lagrange-Euler 形式的机器人动力学方程快速实时方法。在计算上,这种新方法比文献〔1〕～〔3〕中的方法更有效,计算量更小。对于一个六自由度的机器人,它的计算量至多为893个乘法与719个加法。尽管在理论上这种方法的计算量比 Newton-Euler 方法的计算量(852个乘法与738个加法)约多40个乘法,伹实际程序运行时间比 Newton-Euler 方法短。相似文献

27.

一类动态规划模型的分时段迭代算法

何志明吴沧浦《兵工学报》1988,(3)

本文提出对于一类动态规划模型的分时段迭代算法。此方法在计算上是有效的,并且具有较小的存贮量。该方法可以有效地克服多维状态动态决策问题中的维数困难。本文结合两种动态规划模型详细研究了该算法的收敛性质,得到了相应的理论结果。相似文献

28.

第八届世界自控联(IFAC)大会论文评介(二)

陈翰馥吴沧浦张嗣瀛高龙《机器人》1982,4(6):1-11

近年来,对扩散型的非线性随机微分方程 dx(t)=f(x(t))dt+g(x(t))dw(t) dy(t)=h(x(t))dt+dv(t),较多的工作集中在研究给定{y(s),o≤s≤t}后x(t)的条件密度v_t(dx)上,形成当前非线性滤波研究中的重要方向。相似文献

29.

基于最小最大逼近强化学习的误差分析

吴沧浦刘念泉《控制与决策》2000,15(2):193-196

在基于动态规划的强化学习中,利用状态集结方法可以减小状态空间的大小,从而在一定程度上克服了维数灾的困难,同时还可以加快学习速度。但状态集结是一种逼近方法,由此产生的问题是,状态集结后的Ｑ－ｈａｔ强化学习收敛所得的最优Ｑ值函数与集结前相应的最优Ｑ值函数会有多大的误差。为此提出了基于最小最大逼近强化学习的误差估计。相似文献

30.

一种基于Intranet和多Agent系统的决策支持系统框架

黄健昌吴沧浦《计算机工程与应用》2002,38(19):233-235

基于Intranet的决策支持系统的研究不仅具有重大的理论价值,而且具有很高的应用价值。该文通过对多A-gent系统与传统决策支持系统的比较和结合,把Agent方法引入到基于Intranet的决策支持系统的研究中,提出了一种新型的决策支持系统实现框架。该框架充分利用了Agent自主运行、主动性、持续性和问题求解能力以及多Agent系统的分布式和合作性等特点,对基于Intranet决策支持系统结构的研究产生了深刻的影响。该文给出了一个基于该框架的原型系统实现,通过仿真可以看出该实现框架非常适合于企业Intranet分布式开放环境。相似文献

[首页] « 上一页 [1] [2] 3 [4] [5] 下一页 » 末页»