期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	31篇
免费	6篇
国内免费	2篇

专业分类

电工技术	11篇
综合类	7篇
自动化技术	21篇

出版年

2015年	1篇
2014年	1篇
2013年	1篇
2012年	3篇
2011年	1篇
2009年	1篇
2008年	4篇
2005年	2篇
2004年	1篇
2003年	4篇
2002年	4篇
2001年	7篇
2000年	5篇
1997年	1篇
1993年	1篇
1991年	1篇
1990年	1篇

排序方式： 共有39条查询结果，搜索用时 15 毫秒

1 [2] [3] [4] 下一页 » 末页»

基于Q-学习的非线性控制

杨东殷苌茗陈焕文吴柏森《电力科学与技术学报》2003,18(1):35-38

给出了一种新的激励学习(RL)方法,它能够有效地解决一个状态与动作空间为连续的非线性控制问题.在实际的应用中,离散的RL方法能把许多非线性控制问题分解成几个局部线性控制作业.提供了一种由简单的线性控制器和Q-学习构成的层次性RL算法.连续状态-动作空间被形象地分成为一些格子,并且每个格子都有它自己的局部线性控制器.状态空间的隔离是处理维数问题的一种相当简单的方法,但是经常会引起非Markov效果,而局部线性控制器能弥补这个缺陷. 相似文献

基于有效跟踪的平均渐进瞬时差分学习遗忘算法

殷苌茗王汉兴陈焕文谢丽娟《电力科学与技术学报》2003,18(4):12-16

智能体通过学习最优决策来解决其决策问题.激励学习方法是智能体通过与其所处的环境交互来改进它自身的行为.Markov决策过程(MDP)模型是求解激励学习问题的一般框架,瞬时差分TD(λ)是在MDP模型下与策略相关的学习值函数的一种算法.一般情况下,智能体必须记住其所有的值函数的值,当状态空间非常大时,这种记忆的量是大得惊人的.为了解决这个问题,给出了一种遗忘算法,这种算法把心理学的遗忘准则引入到了激励学习之中.利用遗忘算法,可以解决智能体在大状态空间中的激励学习问题. 相似文献

分布式实时多媒体数据库的研究与应用

殷苌茗龚红仿《电工标准与质量》2001,(2)

讨论了多媒体数据库的结构 ,对多媒体数据库的实时传输与分布式特性问题分别进行了研究 ,并具体给出了 1个实际的应用实例 . 相似文献

复交换Banach代数中可约元的等价条件

殷苌茗《电工标准与质量》1990,(1)

设A是一个复交换Banach代数.本文在G·Corach等人给出的“可约”概念基础上,证明了A中可约元(α,α)的几个有趣的等价条件.主要结果是:若A是一个复交换Banach代数,(α,α)∈U_(n+1)(A).则(α,α)在A中可约的充分必要条件是存在f_m∈U_n(C(σ(A))),使得‖f_m-α‖Zα→0.这里‖f_m‖Zα=sup{‖f_m(h)h∈Z_α}.(m∈N). 相似文献

基于每阶段平均费用最优的激励学习算法 总被引：4，自引：0，他引：4

殷苌茗陈焕文谢丽娟《计算机应用》2002,22(4):25-27

文中利用求解最优费用函数的方法给出了一种新的激励学习算法，即基于每阶段平均费用最优的激励学习算法。这种学习算法是求解信息不完全Markov决策问题的一种有效激励学习方法，它从求解分阶段最优平均费用函数的方法出发，分析了最优解的存在性，分阶段最优平均费用函数与初始状态的关系以及与之相关的Bellman方程。这种方法的建立，可以使得动态规划（DP）算法中的许多结论直接应用到激励学习的研究中来。相似文献

基于模糊不变矩的复制粘贴伪造检测方法

许国栋李峰熊兵殷苌茗《计算机工程与应用》2012,48(20):211-215

随着各种高级图像处理算法以及相应图像处理软硬件的出现,即使非专业人士也很容易篡改图像,并使人肉眼很难甚至无法识别。针对一种常见的图像篡改--复制粘贴伪造,提出了一个能自动检测并标识数字图像中复制区域的方法。将图像分成多个重叠块,每块的特征用由模糊不变矩计算得到的模糊不变量表示,按照预定的相似标准来确定图像篡改区域。实验结果表明：相对于基于PCA的方法,该方法在抗模糊处理方面具有明显的优势。相似文献

分布式异构实时监控数据库系统的设计与实现

殷苌茗何桂华龚红仿《电力科学与技术学报》2001,16(3):27-30

在开发发电厂分布式实时监控与数据库管理系统时,常常遇到这样的两个问题:一是在作发电机组的实时监控与实时数据库管理系统的开发过程中,各系统的开发是分批进行的,也就是说如果某发电厂有四台发电机组,可能由于投资方面的原因,需要2～4年才能完成,而且每台发电机组的系统开发组织不是同一个;另外一个问题是当所有的独立系统开发完成之后,由于各个系统所使用的网络技术和网络体系结构各不相同,各系统所开发的数据库也各不相同,因此需要将它们进行集成,形成全盘的实时分布式监控与数据库管理系统.本文对以上遇到的问题进行了比较详细的讨论,对异构网络的互连方案、异构网络环境下实现分布式特性的解决方案、异构网络环境下的实时通信问题的解决方案以及异构数据库系统之间的数据交换与实时共享问题的解决方案进行了设计. 相似文献

IPv4的ARP与IPv6的邻居发现协议之比较

殷苌茗龚红仿姜腊林《电力科学与技术学报》2001,16(1):23-26

从IPv4转向IPv6的原因众所周知.在基于TCP/IP的网络中,地址解析(以及逆向地址解析)是一个十分重要的问题.IPv4中使用了ARP和RARP两个协议来解决.IPv6对于这个问题使用一种新的协议,即邻居发现协议,这些功能包括在ICMPv6中,其中邻居宣告和邻居请求合在一起代替了IPv4中的ARP协议.对于ARP和RARP已有了成熟的技术,而IPv6的邻居发现协议的开发与实现正在实验阶段,本文的目的是对IPv6的有关地址解析问题作一个探讨,并对它与IPv4的ARP和RARP在功能上技术上进行比较,以此可以通过ARP/RARP的技术特点,来指导将来从IPv4转向IPv4的有关技术问题. 相似文献

基于因素化表示的TD（λ）算法

下载免费PDF全文

戴帅殷苌茗张欣《计算机工程》2009,35(13):190-192

提出一种新的基于因素法方法的TD（λ）算法。其基本思想是状态因素化表示,通过动态贝叶斯网络表示Markov决策过程（MDP）中的状态转移概率函数,结合决策树表示TD（λ）算法中的状态值函数,降低状态空间的搜索与计算复杂度,因而适用于求解大状态空间的MDPs问题,实验证明该表示方法是有效的。相似文献

10.

基于有效跟踪的平均渐进瞬时差分学习遗忘算法

殷苌茗王汉兴陈焕文谢丽娟《电工标准与质量》2003,18(4):12-16

智能体通过学习最优决策来解决其决策问题．激励学习方法是智能体通过与其所处的环境交互来改进它自身的行为．Markov决策过程(MDP)模型是求解激励学习问题的一般框架，瞬时差分TD(λ)是在MDP模型下与策略相关的学习值函数的一种算法．一般情况下，智能体必须记住其所有的值函数的值，当状态空间非常大时，这种记忆的量是大得惊人的．为了解决这个问题，给出了一种遗忘算法，这种算法把心理学的遗忘准则引入到了激励学习之中．利用遗忘算法，可以解决智能体在大状态空间中的激励学习问题．相似文献

1 [2] [3] [4] 下一页 » 末页»