期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	47篇
免费	16篇
国内免费	11篇

专业分类

电工技术	3篇
综合类	12篇
化学工业	1篇
矿业工程	3篇
石油天然气	3篇
无线电	15篇
冶金工业	1篇
自动化技术	36篇

出版年

2024年	3篇
2023年	6篇
2022年	5篇
2021年	3篇
2020年	2篇
2018年	1篇
2017年	1篇
2016年	1篇
2015年	1篇
2014年	6篇
2013年	3篇
2012年	6篇
2011年	6篇
2010年	6篇
2009年	6篇
2008年	3篇
2007年	1篇
2006年	5篇
2005年	1篇
2004年	4篇
2000年	3篇
1995年	1篇

排序方式： 共有74条查询结果，搜索用时 125 毫秒

[首页] « 上一页 [1] [2] [3] [4] 5 [6] [7] [8] 下一页 » 末页»

41.

基于状态-动作图测地高斯基的策略迭代强化学习 总被引：3，自引：2，他引：1

程玉虎冯涣婷王雪松《自动化学报》2011,37(1):44-51

在策略迭代强化学习中, 基函数构造是影响动作值函数逼近精度的一个重要因素. 为了给动作值函数逼近提供合适的基函数, 提出一种基于状态-动作图测地高斯基的策略迭代强化学习方法. 首先, 根据离策略方法建立马尔可夫决策过程的状态-动作图论描述; 然后, 在状态-动作图上定义测地高斯核函数, 利用基于近似线性相关的核稀疏方法自动选择测地高斯核的中心; 最后, 在策略评估阶段利用基于状态-动作图的测地高斯核逼近动作值函数, 并基于估计的值函数进行策略改进. 10×10格子世界的仿真结果表明, 与基于状态图普通高斯基和测地高斯基的策略迭代强化学习方法相比, 本文所提方法能以较少的基函数、高精度地逼近具有光滑且不连续特性的动作值函数, 从而有效地获得最优策略. 相似文献

42.

基于图正则自适应联合协同表示的高光谱图像分类

李冬青程玉虎王雪松《控制与决策》2020,35(5):1063-1071

针对由于空间信息利用不充分而导致的高光谱图像分类精度较低的问题,提出一种基于图正则自适应联合协同表示的高光谱图像分类算法.首先,采用双边滤波操作对高光谱图像进行空间信息提取,以充分挖掘每个像素的空间信息;其次,在联合协同表示的目标函数中引入图正则约束项,以保持高光谱数据的流形结构;再次,一方面利用图像分割来自适应调整空间邻域的形状,另一方面通过对中心像素的空间近邻赋予不同的权重,提出一种自适应空间-光谱特征融合策略;最后,基于误差最小原则,给出测试样本的类别标签.在两个高光谱数据集上的实验结果表明,所提出算法的整体分类精度分别达到98.50%和97.30%. 相似文献

43.

考虑输出约束的冗余驱动绳索并联机器人预设性能控制

陈正升程玉虎王雪松《自动化学报》2022,48(7):1704-1717

提出一种考虑输出约束的冗余驱动绳索并联机器人(Redundantly-actuated cable driving parallel robots, RCDPRs)预设性能有限时间控制算法. 首先, 采用Newton-Euler方程推导系统动力学模型, 并建立绳索拉力优化模型保证系统正常工作; 其次, 将输出约束问题转化为位置跟踪误差的坐标变换问题, 设计给定时间衰减函数与非对称变换函数, 将约束形式的跟踪误差转化为无约束变量, 实现给定时间的输出约束; 然后, 针对滑模控制的抖振问题, 在预设性能控制中采用模型不确定与扰动估计器进行扰动估计, 并通过自适应方法对扰动估计误差进行补偿; 以此为基础, 提出一种基于精度驱动且在分段点处三阶连续的终端滑模面进行控制算法设计; 最后, 采用Lyapunov函数证明算法的有限时间收敛特性, 并以7自由度冗余驱动绳索并联机器人为控制对象进行仿真研究, 对算法进行验证. 相似文献

44.

广义行为正则化离线Actor-Critic

程玉虎黄龙阳侯棣元张佳志陈俊龙王雪松《计算机学报》2023,(4):843-855

行为正则化Actor-Critic(BRAC)是一种离线强化学习算法,通过将当前策略与行为策略之间的Kullback-Leibler(KL)散度作为策略目标函数的正则化项来缓解分布偏移问题.但是,由于KL散度是一种无界的分布差异度量,在策略差异过大时,策略目标函数中的累积期望回报项将仅对策略改进发挥有限的作用,从而导致最终学到的策略性能较差.针对该问题,将当前策略与行为策略之间的斜对称Jensen-Shannon (JS)散度作为策略目标函数的正则化项,提出了一种广义行为正则化离线Actor-Critic(GOACBR)算法.理论分析表明:由于斜对称JS散度有界,将其作为正则化项有助于降低策略性能差异.进一步,针对行为策略未知导致难以直接计算当前策略和行为策略间斜对称JS散度的问题,设计了一个辅助网络来对其进行间接估计.最后,给出了GOACBR的收敛性理论证明.在D4RL基准数据集上的评估结果表明：相较于BRAC, GOACBR在所有测试任务上获得的平均累积回报总和提升了289.8%.相关代码公布在https://github.com/houge1996/GOAC. 相似文献

45.

Modeling and Simulation of Time Series Prediction Based on Dynic Neural Network

王雪松程玉虎彭光正《北京理工大学学报(英文版)》2004,13(2)

Molding and simulation of time series prediction based on dynic neural network(NN) are studied. Prediction model for non-linear and time-varying system is proposed based on dynic Jordan NN. Aiming at the intrinsic defects of back-propagation (BP) algorithm that cannot update network weights incrementally, a hybrid algorithm combining the temporal difference (TD) method with BP algorithm to train Jordan NN is put forward. The proposed method is applied to predict the ash content of clean coal in jigging production real-time and multi-step. A practical exple is also given and its application results indicate that the method has better performance than others and also offers a beneficial reference to the prediction of nonlinear time series. 相似文献

46.

基于Elman网络的非线性系统增强式学习控制 总被引：1，自引：0，他引：1

王雪松程玉虎易建强王炜强《中国矿业大学学报》2006,35(5):653-657

针对具有连续状态和未知系统模型的非线性系统控制问题，提出一种基于Elman神经网络的Q学习控制策略．利用Elman网络良好的动态特性及泛化能力，对状态一动作对的Q值进行在线估计，解决状态空间泛化中易出现的“维数灾”问题．借鉴TD（λ）算法中状态的资格迹机制，通过对权值向量定义对应的资格迹来加速神经网络的学习过程．将所提方法应用于具有连续状态的小车爬山控制问题，学习系统在经过大约60多次学习后即能获得小车爬山控制策略，仿真结果表明所提方法能够有效解决具有连续状态的非线性系统的无模型增强学习控制．相似文献

47.

一种基于时间差分算法的神经网络预测控制系统 总被引：5，自引：0，他引：5

王雪松程玉虎《信息与控制》2004,33(5):531-535

为提高多步预测控制的计算效率，提出一种基于时间差分算法的Elman网络多步预测控制器的设计方法．用Elman网络对非线性系统输出值进行直接多步预估，并针对BP算法无法对网络权值的实时调整进行渐进计算的缺点，提出了将时间差分法和BP算法相结合的新的网络学习算法；为简化计算，采用单值预测控制算法对非线性系统进行滚动优化以实现对下一步控制量的优化计算．理论分析与仿真结果表明，该方法具有结构简单、运算量小、速度快的特点，可应用于实时快速系统，并且对系统参数的变化具有一定的自适应性．相似文献

48.

基于极限学习机的无监督领域适应分类器

王雪松赵季娟程玉虎许德智《控制与决策》2020,35(4):861-869

在构建基于极限学习机的无监督自适应分类器时, 隐含层的参数通常都是随机选取的, 而随机选取的参数不具备领域适应能力. 为了增强跨领域极限学习机的知识迁移能力,提出一种新的基于极限学习机的无监督领域适应分类器学习方法, 该方法主要利用自编码极限学习机对源域和目标域数据进行重构学习, 从而可以获得具有领域不变特性的隐含层参数. 进一步, 结合联合概率分布匹配和流形正则的思想, 对输出层权重进行自适应调整. 所提出算法能对极限学习机的两层参数均赋予领域适应能力,在字符数据集和对象识别数据集上的实验结果表明其具有较高的跨领域分类精度. 相似文献

49.

基于测地高斯基函数的递归最小二乘策略迭代

王雪松张政程玉虎张依阳《信息与控制》2009,38(4):1-1

在策略迭代结强化学习方法的值函数逼近过程中,基函数的合理选择直接影响方法的性能．为更好地描述环境的拓扑关系,采用测地线距离来替换普通高斯函数中的欧氏距离,提出一种基于测地高斯基函数的策略迭代强化学习方法．首先,基于马尔可夫决策过程抽样得到的样本数据建立环境的图论描述．其次,在图上定义测地高斯基函数,并用基于最短路径快速算法得到的最短路径来逼近测地线距离．然后,假定强化学习系统的状态—动作值函数是给定测地高斯基函数的加权组合,采用递归最小二乘方法对权值进行在线增量式更新．最后,基于估计的值函数进行策略改进．10￡10 和20￡20 迷宫问题的仿真结果验证了所提策略迭代方法的有效性．相似文献

50.

关联子域对齐网络的跨域高光谱图像分类

下载免费PDF全文

王浩宇程玉虎王雪松《中国图象图形学报》2023,28(10):3255-3266

目的近年来,深度网络成功应用于高光谱图像分类。然而,难以获取充足的标记数据大大限制了深度网络的充分训练,进而导致网络对高光谱图像的分类能力下降。为解决以上困难,提出一种关联子域对齐网络的高光谱图像迁移分类方法。方法基于深度迁移学习方法,通过对两域分布进行多角度、全面领域适应的同时将两域分类器进行差异适配。一方面,利用关联对齐从整体上对齐了两域的二阶统计量信息,适配了两域的全局分布;另一方面,利用局部最大均值差异对齐了相关子域的一阶统计量信息,适配了两域的局部分布。另外,构造一种分类器适配模块并将其加入所提网络中,通过对两域分类器差异进行适配,进一步增强网络的领域适应效果。结果从4组真实高光谱数据集上的实验结果可看出：在分别采集于不同区域的高光谱图像数据对上,所提方法的精度比排名第2的分类方法高出1.01%、0.42%、0.73%和0.64%。本文方法的Kappa系数也取得最优结果。结论与现有主流算法相比较,所提网络能够在整体和局部、一阶和二阶统计量上分别对两域进行有效对齐,进而充分利用在源域上训练好的分类器完成对目标域高光谱数据的跨域分类。相似文献

[首页] « 上一页 [1] [2] [3] [4] 5 [6] [7] [8] 下一页 » 末页»