首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   47篇
  免费   16篇
  国内免费   11篇
电工技术   3篇
综合类   12篇
化学工业   1篇
矿业工程   3篇
石油天然气   3篇
无线电   15篇
冶金工业   1篇
自动化技术   36篇
  2024年   3篇
  2023年   6篇
  2022年   5篇
  2021年   3篇
  2020年   2篇
  2018年   1篇
  2017年   1篇
  2016年   1篇
  2015年   1篇
  2014年   6篇
  2013年   3篇
  2012年   6篇
  2011年   6篇
  2010年   6篇
  2009年   6篇
  2008年   3篇
  2007年   1篇
  2006年   5篇
  2005年   1篇
  2004年   4篇
  2000年   3篇
  1995年   1篇
排序方式: 共有74条查询结果,搜索用时 125 毫秒
41.
基于状态-动作图测地高斯基的策略迭代强化学习   总被引:3,自引:2,他引:1  
在策略迭代强化学习中, 基函数构造是影响动作值函数逼近精度的一个重要因素. 为了给动作值函数逼近提供合适的基函数, 提出一种基于状态-动作图测地高斯基的策略迭代强化学习方法. 首先, 根据离策略方法建立马尔可夫决策过程的状态-动作图论描述; 然后, 在状态-动作图上定义测地高斯核函数, 利用基于近似线性相关的核 稀疏方法自动选择测地高斯核的中心; 最后, 在策略评估阶段利用基于状态-动作图的测地高斯核逼近动作值函数, 并基于估计的值函数进行策略改进. 10×10格子世界的仿真结果表明, 与基于状态图普通高斯基和测地高斯基的策略迭代强化学习方法相比, 本文所提方法能以较少的基函数、高精度地逼近具有光滑且不连续特 性的动作值函数, 从而有效地获得最优策略.  相似文献   
42.
针对由于空间信息利用不充分而导致的高光谱图像分类精度较低的问题,提出一种基于图正则自适应联合协同表示的高光谱图像分类算法.首先,采用双边滤波操作对高光谱图像进行空间信息提取,以充分挖掘每个像素的空间信息;其次,在联合协同表示的目标函数中引入图正则约束项,以保持高光谱数据的流形结构;再次,一方面利用图像分割来自适应调整空间邻域的形状,另一方面通过对中心像素的空间近邻赋予不同的权重,提出一种自适应空间-光谱特征融合策略;最后,基于误差最小原则,给出测试样本的类别标签.在两个高光谱数据集上的实验结果表明,所提出算法的整体分类精度分别达到98.50%和97.30%.  相似文献   
43.
提出一种考虑输出约束的冗余驱动绳索并联机器人(Redundantly-actuated cable driving parallel robots, RCDPRs)预设性能有限时间控制算法. 首先, 采用Newton-Euler方程推导系统动力学模型, 并建立绳索拉力优化模型保证系统正常工作; 其次, 将输出约束问题转化为位置跟踪误差的坐标变换问题, 设计给定时间衰减函数与非对称变换函数, 将约束形式的跟踪误差转化为无约束变量, 实现给定时间的输出约束; 然后, 针对滑模控制的抖振问题, 在预设性能控制中采用模型不确定与扰动估计器进行扰动估计, 并通过自适应方法对扰动估计误差进行补偿; 以此为基础, 提出一种基于精度驱动且在分段点处三阶连续的终端滑模面进行控制算法设计; 最后, 采用Lyapunov函数证明算法的有限时间收敛特性, 并以7自由度冗余驱动绳索并联机器人为控制对象进行仿真研究, 对算法进行验证.  相似文献   
44.
行为正则化Actor-Critic(BRAC)是一种离线强化学习算法,通过将当前策略与行为策略之间的Kullback-Leibler(KL)散度作为策略目标函数的正则化项来缓解分布偏移问题.但是,由于KL散度是一种无界的分布差异度量,在策略差异过大时,策略目标函数中的累积期望回报项将仅对策略改进发挥有限的作用,从而导致最终学到的策略性能较差.针对该问题,将当前策略与行为策略之间的斜对称Jensen-Shannon (JS)散度作为策略目标函数的正则化项,提出了一种广义行为正则化离线Actor-Critic(GOACBR)算法.理论分析表明:由于斜对称JS散度有界,将其作为正则化项有助于降低策略性能差异.进一步,针对行为策略未知导致难以直接计算当前策略和行为策略间斜对称JS散度的问题,设计了一个辅助网络来对其进行间接估计.最后,给出了GOACBR的收敛性理论证明.在D4RL基准数据集上的评估结果表明:相较于BRAC, GOACBR在所有测试任务上获得的平均累积回报总和提升了289.8%.相关代码公布在https://github.com/houge1996/GOAC.  相似文献   
45.
Molding and simulation of time series prediction based on dynic neural network(NN) are studied. Prediction model for non-linear and time-varying system is proposed based on dynic Jordan NN. Aiming at the intrinsic defects of back-propagation (BP) algorithm that cannot update network weights incrementally, a hybrid algorithm combining the temporal difference (TD) method with BP algorithm to train Jordan NN is put forward. The proposed method is applied to predict the ash content of clean coal in jigging production real-time and multi-step. A practical exple is also given and its application results indicate that the method has better performance than others and also offers a beneficial reference to the prediction of nonlinear time series.  相似文献   
46.
基于Elman网络的非线性系统增强式学习控制   总被引:1,自引:0,他引:1  
针对具有连续状态和未知系统模型的非线性系统控制问题,提出一种基于Elman神经网络的Q学习控制策略.利用Elman网络良好的动态特性及泛化能力,对状态一动作对的Q值进行在线估计,解决状态空间泛化中易出现的“维数灾”问题.借鉴TD(λ)算法中状态的资格迹机制,通过对权值向量定义对应的资格迹来加速神经网络的学习过程.将所提方法应用于具有连续状态的小车爬山控制问题,学习系统在经过大约60多次学习后即能获得小车爬山控制策略,仿真结果表明所提方法能够有效解决具有连续状态的非线性系统的无模型增强学习控制.  相似文献   
47.
一种基于时间差分算法的神经网络预测控制系统   总被引:5,自引:0,他引:5  
为提高多步预测控制的计算效率,提出一种基于时间差分算法的Elman网络多步预测控制器的设计方法.用Elman网络对非线性系统输出值进行直接多步预估,并针对BP算法无法对网络权值的实时调整进行渐进计算的缺点,提出了将时间差分法和BP算法相结合的新的网络学习算法;为简化计算,采用单值预测控制算法对非线性系统进行滚动优化以实现对下一步控制量的优化计算.理论分析与仿真结果表明,该方法具有结构简单、运算量小、速度快的特点,可应用于实时快速系统,并且对系统参数的变化具有一定的自适应性.  相似文献   
48.
在构建基于极限学习机的无监督自适应分类器时, 隐含层的参数通常都是随机选取的, 而随机选取的参数不具备领域适应能力. 为了增强跨领域极限学习机的知识迁移能力,提出一种新的基于极限学习机的无监督领域适应分类器学习方法, 该方法主要利用自编码极限学习机对源域和目标域数据进行重构学习, 从而可以获得具有领域不变特性的隐含层参数. 进一步, 结合联合概率分布匹配和流形正则的思想, 对输出层权重进行自适应调整. 所提出算法能对极限学习机的两层参数均赋予领域适应能力,在字符数据集和对象识别数据集上的实验结果表明其具有较高的跨领域分类精度.  相似文献   
49.
在策略迭代结强化学习方法的值函数逼近过程中,基函数的合理选择直接影响方法的性能.为更好地 描述环境的拓扑关系,采用测地线距离来替换普通高斯函数中的欧氏距离,提出一种基于测地高斯基函数的策略迭 代强化学习方法.首先,基于马尔可夫决策过程抽样得到的样本数据建立环境的图论描述.其次,在图上定义测地 高斯基函数,并用基于最短路径快速算法得到的最短路径来逼近测地线距离.然后,假定强化学习系统的状态—动 作值函数是给定测地高斯基函数的加权组合,采用递归最小二乘方法对权值进行在线增量式更新.最后,基于估计 的值函数进行策略改进.10£10 和20£20 迷宫问题的仿真结果验证了所提策略迭代方法的有效性.  相似文献   
50.
目的 近年来,深度网络成功应用于高光谱图像分类。然而,难以获取充足的标记数据大大限制了深度网络的充分训练,进而导致网络对高光谱图像的分类能力下降。为解决以上困难,提出一种关联子域对齐网络的高光谱图像迁移分类方法。方法 基于深度迁移学习方法,通过对两域分布进行多角度、全面领域适应的同时将两域分类器进行差异适配。一方面,利用关联对齐从整体上对齐了两域的二阶统计量信息,适配了两域的全局分布;另一方面,利用局部最大均值差异对齐了相关子域的一阶统计量信息,适配了两域的局部分布。另外,构造一种分类器适配模块并将其加入所提网络中,通过对两域分类器差异进行适配,进一步增强网络的领域适应效果。结果 从4组真实高光谱数据集上的实验结果可看出:在分别采集于不同区域的高光谱图像数据对上,所提方法的精度比排名第2的分类方法高出1.01%、0.42%、0.73%和0.64%。本文方法的Kappa系数也取得最优结果。结论 与现有主流算法相比较,所提网络能够在整体和局部、一阶和二阶统计量上分别对两域进行有效对齐,进而充分利用在源域上训练好的分类器完成对目标域高光谱数据的跨域分类。  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号