全文获取类型
收费全文 | 280篇 |
免费 | 78篇 |
国内免费 | 37篇 |
专业分类
电工技术 | 35篇 |
综合类 | 35篇 |
金属工艺 | 1篇 |
机械仪表 | 10篇 |
建筑科学 | 1篇 |
矿业工程 | 1篇 |
能源动力 | 6篇 |
水利工程 | 1篇 |
武器工业 | 2篇 |
无线电 | 48篇 |
一般工业技术 | 11篇 |
冶金工业 | 1篇 |
自动化技术 | 243篇 |
出版年
2025年 | 4篇 |
2024年 | 30篇 |
2023年 | 25篇 |
2022年 | 35篇 |
2021年 | 30篇 |
2020年 | 29篇 |
2019年 | 16篇 |
2018年 | 8篇 |
2017年 | 16篇 |
2016年 | 10篇 |
2015年 | 10篇 |
2014年 | 15篇 |
2013年 | 13篇 |
2012年 | 15篇 |
2011年 | 21篇 |
2010年 | 15篇 |
2009年 | 17篇 |
2008年 | 19篇 |
2007年 | 12篇 |
2006年 | 11篇 |
2005年 | 7篇 |
2004年 | 4篇 |
2003年 | 6篇 |
2002年 | 7篇 |
2001年 | 4篇 |
2000年 | 1篇 |
1999年 | 4篇 |
1998年 | 5篇 |
1997年 | 2篇 |
1996年 | 2篇 |
1994年 | 2篇 |
排序方式: 共有395条查询结果,搜索用时 15 毫秒
71.
本文研究一类同时受加性和乘性噪声影响的离散时间随机系统的最优跟踪控制问题.通过构造由原始系统和参考轨迹组成的增广系统,将随机线性二次跟踪控制(SLQT)的成本函数转化为与增广状态相关的二次型函数,由此推导出用于求解SLQT的贝尔曼方程和增广随机代数黎卡提方程(SARE),而后进一步针对系统和参考轨迹动力学信息完全未知的情形,提出一种Q-学习算法来在线求解增广SARE,证明了该算法的收敛性,并采用批处理最小二乘法(BLS)解决该在线无模型控制算法的实现问题.通过对单相电压源UPS逆变器的仿真,验证了所提出控制方案的有效性. 相似文献
72.
针对异构蜂窝网络下微蜂窝密集部署的不规则性,提出了一种基于强化学习的自优化控制系统,通过微蜂窝功率控制解决微蜂窝密集部署下的网络的容量与覆盖问题。将模糊逻辑与Q学习算法相结合,综合考虑网络的平均用户性能、边缘用户性能和网络环境相互影响来设计模糊逻辑与Q学习算法的联合瞬时回报奖惩值,进行网络容量与覆盖的联合自优化。仿真结果表明,该方法能实现密集化微蜂窝部署下的容量与覆盖自优化,有效提高系统平均用户吞吐量和边缘用户吞吐量。 相似文献
73.
74.
研究单站点传送带给料生产加工站(conveyor-serviced production station,CSPS)系统的前视(look-ahead)距离最优控制问题,以提高系统的工作效率.论文运用半Markov决策过程对CSPS优化控制问题进行建模.考虑传统Q学习难以直接处理CSPS系统前视距离为连续变量的优化控制问题,将小脑模型关节控制器网络的Q值函数逼近与在线学习技术相结合,给出了在线Q学习及模型无关的在线策略迭代算法.仿真结果表明,文中算法提高了学习速度和优化精度. 相似文献
75.
由于道路拓扑结构的限制以及车辆节点的快速变化,车联网路由协议正面临着很多挑战,例如道路的低连通性、较大的延时以及高开销等。为解决此类问题,提出了一种基于Q学习的地理位置路由协议。该协议将地理区域划分成大小一致的正方形,称为网格。在给定目的地的情况下,根据历史交通流信息计算出车辆从当前网格向不同方向的邻居网格移动的Q值,每辆车存储Q值表,通过查询Q值表选择最优下一跳网格。在选定的下一跳网格中,选择距离目的地最近的车辆,当最优下一跳网格中没有邻居车辆时,选择次优下一跳网格中的车辆。仿真结果表明,与其他基于地理位置的路由协议相比,所提协议能够提高分组投递率,降低传输延时并减少通信跳数。 相似文献
76.
In this paper,a data-based scheme is proposed to solve the optimal tracking problem of autonomous nonlinear switching systems.The system state is forced to track the reference signal by minimizing the performance function.First,the problem is transformed to solve the corresponding Bellman optimality equation in terms of the Q-function(also named as action value function).Then,an iterative algorithm based on adaptive dynamic programming(ADP)is developed to find the optimal solution which is totally based on sampled data.The linear-in-parameter(LIP)neural network is taken as the value function approximator.Considering the presence of approximation error at each iteration step,the generated approximated value function sequence is proved to be boundedness around the exact optimal solution under some verifiable assumptions.Moreover,the effect that the learning process will be terminated after a finite number of iterations is investigated in this paper.A sufficient condition for asymptotically stability of the tracking error is derived.Finally,the effectiveness of the algorithm is demonstrated with three simulation examples. 相似文献
77.
78.
基于量子计算的多Agent协作学习算法 总被引:1,自引:0,他引:1
针对多Agent协作强化学习中存在的行为和状态维数灾问题,以及行为选择上存在多个均衡解,为了收敛到最佳均衡解需要搜索策略空间和协调策略选择问题,提出了一种新颖的基于量子理论的多Agent协作学习算法。新算法借签了量子计算理论,将多Agent的行为和状态空间通过量子叠加态表示,利用量子纠缠态来协调策略选择,利用概率振幅表示行为选择概率,并用量子搜索算法来加速多Agent的学习。相应的仿真实验结果显示新算法的有效性。 相似文献
79.
近年来,在基于Q学习算法的作业车间动态调度系统中,状态-行动和奖励值靠人为主观设定,导致学习效果不理想,与已知最优解相比,结果偏差较大.为此,基于作业车间调度问题的特质,对Q学习算法的要素进行重新设计,并用标准算例库进行仿真测试.将结果先与已知最优解和混合灰狼优化算法、离散布谷鸟算法和量子鲸鱼群算法在近似程度、最小值方面进行比较分析.实验结果表明,与国内求解作业车间调度问题的Q学习算法相比,该方法在最优解的近似程度上显著提升,与群智能算法相比,在大多数算例中,寻优能力方面有显著提升. 相似文献
80.
针对Ad Hoc网络路由协议存在的对动态拓扑适应性差和链路不稳定问题,提出了一种Q学习稳定蚁群路由算法(SACRQ),该算法综合了蚁群优化和Q学习算法的思想,将信息素映射为Q学习算法的Q值,增强节点对动态环境的学习能力.在路由选择方面,使用自适应伪随机比率选择下一跳节点,避免算法陷入局部最优或是停滞;提出了新的链路稳定度来衡量链路的鲁棒性,结合鲁棒性和信息素强度两种因素选择下一跳链路.该算法增加了链路的鲁棒性,对Ad Hoc网络动态拓扑适应性强.仿真结果表明,SACRQ的路由发现数量、平均端对端延迟、冲突数量和每次路由发现吞吐量4种指标均优于ARA和AODV. 相似文献