排序方式: 共有49条查询结果,搜索用时 35 毫秒
1.
2.
神经网络增强学习的梯度算法研究 总被引:12,自引:1,他引:11
针对具有连续状态和离散行为空间的Markov决策问题,提出了一种新的采用多层前馈神经网络进行值函数逼近的梯度下降增强学习算法,该算法采用了近似贪心且连续可微的Boltzmann分布行为选择策略,通过极小化具有非平稳行为策略的Bellman残差平方和性能指标,以实现对Markov决策过程最优值函数的逼近,对算法的收敛性和近似最优策略的性能进行了理论分析,通过Mountain-Car学习控制问题的仿真研究进一步验证了算法的学习效率和泛化性能。 相似文献
3.
基于数据挖掘的自适应入侵检测框架设计 总被引:4,自引:0,他引:4
数据挖掘、人工神经网络和机器学习等技术在入侵检测中的广泛应用,大幅度地提高了检测引擎的精度,但误用检测中的漏报率和异常检测中的误报率仍然是入侵检测中的难题。论文结合误用检测和异常检测的特点,利用机器学习思想,设计实现了一种新型的具有自适应能力的复合式入侵检测系统。 相似文献
4.
LXI总线接口的设计及其在军用测试系统中的应用 总被引:4,自引:2,他引:2
简要分析了新一代仪器总线系统LXI(Lan eXtension for Instrument)的特征及其技术要点,重点阐述了以ARM9嵌入式处理器、以太网接口芯片和大规模可编程逻辑器件FPGA等实现LXI总线接口的硬件设计方案,并详细介绍了基于Linux嵌入式操作系统的LXI总线接口软件的设计,以及LXI软件系统中嵌入式Web服务器的工作原理;对基于LXI总线的军用型号测试系统的构建技术进行了研究,并对LXI总线仪器在未来军用测试应用中需要注意的问题作了探讨。 相似文献
5.
VB环境下水工隧洞数据库的设计与开发 总被引:2,自引:0,他引:2
徐昕 《计算机自动测量与控制》2001,9(2):56-56,70
介绍了VB环境下水工隧洞数据库的结构、界面和编程。通过水工隧洞数据库操作举例,说明了水工隧洞数据库的操作方法。 相似文献
6.
策略梯度强化学习中的最优回报基线 总被引:2,自引:0,他引:2
尽管策略梯度强化学习算法有较好的收敛性,但是在梯度估计的过程中方差过大,却是该方法在理论和应用上的一个主要弱点,为减小梯度强化学习算法的方差,该文提出一种新的算法——Istate-Grbp算法:在策略梯度算法Istate-GPOMDP中加入回报基线,以改进策略梯度算法的学习性能,文中证明了在Istate-GPOMDP算法中引入回报基线,不会改变梯度估计的期望值,并且给出了使方差最小的最优回报基线,实验结果表明,和已有算法相比,该文提出的算法通过减小梯度估计的方差,提高了学习效率,加快了学习过程的收敛。 相似文献
7.
文本相似性度量中参数相关性与优化配置研究 总被引:1,自引:1,他引:0
针对文本相似性度量中的相似度阈值、准确率、召回率、shingle滑动窗口大小、shingle权重系数和文本属性等参数相互影响、关系复杂的问题,研究了这些参数之间的相关性,并结合实际应用需求,提出各参数可优化配置的建议,分析与设计了相似度阈值可适应文本篇幅属性的相似性度量算法.通过某基金2009年的7378个项目申请书的比对分析,结果表明:提出的算法不但适用于大规模的文本集合,而且在短小的文本集合中进行相似性度量也具有很高的应用价值,其准确率和召回率均可高达95%以上. 相似文献
8.
9.
基于移动Agent的任播多目标路由协议 总被引:1,自引:0,他引:1
针对以往任播多目标路由协议要求全局信息导致大量节点资源和网络资源耗费的问题,提出一种基于移动Agent的任播多目标路由协议.该协议只要求节点掌握局部信息,通过移动Agent去寻找任播组员,建立任播路由表,因此节点和网络资源开销较少.在路由表建立子协议中,该协议采用移动Agent寻找任播组员、计算路径权重和建立路由表;在数据包传递子协议中,采用随机权重选择法进行目标选择,平衡网络流量.仿真实验证明本文协议因节省了节点和网络资源开销,在网络时延性能上具有较好的表现. 相似文献
10.