排序方式: 共有59条查询结果,搜索用时 31 毫秒
52.
针对深度Q网络(DQN)算法因过估计导致收敛稳定性差的问题,在传统时序差分(TD)的基础上提出N阶TD误差的概念,设计基于二阶TD误差的双网络DQN算法。构造基于二阶TD误差的值函数更新公式,同时结合DQN算法建立双网络模型,得到两个同构的值函数网络分别用于表示先后两轮的值函数,协同更新网络参数,以提高DQN算法中值函数估计的稳定性。基于Open AI Gym平台的实验结果表明,在解决Mountain Car和Cart Pole问题方面,该算法较经典DQN算法具有更好的收敛稳定性。 相似文献
53.
随着智能化建筑数量的剧增与智能化水平的提高,建筑智能设备状态感知成为了关系到社会公共安全方面重要问题之一。目前,建筑设备感知系统大多基于服务器集中计算架构,存在存储数据量大、通信带宽要求高、节点自主性不够等问题,往往容易造成建筑设备感知实时性不足、网络成本高的问题。由此,提出一种基于边缘计算的建筑设备状态感知模型,设计了边缘状态感知与缓存算法,建立了一组边缘通信与状态感知协议,形成了边缘隐私数据信任与安全机制,同时,引入基于边缘数据的智能决策技术,从而不仅缓解了中心服务器的计算与存储压力,而且有效提升了整个系统的自主感知能力、安全性与健壮性。最后,依托该模型实现了一个运维示范系统,在S城市管理中进行了应用。 相似文献
54.
55.
工科电类专业毕业设计教学环节的改革探讨 总被引:3,自引:0,他引:3
章阐述了毕业设计的重要作用,对当前在毕业设计教学环节中存在的主要问题进行分析,提出了改革毕业设计教学环节的新思路,并给出具体的操作方法。最后,对其实施效果进行了简单评述。 相似文献
56.
57.
μC/OSⅡ是一个完整的,可移植、固化、裁减的抢占式实时多任务内核。本文着重介绍了μC/OSⅡ嵌入式操作系统内核在Microchip PIC18F452单片机上的移植方法和实时应用程序的设计方法。 相似文献
58.
59.