首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   2篇
  免费   1篇
  国内免费   1篇
综合类   2篇
自动化技术   2篇
  2019年   2篇
  2014年   2篇
排序方式: 共有4条查询结果,搜索用时 15 毫秒
1
1.
提出一种基于Q-learning算法的建筑能耗预测方法.通过将建筑能耗预测问题建模为一个标准的马尔科夫决策过程,利用深度置信网对建筑能耗进行状态建模,结合Q-learning算法,实现对建筑能耗的实时预测.通过美国巴尔的摩燃气和电力公司公开的建筑能耗数据进行测试实验,结果表明,基于本文所提出的模型,利用Q-learning算法可以实现对建筑能耗的有效预测,并在此基础上,基于深度置信网的Q-learning算法具有更高的预测精度.此外,实验部分还进一步验证了算法中相关参数对实验性能的影响.  相似文献   
2.
假想防卫等正当化事由错误虽与构成要件事实错误有近似之处,但应将此类错误视为法律错误.应该从违法性本质出发,探讨正当防卫等正当化事由与犯罪构成(按通说三阶层的犯罪构成)的关系,以体系化的思维对假想防卫的罪过形式进行合理归属:视为法律错误,有成立故意的可能,并且排除过失犯罪的可能性.在具有社会相当性的场合,排除犯罪的成立.  相似文献   
3.
假想防卫等正当化事由错误虽与构成要件事实错误有近似之处,但应将此类错误视为法律错误。应该从违法性本质出发,探讨正当防卫等正当化事由与犯罪构成(按通说三阶层的犯罪构成)的关系,以体系化的思维对假想防卫的罪过形式进行合理归属:视为法律错误,有成立故意的可能,并且排除过失犯罪的可能性。在具有社会相当性的场合,排除犯罪的成立。  相似文献   
4.
针对逆强化学习算法在训练初期由于专家样本稀疏所导致的学习速率慢的问题,提出一种基于生成对抗网络(Generative Adversarial Networks,GAN)的最大熵逆强化学习算法。在学习过程中,结合专家样本训练优化生成对抗网络,以生成虚拟专家样本,在此基础上利用随机策略生成非专家样本,构建混合样本集,结合最大熵概率模型,对奖赏函数进行建模,并利用梯度下降方法求解最优奖赏函数。基于所求解的最优奖赏函数,利用正向强化学习方法求解最优策略,并在此基础上进一步生成非专家样本,重新构建混合样本集,迭代求解最优奖赏函数。将所提出的算法与MaxEnt IRL算法应用于经典的Object World与Mountain Car问题,实验表明,该算法在专家样本稀疏的情况下可以较好地求解奖赏函数,具有较好的收敛性能。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号