期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	2篇
免费	1篇
国内免费	1篇

专业分类

综合类	2篇
自动化技术	2篇

出版年

2019年	2篇
2014年	2篇

排序方式： 共有4条查询结果，搜索用时 15 毫秒

基于Q-Learning算法的建筑能耗预测

陈建平陈其强胡文陆悠吴宏杰傅启明《计算机系统应用》2019,28(1):156-162

提出一种基于Q-learning算法的建筑能耗预测方法.通过将建筑能耗预测问题建模为一个标准的马尔科夫决策过程,利用深度置信网对建筑能耗进行状态建模,结合Q-learning算法,实现对建筑能耗的实时预测.通过美国巴尔的摩燃气和电力公司公开的建筑能耗数据进行测试实验,结果表明,基于本文所提出的模型,利用Q-learning算法可以实现对建筑能耗的有效预测,并在此基础上,基于深度置信网的Q-learning算法具有更高的预测精度.此外,实验部分还进一步验证了算法中相关参数对实验性能的影响. 相似文献

论假想防卫的罪过形式

陈其强《重庆工业高等专科学校学报》2014,(9):31-33

假想防卫等正当化事由错误虽与构成要件事实错误有近似之处,但应将此类错误视为法律错误.应该从违法性本质出发,探讨正当防卫等正当化事由与犯罪构成（按通说三阶层的犯罪构成）的关系,以体系化的思维对假想防卫的罪过形式进行合理归属：视为法律错误,有成立故意的可能,并且排除过失犯罪的可能性.在具有社会相当性的场合,排除犯罪的成立. 相似文献

论假想防卫的罪过形式

陈其强《重庆科技学院学报(社会科学版)》2014,(9)

假想防卫等正当化事由错误虽与构成要件事实错误有近似之处,但应将此类错误视为法律错误。应该从违法性本质出发,探讨正当防卫等正当化事由与犯罪构成(按通说三阶层的犯罪构成)的关系,以体系化的思维对假想防卫的罪过形式进行合理归属:视为法律错误,有成立故意的可能,并且排除过失犯罪的可能性。在具有社会相当性的场合,排除犯罪的成立。相似文献

基于生成对抗网络的最大熵逆强化学习

下载免费PDF全文

陈建平陈其强傅启明高振吴宏杰陆悠《计算机工程与应用》2019,55(22):119-126

针对逆强化学习算法在训练初期由于专家样本稀疏所导致的学习速率慢的问题,提出一种基于生成对抗网络（Generative Adversarial Networks,GAN）的最大熵逆强化学习算法。在学习过程中,结合专家样本训练优化生成对抗网络,以生成虚拟专家样本,在此基础上利用随机策略生成非专家样本,构建混合样本集,结合最大熵概率模型,对奖赏函数进行建模,并利用梯度下降方法求解最优奖赏函数。基于所求解的最优奖赏函数,利用正向强化学习方法求解最优策略,并在此基础上进一步生成非专家样本,重新构建混合样本集,迭代求解最优奖赏函数。将所提出的算法与MaxEnt IRL算法应用于经典的Object World与Mountain Car问题,实验表明,该算法在专家样本稀疏的情况下可以较好地求解奖赏函数,具有较好的收敛性能。相似文献