期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

2篇

专业分类

综合类	1篇
自动化技术	1篇

出版年

2022年	1篇
2020年	1篇

排序方式： 共有2条查询结果，搜索用时 15 毫秒

基于UCB算法的交替深度Q网络

下载免费PDF全文

吴卿源谭晓阳《南京师范大学学报》2022,(1):024-29

在深度强化学习中,智能体需要与环境进行交互学习,这就需要智能体能够很好地去平衡利用与探索. 因此如何提升算法的样本有效性,增加算法的探索能力,一直是深度强化学习领域中非常重要的研究方向. 结合已有研究成果,提出了一种交替使用多个不同初始化深度Q网络方法,使用网络随机初始化带来的探索性能. 基于最大置信度上界算法先构造一种交替选择深度Q网络策略. 并将该调度网络策略与多个随机初始化的深度Q网络结合,得到基于最大置信度上界的交替深度Q网络算法. 在多个不同的标准强化学习实验环境上的实验结果表明,该算法比其他基准算法有更高的样本效率和算法学习效率. 相似文献

自适应图学习诱导的子空间聚类

下载免费PDF全文

朱丹陈晓红吴卿源李舜酩《计算机工程与应用》2020,56(21):30-37

子空间聚类是机器学习领域的热门研究课题。它根据数据的潜在子空间对数据进行聚类。受多视图学习中协同训练算法的启发,提出一个自适应图学习诱导的子空间聚类算法,该算法首先将单视图数据多视图化,再利用不同视图的信息迭代更新图正则化项,得到更能反映聚类性能的块对角关联矩阵,从而更准确地描述数据聚类结果。在四个标准数据集上与其他聚类算法进行对比实验,实验结果显示该方法具有更好的聚类性能。相似文献