期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《电子技术应用》2022,48(8)

相似文献

2.

刘露申国伟郭春崔允贺蒋朝惠伍大勇《计算机与现代化》2021,(10):49-56

Spark Streaming作为主流的开源分布式流分析框架,性能优化是目前的研究热点之一。在Spark Streaming性能优化中,业务场景下的配置参数优化是其性能提升的重要因素。在Spark Streaming系统中,可配置的参数有200多个,对参数调优人员的经验要求较高,未经优化的参数配置会影响流作业执行性能。因此,针对Spark Streaming的参数配置优化问题,提出一种基于深度强化学习的Spark Streaming参数优化方法（DQN-SSPO）,将Spark Streaming参数优化配置问题转化为深度强化学习模型训练中的最大回报获得问题,并提出权重状态空间转移方法来增加模型训练获得高反馈奖励的概率。在3种典型的流分析任务上进行实验,结果表明经参数优化后Spark Streaming上的流作业性能在总调度时间上平均缩减27.93%,在总处理时间上平均缩减42%。相似文献

3.

基于粒子群优化和深度强化学习的策略搜索方法

彭坤彦尹翔刘笑竹李恒宇《计算机工程与科学》2023,(4):718-725

深度强化学习DRL算法是一种常用的策略搜索方法,已成功应用于一系列具有挑战性的控制任务。但是,由于DRL难以应对奖励稀疏问题,缺乏有效的探索以及对超参数具有极其敏感的脆弱收敛性,使其难以应用于大规模实际问题。粒子群优化算法PSO是一种进化优化算法,它使用整个episode的累积回报作为适应性值,对奖励稀疏的环境不敏感,且该算法也具有基于种群的多样化探索以及稳定的收敛性,但样本效率低。因此,提出了PSO-RL算法,结合PSO和基于策略梯度的离策略DRL算法,DRL通过PSO种群提供的多种数据来训练种群中累积奖励最低的几个策略,并且每次都将训练后累积奖励得到提升的策略插入PSO种群,增强DRL与PSO之间的信息交流。PSO-RL算法能够提升PSO的样本效率,而且能够改善DRL算法的性能和稳定性。在pybullet模块具有挑战性的连续控制任务中的实验结果表明,PSO-RL的性能不仅优于DRL的,且优于进化强化学习算法的。相似文献

4.

一种深度强化学习的C-RAN动态资源分配方法

张永棠《小型微型计算机系统》2021,(1):132-136

移动边缘计算(MEC)技术已成为云无线接入网(C-RAN)提供近距离服务的一个很有前途的例子,从而减少了服务延迟,节约了能源消耗.本文考虑一个多用户MEC系统,解决了计算卸载策略和资源分配策略问题.我们将延迟总成本和能耗作为优化目标,在一个动态的环境中获得一个最优的策略.提出了一个基于深度强化学习的优化框架来解决资源分配问题,利用深度神经网络(DNN)对批评者的价值函数进行估计,从当前状态直接提取信息,不需要获取准确的信道状态.从而降低了优化目标的状态空间复杂度.参与者使用另一个DNN来表示参数随机策略,并在批评者的帮助下改进策略.仿真结果表明,与其它方案相比,该方案显著降低了总功耗. 相似文献

5.

基于深度强化学习的SWIPT边缘网络联合优化方法

王哲王启名李陶深葛丽娜《计算机应用》2023,43(11):3540-3550

边缘计算(EC)与无线携能通信(SWIPT)技术能够提升传统网络性能,但同时也增加了系统决策制定的难度和复杂度.而基于最优化方法所设计的系统决策往往具有较高的计算复杂度,无法满足系统的实时性需求.为此,针对EC与SWIPT辅助的无线传感网络(WSN),联合考虑网络中波束成形、计算卸载与功率控制问题,建立了系统能效最优化数学模型;其次,针对该模型的非凸与参数耦合特征,通过设计系统的信息交换过程,提出基于深度强化学习的联合优化方法,该方法无须建立环境模型,采用奖励函数代替Critic网络对动作进行评估,能降低决策制定难度并提升实时性;最后,基于该方法设计了改进的深度确定性策略梯度(IDDPG)算法,并与多种最优化算法和机器学习算法进行仿真对比,验证了联合优化方法在降低计算复杂度、提升决策实时性方面的优势. 相似文献

6.

基于深度强化学习的移动边缘计算资源分配策略

冯北鹏黄昱泽曹宇慧郭珍珍《信息与电脑》2023,(1):44-46+50

边缘计算作为云计算技术的延伸,可通过增强边缘网络计算能力为用户提供低时延高质量服务。边缘计算中,需要将服务部署于资源受限的边缘服务器,并根据需求合理分配计算资源,以提高边缘服务器的资源利用率。因此,提出基于深度强化学习的服务资源分配方法,利用反正切函数两次映射建立计算资源分配函数,并基于真实数据集进行仿真实验。实验结果表明,该方法能够在保证低时延的情况下,合理分配计算资源。相似文献

7.

基于双深度网络的安全深度强化学习方法

朱斐吴文伏玉琛刘全《计算机学报》2019,42(8)

相似文献

8.

基于深度强化学习的组合优化研究进展

下载免费PDF全文

李凯文张涛王锐覃伟健贺惠晖黄鸿《自动化学报》2021,47(11):2521-2537

组合优化问题广泛存在于国防、交通、工业、生活等各个领域, 几十年来, 传统运筹优化方法是解决组合优化问题的主要手段, 但随着实际应用中问题规模的不断扩大、求解实时性的要求越来越高, 传统运筹优化算法面临着很大的计算压力, 很难实现组合优化问题的在线求解. 近年来随着深度学习技术的迅猛发展, 深度强化学习在围棋、机器人等领域的瞩目成果显示了其强大的学习能力与序贯决策能力. 鉴于此, 近年来涌现出了多个利用深度强化学习方法解决组合优化问题的新方法, 具有求解速度快、模型泛化能力强的优势, 为组合优化问题的求解提供了一种全新的思路. 因此本文总结回顾近些年利用深度强化学习方法解决组合优化问题的相关理论方法与应用研究, 对其基本原理、相关方法、应用研究进行总结和综述, 并指出未来该方向亟待解决的若干问题. 相似文献

9.

一种基于梯度的多智能体元深度强化学习算法

赵春宇赖俊陈希亮张人文《计算机应用研究》2024,41(5)

多智能体系统在自动驾驶、智能物流、医疗协同等多个领域中广泛应用,然而由于技术进步和系统需求的增加,这些系统面临着规模庞大、复杂度高等挑战,常出现训练效率低和适应能力差等问题。为了解决这些问题,将基于梯度的元学习方法扩展到多智能体深度强化学习中,提出一种名为多智能体一阶元近端策略优化（MAMPPO）方法,用于学习多智能体系统的初始模型参数,从而为提高多智能体深度强化学习的性能提供新的视角。该方法充分利用多智能体强化学习过程中的经验数据,通过反复适应找到在梯度下降方向上最敏感的参数并学习初始参数,使模型训练从最佳起点开始,有效提高了联合策略的决策效率,显著加快了策略变化的速度,面对新情况的适应速度显著加快。在星际争霸II上的实验结果表明,MAMPPO方法显著提高了训练速度和适应能力,为后续提高多智能强化学习的训练效率和适应能力提供了一种新的解决方法。相似文献

10.

联合随机性策略的深度强化学习探索方法

杨尚彤王子磊《信息技术与网络安全》2021,(6):43-49

目前深度强化学习算法已经可以解决许多复杂的任务,然而如何平衡探索和利用的关系仍然是强化学习领域的一个基本的难题,为此提出一种联合随机性策略的深度强化学习探索方法.该方法利用随机性策略具有探索能力的特点,用随机性策略生成的经验样本训练确定性策略,鼓励确定性策略在保持自身优势的前提下学会探索.通过结合确定性策略算法DDPG... 相似文献

11.

结合深度学习的短时车流量预测优化方法

下载免费PDF全文

王钰郭兰英程鑫《计算机工程与应用》2020,56(16):211-217

随着交通流检测技术的发展,海量的交通流信息可以更容易高效地获取,针对短时车流量预测的准确性要求,提出了一种结合深度学习的短时车流量预测优化方法,采用神经网络Long Short-Term Memory算法,用多因素分析的思想对数据进行处理。通过对短时交通流数据进行多因素分析,如天气因素、节假日等,将短时交通流数据划分为多种数据集,将划分的不同数据集作为训练集去预测与训练集因素相同的未来时刻车流量情况。通过这种方法,使得获取的数据更为纯净,有效解决了多种因素对车流量预测影响问题。结果表明,该优化方法克服了车流量数据集影响因素不单一的缺点,能够更为准确地反映道路交通流的变化特征。相似文献

12.

基于深度强化学习的自动驾驶策略学习方法

夏伟李慧云《集成技术》2017,6(3):29-40

自动驾驶是人工智能研究的重要应用领域,文章提出了一种基于深度强化学习的自动驾驶策略模型学习方法.首先采用在线交互式学习方法对深度网络模型进行训练,并基于专业司机的经验数据对模型进行预训练,进而结合经验池回放技术提高模型训练收敛速度,通过对状态空间进行聚类再采样,提高其独立同分布特性以及策略模型的泛化能力.通过与神经网络拟和Q-迭代算法的比较,所提方法的训练时间可缩短90％以上,稳定性能提高超过30％.以复杂度略高于训练集的测试道路长度为基准,与经验过滤的Q-学习算法相比,采用聚类再采样的方法可以使策略模型的平均行驶距离提高70％以上. 相似文献

13.

基于动量项分离的深度学习优化算法

文晨锐杨歆豪张嘉慧张珂《计算机仿真》2022,39(2):337-342

针对神经网络处理参数更新的优化算法中出现的局部最优点振荡问题,改进带动量项的随机梯度下降算法,提出了一种动量项分离的优化算法。通过计算当前时刻目标函数的曲率半径,根据阈值适时分离动量项,从而缓解局部最优点振荡问题。实验表明,动量项分离的优化算法能够适用于不同的模型结构和不同数据集。相较于带动量项的随机梯度下降算法,具有更高的准确度,能够更快地稳定收敛。与同类一阶动量算法相比,其准确率上升明显,为深度神经网络的参数更新提供了一种新的有效的解决方案。相似文献

14.

基于深度学习的汉字生成方法

下载免费PDF全文

黄子君陈琪罗文兵《计算机工程与应用》2021,57(17):29-36

手写汉字生成是机器学习中一个重要的研究方向.近二十年来,针对手写汉字生成的研究大体可分为两个阶段:早期主要利用汉字的显式特征如结构和笔画等实现对汉字的分解,再通过算法实现汉字的生成.该类方法对汉字的分解准确度及数据集的精度要求较高,限制了该类方法的广泛应用.现阶段的汉字生成研究主要借助于深度神经网络来实现对汉字隐式特征的提取,从而生成更高质量的汉字并克服早期研究阶段数据集不足等问题.主要目的是对已有汉字生成研究进行全面系统的综述. 相似文献

15.

基于深度学习的汉字生成方法

下载免费PDF全文

黄子君陈琪罗文兵《计算机工程与应用》2021,57(17):29-36

手写汉字生成是机器学习中一个重要的研究方向.近二十年来,针对手写汉字生成的研究大体可分为两个阶段:早期主要利用汉字的显式特征如结构和笔画等实现对汉字的分解,再通过算法实现汉字的生成.该类方法对汉字的分解准确度及数据集的精度要求较高,限制了该类方法的广泛应用.现阶段的汉字生成研究主要借助于深度神经网络来实现对汉字隐式特征的提取,从而生成更高质量的汉字并克服早期研究阶段数据集不足等问题.主要目的是对已有汉字生成研究进行全面系统的综述. 相似文献

16.

基于Listwise的深度学习专家排序方法 总被引：1，自引：0，他引：1

《模式识别与人工智能》2015,(11)

相似文献

17.

一种基于深度学习的改进人脸识别算法

郑健王志明张宁《计算机与现代化》2018,(12):90

针对当前许多算法在非约束条件下特征判别能力不强、人脸识别性能不佳等问题,提出一种基于深度学习的改进人脸识别算法,通过训练多任务级联卷积神经网络,完成非约束图像的人脸检测和人脸归一化,提高训练图像的人脸信息,减少对模型的干扰。同时使用Softmax损失与中心损失联合监督训练模型,优化类内聚合、类间分散。实验结果表明,该算法提高了模型的特征判别能力,在LFW标准测试集上达到了较高的识别率。相似文献

18.

基于智能控制策略的加热炉燃烧优化模型

冯春吴敏曹卫华《计算机测量与控制》2007,15(12):1736-1738

加热炉燃烧系统的复杂性、参数不确定性和非线性,以及某钢铁公司加热炉燃烧控制过程存在的问题,在分别分析炉温变化、煤气热值与煤气流量关系,以及煤气流量、煤气热值、烟道含氧量与空燃比关系的基础上,本文提出了基于智能控制策略的加热炉燃烧优化模型;应用结果表明,该模型的应用实现了燃烧过程的优化控制,提高了产品的质量,节约能源,易于实现. 相似文献

19.

基于自适应模糊控制策略的加热炉燃烧优化模型 总被引：1，自引：0，他引：1

崔桂梅张鹏飞《计算机测量与控制》2012,20(10):2669-2672

针对加热炉燃烧系统的复杂性、参数不确定性和非线性,以及某钢铁公司加热炉燃烧控制过程存在的问题,本文在分别分析炉温变化、煤气热值与煤气流量关系,以及煤气流量、煤气热值、烟道含氧量与空燃比关系的基础上,建立了加热炉燃烧优化模型,提出了基于自适应模糊控制策略的的方法;仿真结果表明,该模型的应用实现了燃烧过程的优化控制,提高了对炉温控制的性能。相似文献

20.

基于深度学习的目标行为知识发现方法

成磊峰何丽莎薛丽惠刘欣《计算机与数字工程》2022,50(3):532-537

针对情报处理领域的知识动态更新问题,提出了一种基于深度学习的目标行为知识发现方法.首先,根据已有知识进行目标数据预处理,实现对目标要素补充;其次,基于已掌握行为意图的历史数据,构建目标行为特征模型;然后,基于深度学习方法实现行为规律分析,为目标识别提供知识支撑;最后,通过目标识别及识别结果的变化异常分析进行新知识发现,... 相似文献