首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 216 毫秒
1.
高赫然  吴恒  许源佳  李修和  王焘  张文博 《软件学报》2023,34(12):5862-5886
随着深度学习技术的快速发展和深入应用,深度学习训练规模持续增大,内存不足已成为影响深度学习可用性的主要瓶颈之一.内存交换机制是应对深度学习训练内存问题的关键技术,该机制利用深度学习训练内存需求的“时变”特征,在专用计算加速设备内存与外部存储之间按需移动数据,通过瞬时内存需求替代累积内存需求,保障深度学习训练任务的运行.对面向深度学习训练的内存交换机制进行综述,以深度学习训练内存需求的时变特征为研究视角,分别针对基于算子运行特征的内存换出机制、基于数据依赖关系的内存换入机制以及效能驱动的联合换出与换入决策等重要研究工作进行了总结分析,并针对该技术领域的发展方向进行了展望.  相似文献   

2.
基于模型的强化学习方法利用已收集的样本对环境进行建模并使用构建的环境模型生成虚拟样本以辅助训练,因而有望提高样本效率.但由于训练样本不足等问题,构建的环境模型往往是不精确的,其生成的样本也会因携带的预测误差而对训练过程产生干扰.针对这一问题,提出了一种可学习的样本加权机制,通过对生成样本重加权以减少它们对训练过程的负面影响.该影响的量化方法为,先使用待评估样本更新价值和策略网络,再在真实样本上计算更新前后的损失值,使用损失值的变化量来衡量待评估样本对训练过程的影响.实验结果表明,按照该加权机制设计的强化学习算法在多个任务上均优于现有的基于模型和无模型的算法.  相似文献   

3.
为了提高文本分类的准确性和运行效率,提出一种Word2Vec文本表征和改进注意力机制AlexNet-2的文本分类方法.首先,利用Word2Vec对文本词特征进行嵌入表示,并训练词向量,将文本表示成分布式向量的形式;然后,利用改进的AlexNet-2对长距离词相依性进行有效编码,同时对模型添加注意力机制,以高效学习目标词...  相似文献   

4.
针对短文本信息量少导致隐藏的信息难以充分挖掘和深度学习模型易受干扰导致分类准确度下降的问题,提出一种融合对抗训练自注意力多层双向长短期记忆网络(Con-Att-BiLSTMs)短文本分类模型.将文本训练集按不同比例进行分类对抗训练,通过对抗训练提升模型的健壮性;利用多层双向长短期记忆网络对语义进行提取,利用自注意力机制...  相似文献   

5.
针对两轮自平衡机器人的运动平衡控制问题,采用了基于Skinner操作条件反射理论的自回归神经网络学习算法作为机器人的学习机制,利用自回归神经网络对评价函数进行逼近,以实现对行为决策的优化,从而使机器人能够在无需外部环境模型的情况下,通过学习和训练,获得像人或动物一样的自主学习技能,解决了两轮机器人的运动平衡控制问题.最后分别在无扰动和有扰动的两种状态下设计了仿真实验并进行了比较.结果表明,该操作条件反射学习机制具有较快的自主平衡控制技能和较好的鲁棒性能,体现了较高的理论研究意义和工程应用价值.  相似文献   

6.
深度强化学习是目前机器学习领域发展最快的技术之一.传统的深度强化学习方法在处理高维度大状态的空间任务时,庞大的计算量导致其训练时间过长.虽然异步深度强化学习利用异步方法极大缩短了训练时间,但会忽略某些更具价值的图像区域和图像特征.针对上述问题,本文提出了一种基于双重注意力机制的异步优势行动者评论家算法.新算法利用特征注意力机制和视觉注意力机制来改进传统的异步深度强化学习模型.其中,特征注意力机制为卷积神经网络卷积后的所有特征图设置不同的权重,使得智能体聚焦于重要的图像特征;同时,视觉注意力机制为图像不同区域设置权重参数,权重高的区域表示该区域信息对智能体后续的策略学习有重要价值,帮助智能体更高效地学习到最优策略.新算法引入双重注意力机制,从表层和深层两个角度对图像进行编码表征,帮助智能体将聚焦点集中在重要的图像区域和图像特征上.最后,通过Atari 2600部分经典实验验证了基于双重注意力机制的异步优势行动者评论家算法的有效性.  相似文献   

7.
针对深度强化学习算法中经验缓存机制构建问题,提出一种基于TD误差的重抽样优选缓存机制;针对该机制存在的训练集坍塌现象,提出基于排行的分层抽样算法进行改进,并结合该机制对已有的几种典型基于DQN的深度强化学习算法进行改进.通过对Open AI Gym平台上Cart Port学习控制问题的仿真实验对比分析表明,优选机制能够提升训练样本的质量,实现对值函数的有效逼近,具有良好的学习效率和泛化性能,收敛速度和训练性能均有明显提升.  相似文献   

8.
针对多智能体深度确定性策略梯度算法(MADDPG)学习训练效率低、收敛速度慢的问题,研究MADDPG算法经验优先抽取机制,提出PES-MADDPG算法.首先,分析MADDPG算法的模型和训练方法;然后,改进多智能体经验缓存池,以策略评估函数误差和经验抽取训练频率为依据,设计优先级评估函数,以优先级作为抽取概率获取学习样本训练神经网络;最后,在合作导航和竞争对抗2类环境中进行6组对比实验,实验结果表明,经验优先抽取机制可提高MADDPG算法的训练速度,学习后的智能体具有更好的表现,同时对深度确定性策略梯度算法(DDPG)控制的多智能体训练具有一定的适用性.  相似文献   

9.
为了解决未知类别物体的抓取问题,提出了一种结合增量学习的物体抓取检测框架,该框架分为抓取学习和增量学习两个阶段.在第1阶段,对已知的物体使用密集注意力网络进行训练,该网络利用注意力机制对特征通道和密集残差连接之间的关系进行建模.在第2阶段,引入了聚类优先样本选择策略,该策略会挑选出那些与其聚类质心距离相近的样本,用这些新样本替换掉示例集中的部分旧样本进行训练.此外在未知类别物体上训练网络时,还引入了蒸馏损失,以保留之前在已知类中学到的知识.通过在Jacquard数据集和UR10e机器人上进行的实验,表明了该方法在抓取未知类别物体方面有一定的可行性和有效性,克服了机器人在抓取未知类别物体上的缺陷.  相似文献   

10.
类别不平衡的分类方法及在生物信息学中的应用   总被引:4,自引:0,他引:4  
提出一种处理正反例不平衡的分类方法,以解决生物信息学中的snoRNA识别、microRNA前体判别、SNP位点的真伪识别等问题. 利用集成学习的思想,将反例集均匀分割并依次与正例集组合,得到一组类别平衡的训练集.然后对每个训练集采用不同原理的分类器进行训练,最后投票表决待测样本.为了避免弱分类器影响投票效果,结合AdaBoost思想,将每个分类器训练中产生的错误样本加入到下2个分类器的训练集中,既避免了AdaBoost的反复训练,又有效地利用投票机制遏制了弱分类器的影响.5组UCI测试数据和3组生物信息学实验证明了它在处理类别不平衡分类问题时的优越性.  相似文献   

11.
目前肺炎类型判别主要依靠医生的经验,但一些肺炎的CT影像极为近似,即使有经验的医生,也容易判别错误,造成误诊。为此提出卷积神经网络分类算法,该算法由3个卷积层、3个亚采样层及1个完全连接层组成,并且对卷积层进行了特殊结构处理,由反向传播算法调整网络参数,并对反向传播过程提出了改进。临床实验证明,该方案较现在普遍研究的分类算法,如adaboost算法和svm算法具有更高的识别率和准确度,并且改进的卷积神经网络防止了训练数据时过拟合现象的产生。  相似文献   

12.
为降低云雾等类烟雾目标引起的烟雾检测虚警现象,提出一种多网络模型融合的烟雾检测方法。在采用VGG16网络提取烟雾细节特征的基础上,与ResNet50网络特征提取层进行融合,提取到更多细微特征,采用跳跃连接机制将图像信息传递到神经网络的更深层,避免烟雾图像重要特征的丢失,并解决因梯度消失导致的欠拟合问题。训练过程采用基于同构空间下的特征迁移学习方法,解决小样本训练难题,在新的目标检测领域进行重新训练,更有利于将网络模型融合,重新搭建全连接层输出检测结构,采用随机失活的方法,提高模型泛化能力。实验结果表明,与目前流行的深度卷积网络相比,该方法虚警率低,准确率和召回率高。  相似文献   

13.
基于粗糙集遗传神经网络的柴油机故障诊断   总被引:1,自引:0,他引:1  
提出一种基于粗糙集和遗传算法的BP神经网络故障诊断方法,解决基本BP网络收敛速度慢、精度低、易陷入局部极小值问题.运用粗糙集理论对训练样本进行属性约简,简化BP网络输入维数.设计2次遗传算法训练BP网络,第一次优化神经网络隐含层节点个数,第二次在神经网络结构确定的情况下,优化网络连接权值.以柴油机进、排气阀故障为例,应用提出的方法进行仿真,仿真结果证明了该方法能够优化神经网络结构,提高故障诊断速度和准确率.  相似文献   

14.
Fault diagnosis of analog circuits is a key problem in the theory of circuit networks and has been investigated by many researchers in recent decades. In this paper, an active filter circuit is used as the circuit under test (CUT) and is simulated in both fault-free and faulty conditions. A modular neural network model is proposed in this paper for soft fault diagnosis of the CUT. To optimize the structure of neural network modules in the proposed scheme, particle swarm optimization (PSO) algorithm is used to determine the number of hidden layer nodes of neural network modules. In addition, the output weight optimization–hidden weight optimization (OWO-HWO) training algorithm is employed, instead of conventional output weight optimization–backpropagation (OWO-BP) algorithm, to improve convergence speed in training of the neural network modules in proposed modular model. The performance of the proposed method is compared to that of monolithic multilayer perceptrons (MLPs) trained by OWO-BP and OWO-HWO algorithms, K-nearest neighbor (KNN) classifier and a related system with the same CUT. Experimental results show that the PSO-optimized modular neural network model which is trained by the OWO-HWO algorithm offers higher correct fault location rate in analog circuit fault diagnosis application as compared to the classic and monolithic investigated neural models.  相似文献   

15.
屈毅  宁铎  黄建兵  强金铖 《计算机测量与控制》2009,17(12):2417-2419,2422
提出了采用赋初值BP神经网络的方法,进行模拟电路故障的诊断;该方法分两步实现:首先对网络输入层到末级隐层之间权值的设计,能简化网络结构,缩短训练时间;其次对BP网络输出层权值和阈值的设计,以加快收敛速度、抑制局部极小、减少了学习过程的振荡现象;文中通过心电信号放大器电路实例,对其诊断方法的原理与实现进行了较深入的研究,并通过计算机仿真,模拟诊断该电路,结果证明:该方法具有鲁棒性、准确性与快速性。  相似文献   

16.
为了能够更加高效地检测和诊断模拟电路中的故障元件,提出了自适应狼群算法优化极限学习机的方法。该方法采用自适应遗传算法对特征参数进行选择,从而生成最优特征子集,然后利用最优特征子集构造样本输入极限学习机ELM网络对故障进行分类。针对极限学习机的输入层和隐含层之间的连接权值、隐含层的偏差都将会使其学习速度和分类正确率受到影响的问题,采用本文方法对它们进行优化并选择相应的最优值,提高了极限学习机网络训练的稳定性与故障诊断的成功率。通过2个典型模拟电路的诊断实例,给出了这些方法的具体实现过程,故障诊断率均在99%以上。仿真结果表明使用该方法进行模拟电路故障诊断时具有良好的正确率和稳定性。  相似文献   

17.
基于BiGRU-attention神经网络的文本情感分类模型   总被引:1,自引:0,他引:1  
针对双向长短时记忆神经(BiLSTM)模型训练时间长、不能充分学习文本上下文信息的问题,提出一种基于BiGRU-attention的文本情感分类模型。首先,利用双向门控循环(BiGRU)神经网络层对文本深层次的信息进行特征提取;其次,利用注意力机制(attention)层对提取的文本深层次信息分配相应的权重;最后,将不同权重的文本特征信息放入softmax函数层进行文本情感极性分类。实验结果表明,所提的神经网络模型在IMDB数据集上的准确率是90.54%,损失率是0.2430,时间代价是1100 s,验证了 BiGRU-attention模型的有效性。  相似文献   

18.
针对普通神经卷积网络对番茄叶病的识别精准度, 先提出一种新型的多尺度融合注意力机制的网络(MIPSANet), 在该网络中采用轻量级网络作为主要框架, 减少了网络的参数, 为了增加网络的深度和宽度, 加入了Inception结构, 用于提取数据的多尺度特征信息, 同时, 在这个过程中使用更加精细的双重注意力机制, 极化自注意力(polarized self-attention, PSA), 作为一个即插即用的模块, 将其嵌入整个模型中, 提高了重要特征点的表达能力, 同时PSA模块的轻量化也符合本模型的使用. 在卷积后加入全连接层, 进行分类. 使用提出的网络在Kaggle公开数据集tomato leaves dataset 上进行实验, 对其进行30批次的训练, 取得了91.05%的准确率, 与其他方法进行对照, 取得良好的效果. 试验结果表明该网络对番茄叶病的分类有很好的效果, 为分类网络的网络结构和参数配置方面提供一些参考价值.  相似文献   

19.
现有算法对交通标志进行识别时,存在训练时间短但识别率低,或识别率高但训练时间长的问题。为此,综合批量归一化(BN)方法、逐层贪婪预训练(GLP)方法,以及把分类器换成支持向量机(SVM)这三种方法对卷积神经网络(CNN)结构进行优化,提出基于优化CNN结构的交通标志识别算法。其中:BN方法可以用来改变中间层的数据分布情况,把卷积层输出数据归一化为均值为0、方差为1,从而提高训练收敛速度,减少训练时间;GLP方法则是先训练第一层卷积网络,训练完把参数保留,继续训练第二层,保留参数,直到把所有卷积层训练完毕,这样可以有效提高卷积网络识别率;SVM分类器只专注于那些分类错误的样本,对已经分类正确的样本不再处理,从而提高了训练速度。使用德国交通标志识别数据库进行训练和识别,新算法的训练时间相对于传统CNN训练时间减少了20.67%,其识别率达到了98.24%。所提算法通过对传统CNN结构进行优化,极大地缩短了训练时间,并具有较高的识别率。  相似文献   

20.
目的 肝纤维化是众多慢性肝脏疾病的常见表现,如不及时治疗可发展为肝硬化甚至引发肝癌。肝纤维化的准确评估对临床治疗和预后评估等至关重要。目前,肝纤维化的诊断通过肝穿活检判断,有创且有并发症危险。为此,基于影像学的无创诊断方法越来越受到关注。本文提出一种基于通道注意力与空间注意力机制改进的用于肝纤维化区域的自动化分割U-Net (liver fibrosis region segmentation network based on spatial and channel attention mechanisms,LFSCA-UNet)。方法 依据Attention U-Net的改进方式,围绕U-Net的跳跃连接结构进行基于注意力的改进,在AG (attention gate)的基础上,加入以ECA (efficient channel attention)模块为实现方式的通道注意力机制,依据加入ECA的位置,LFSCA-UNet分为A、B、C共3个子型。结果 在肝数据集上与其他实验网络进行评估对比,本文提出的LFSCA-UNet网络结构平均Dice系数达到了93.33%,相比原始U-Net的Dice系数提高了0.539 6%。结论 本文方法将空间注意力机制与通道注意力机制进行结合,有效提高了肝纤维化区域的分割精度,对空间注意力模块使用通道注意力模块优化输入和输出,增加了网络的稳定性,提升了网络的整体效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号