首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
冯天艺  杨震 《信号处理》2019,35(7):1133-1140
随着机器学习的快速发展,许多研究者使用神经网络来解决语音识别领域中的各类问题。然而由于训练数据有限等原因,常规的神经网络分类器普遍存在泛化误差等问题。为了解决此问题,迁移学习中的多任务学习被引入到研究中。本文提出了一种采用多任务学习和循环神经网络的语音情感识别算法(MTL-RNN),将说话人情感识别作为主任务,性别识别和身份识别作为辅助任务,三个任务在神经网络中并行训练。算法模型通过RNN共享层共享网络参数、学习共享特征,通过属性依赖层学习独有特征,以提升模型的分类性能。实验结果表明,本文所提出的MTL-RNN算法在汉语和阿拉伯语、较少说话人和较多说话人的场景下均有较好的识别性能。   相似文献   

2.
飞机目标识别是地面情报系统的一项重要关键技术。近年来火热的深度学习方法,如卷积神经网络,展现出对于图像识别任务的优越性能。但是,训练卷积神经网络需要大量的带标签样本以估计规模庞大的模型参数,因而限制了其在雷达目标识别领域中的应用。针对飞机目标识别中的小样本问题,文中引入适用于有限数据场景的迁移学习技术,预先在其他大样本高分辨距离像数据上训练一个初始卷积神经网络模型,再结合当前飞机目标识别任务调优模型参数。在实测数据上的实验结果显示,与仅使用卷积神经网络的方法相比,所提方法可显著提升识别准确率,验证了方法的有效性。  相似文献   

3.
当前通用领域命名实体识别模型可移植性差,在军事科技领域不具备普遍性和适应性,实际效果不佳。针对军事科技领域的独特性、标注语料规模小、实体识别任务多样等特点,将迁移学习的方法应用于军事科技领域命名实体识别,并进行了领域适配与任务适配。通过预训练掩码语言模型的方法对BERT预训练模型进行了领域适配,通过对抗迁移学习的方法对BiLSTM-CRF模型行了任务适配。模型中加入了虚拟对抗训练,通过训练减少虚拟对抗损失以提高模型的鲁棒性。在军事科技领域文本上验证了该方法,实验结果表明,领域适配与任务适配对提高识别效果都有显著的积极作用。  相似文献   

4.
用卷积网络进行人体行为识别是毫米波雷达的一个热门研究方向。由于卷积网络结构的缺陷性,而且目前用于人体行为识别公开的雷达领域数据样本量过少,传统深度学习算法对雷达微多普勒图像的识别率不高,且在训练过程中容易出现过拟合的现象。针对上述问题,本文提出一种融合快照集成与迁移学习的雷达人体行为识别算法。首先,针对深度卷积网络无法提取图像全局特征的问题,该算法通过搭建Vision Transformer(VIT)模型引入注意力机制。其次,通过VIT模型在公开自然数据集上进行任务迁移和特征空间的迁移,解决微多普勒图像的识别过拟合的问题。最后,利用基于快照集成的投票机制算法,提升模型对复杂雷达微多普勒图像的识别能力。试验结果表明,在目标任务数据集样本量少、背景复杂的情况下,该算法能在不增加训练成本的前提下提升微多普勒图像的识别准确率,在VIT模型下该算法识别准确率达到了89.25%,优于经典卷积神经网络。  相似文献   

5.
迁移学习技术可以利用经验信息辅助当前任务,已在计算机视觉和语音识别领域得到广泛应用,但在电磁领域还没有取得明显的成就.电磁环境变化速度快,源数据或分类器模型在新环境中性能会显著下降,重新训练不仅需要大量的数据且费时费力.迁移学习技术与电磁目标识别任务十分相关,本文采用实测电磁目标数据集,探索迁移学习在解决电磁目标小样本...  相似文献   

6.
半监督学习是一种结合监督学习与无监督学习的学习方法,通过利用未标记数据,提高标记数据所建立模型的效果,目的是减少传统的机器学习任务中对大量标注数据的需求、降低人工成本.在中文电子病历实体识别领域,由于缺少足够的标注数据,且医学文本专业性较强、人工标注成本高,可以利用半监督学习方法,提升少量标注数据的训练效果.本文介绍了中文电子病历实体识别的研究背景和半监督学习的相关研究,并应用改进后的Tri-Training算法,提升中文电子病历实体识别模型的效果.  相似文献   

7.
情感分析是文本分类的研究方向,深度迁移学习通过学习目标领域数据和已有领域数据之间的相关度,提高当目标数据不足时文本分类的精度。从基于网络迁移的角度设计算法,首先使用Word2vec+词性特征词向量表示,然后进行卷积神经网络文本分类,再将训练好的模型共享网络参数,迁移至跨域商品评论数据,训练、分类评论数据。实验证明,在小样本数据集中算法精度有明显提升。  相似文献   

8.
余立  李哲  高飞  袁向阳  杨永 《电信科学》2021,37(10):136-142
质差用户识别是降低用户投诉率、提升用户满意度的重要环节。针对当前电信网络系统中业务感知相关的大量结构化及非结构化数据难以有效标注、质差用户标签不完备、现有监督学习模型训练样本不均衡而导致质差识别率低的问题,采用改进自训练半监督学习模型,利用少量满意度低分和投诉用户作为质差用户标签对网络数据进行标注,并通过标签迁移对大量未标注数据进行训练识别质差用户。实验表明,相比于识别准确率高但是训练成本高的全监督学习和识别准确率低的无监督学习,半监督学习可以充分利用无标签样本数据进行有效训练,保证较低训练成本的同时显著提升质差用户识别准确率。  相似文献   

9.
孙佳慧  韩萍  程争 《信号处理》2021,37(8):1384-1391
方面级情感分析是针对一个评论中涉及多种方面类别时的情感分析,现有方法通常利用方面级数据集在神经网络模型上直接进行训练,但已标注的方面级训练数据规模较小,造成模型不能充分学习而性能受限。为解决上述问题,本文利用迁移学习的思想,将数据量较大的文档级数据进行情感分析模型的预训练,进而获得丰富的文本语义、句法信息和情感特征,然后通过本文设计的目标函数及注意力融合方法,将文档级情感分析模型中的注意力权重融合到方面级情感分析模型中,从而使方面级文本情感分析性能提升。将该模型在SemEval2014数据集上进行实验,实验结果中的准确率和F1值均高于对比模型,证明了本文模型的有效性。   相似文献   

10.
多变量时间序列异常检测是指从相互关联的多个单变量时间序列中识别不正常的事件或行为的过程。现有的多变量时间序列异常检测方法在应用到新领域时,由于样本分布差异导致检测性能下降。而重新训练模型需要大量新领域的标注数据,且不能有效利用源领域的领域知识。针对这一问题,提出了一种基于深度迁移学习的多变量时间序列异常检测框架,该框架设计了编码器-解码器结构来提取多变量时间序列的特征,同时通过最小化嵌入层向量的距离来减小领域分布差异。基于该框架,提出一种基于ConvLSTM和最大均值差异(MMD)的多变量时间序列异常检测迁移学习方法,并利用解码后的重构误差检测多变量时间序列中的异常。最后,在服务器和空气质量两个多变量时间序列数据集上进行了实验。实验结果显示,目标域训练样本较少时,所提方法在迁移后的检测F1值比迁移前分别提升1.8%和4.2%。对比直接在目标域少量样本上训练模型,F1值提升了约9%。实验表明,所提迁移学习框架和方法对于有效提升多变量时间序列异常检测的性能。  相似文献   

11.
Human activity recognition (HAR) for dense prediction is proven to be of good performance, but it relies on labeling every point in time series with the high cost. In addition, the performance of HAR model will show significant degradation when tested on the sensor data with different distribution from the training data, where the training data and the test data are usually collected from different sensor locations or sensor users. Therefore, the adaptive transfer learning framework for dense prediction of HAR is introduced to implement cross-domain transfer, where the proposed multi-level unsupervised domain adaptation (MLUDA) approach combines the global domain adaptation and the specific task adaptation to adapt the source and target domain in multiple levels. The multi-connected global domain adaptation architecture is proposed for the first time, which can adapt the output layer of the encoder and the decoder in dense prediction model. After this, the specific task adaptation is proposed to ensure alignment of each class centroid in source domain and target domain by introducing the cosine distance loss and the moving average method. Experiments on three public human activity recognition datasets demonstrate that the proposed MLUDA improves the prediction accuracy of target data by 20% compared to the source domain pre-trained model and it is more effective than the other three deep transfer learning methods with an improvement of 10% to 18% in accuracy.  相似文献   

12.
针对实际情况下训练和测试数据来自不同领域数据库导致识别性能下降的问题,提出了一种基于迁移判别回归的跨域语音情感识别方法。首先,引入最大均值差异和图拉普拉斯项作为域间联合距离度量,在减小概率分布差异的同时,很好地保留数据的局部几何结构,从而学习到一个可迁移的公共特征表示。其次,本文采用一种能量保持策略,以避免迁移过程中目标域信息的丢失。此外,通过引入判别回归项,利用已标记的源域样本在公共子空间中训练一个可迁移的判别回归模型。最后,为了使学习到的模型具有特征选择能力和鲁棒性,分别对投影矩阵和回归项施加L2,1范数约束。在3个公开数据集上的实验结果表明,本文提出的算法相较于其他几种迁移学习方法具有更好的识别性能。  相似文献   

13.
In this paper, deep learning technology was utilited to solve the railway track recognition in intrusion detectionproblem. The railway track recognition can be viewed as semantic segmentation task which extends imageprocessing to pixel level prediction. An encoder-decoder architecture DeepLabv3 + model was applied in this workdue to its good performance in semantic segmentation task. Since images of the railway track collected from thevideo surveillance of the train cab were used as experiment dataset in this work, the following improvements weremade to the model. The first aspect deals with over-fitting problem due to the limited amount of training data. Dataaugmentation and transfer learning are applied consequently to rich the diversity of data and enhance modelrobustness during the training process. Besides, different gradient descent methods are compared to obtain theoptimal optimizer for training model parameters. The third problem relates to data sample imbalance, cross entropy(CE) loss is replaced by focal loss (FL) to address the issue of serious imbalance between positive and negativesample. Effectiveness of the improved DeepLabv3 + model with above solutions is demonstrated by experimentresults with different system parameters.  相似文献   

14.
陈静  梁俊毅 《移动信息》2023,45(8):204-206
文中探讨了如何利用深度学习技术解决在线教育中的学生情绪识别问题,首先介绍了卷积神经网络的结构和训练过程,然后介绍了AffectNet数据集的特点,接着详细描述了CNN在人脸识别和情绪识别中的应用,以及模型训练和评估方法。实验结果表明,在使用AffectNet数据集进行情绪识别的实验中,CNN模型可以实现较高的准确率、精确率、召回率和F1分数,达到了预期的效果,有望应用于智能教育领域,以提高课堂教学效果。  相似文献   

15.
深度学习在人工智能领域已经取得了非常优秀的成就,在有监督识别任务中,使用深度学习算法训练海量的带标签数据,可以达到前所未有的识别精确度。但是,由于对海量数据的标注工作成本昂贵,对罕见类别获取海量数据难度较大,所以如何识别在训练过程中少见或从未见过的未知类仍然是一个严峻的问题。针对这个问题,该文回顾近年来的零样本图像识别技术研究,从研究背景、模型分析、数据集介绍、实验分析等方面全面阐释零样本图像识别技术。此外,该文还分析了当前研究存在的技术难题,并针对主流问题提出一些解决方案以及对未来研究的展望,为零样本学习的初学者或研究者提供一些参考。  相似文献   

16.
One of the key problems in supervised learning is the insufficient size of the training set. The natural way for an intelligent learner to counter this problem and successfully generalize is to exploit prior information that may be available about the domain or that can be learned from prototypical examples. We discuss the notion of using prior knowledge by creating virtual examples and thereby expanding the effective training-set size. We show that in some contexts this idea is mathematically equivalent to incorporating the prior knowledge as a regularizer, suggesting that the strategy is well motivated. The process of creating virtual examples in real-world pattern recognition tasks is highly nontrivial. We provide demonstrative examples from object recognition and speech recognition to illustrate the idea  相似文献   

17.
为解决由于脑电信号(EEG)的非平稳性及个体差异性造成的情绪识别模型在不同时间、不同被试间泛化性能低的问题,提出全局域适应与相关子域自适应串联系统(SS_GDAN_RSAN)模型来实现跨被试的情感识别。将整个情感识别模型分为特征提取器、全局域分类器和子域域分类器。首先在浅层神经网络中由特征提取器和全局域分类器产生域不变表达,通过最小化源域数据分类损失及源域与目标域数据的分布差异损失进行全局域自适应;其次在深层神经网络中,基于局部最大平均差异度量源域和目标域中相关子域数据的分布差异,通过最小化源域数据分类损失和子域自适应损失训练子域域分类器,进而捕获每个类别的细粒度信息实现子域自适应。实验结果表明SS_GDAN_RSAN算法简单有效,在多对一的跨被试迁移实验中识别率达到84.05%±5.91%,在单被试跨时间迁移实验中识别率达到91.66%±7.32%。与传统分类器模型相比,SS_GDAN_RSAN对跨被试、跨时间情绪分类任务泛化能力的提高取得显著效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号