首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
图像分类作为计算机视觉领域中的重要研究方向之一,应用领域非常广泛.基于深度学习的图像分类技术取得的成功,依赖大量的已标注数据,然而数据的标注成本往往是昂贵的.主动学习作为一种机器学习方法,旨在以尽可能少的高质量标注数据达到期望的模型性能,缓解监督学习任务中存在的标注成本高、标注信息难以大量获取的问题.主动学习图像分类算法根据样本选择策略,从未标记样本数据集合中选择出信息量丰富,对分类模型训练贡献更高的样本进行标注,以更新已标注训练数据池,如此循环直至满足给定的停止条件或模型标注预算耗尽.本文对近年来提出的主动学习图像分类算法进行了详细综述,并根据所用样本数据处理及模型优化方案,将现有算法分为三类:基于数据增强的算法,包括利用图像增广来扩充训练数据,或者根据图像特征插值后的差异性来选择高质量的训练数据;基于数据分布信息的算法,根据数据分布的特点来优化样本选择策略;优化模型预测的算法,包括优化获取和利用深度模型预测信息的方法、基于生成对抗网络和强化学习来优化预测模型的结构,以及基于Transformer结构提升模型预测性能,以确保模型预测结果的可靠性.此外,本文还对各类主动学习图像分类算法...  相似文献   

2.
情感识别是实现自然人机交互的必要过程。然而,情感数据高昂的采集和标注成本成为了限制情感识别研究发展的一大瓶颈。在无标注或有限标注的场景下,利用知识的跨领域或跨任务迁移提升情感识别效果的问题值得探索。本文对情感识别中的迁移学习问题进行了梳理和分析。首先,将迁移学习问题划分为针对领域差异和针对任务差异的两大部分,并进一步将每部分问题细分为多种不同的情况。随后,基于情感识别领域的研究现状,分别总结不同情况下的现有工作。在目标领域训练资源匮乏的情况下,可以利用其他带标注的数据集作为源领域训练模型,并对齐不同领域下的特征分布,或将特征映射到域间共享的空间。考虑到情感标签所提供的监督信息往往较为有限,为了进一步提升模型的识别效果,可以引入其他相关任务进行联合训练,或将预训练模型、外部知识库提供的先验语义知识迁移到情感识别任务中。最后,讨论了情感识别领域中未来需要得到更多关注和探索的迁移学习问题,旨在为研究者带来新的启发。  相似文献   

3.
基于主动学习和否定选择的垃圾邮件分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
胡小娟  刘磊  邱宁佳 《电子学报》2018,46(1):203-209
针对现在网络上泛滥的垃圾邮件问题,本文结合主动学习方法和否定选择算法提出了一种二类文本分类方法:主动否定学习算法.根据用户少量标注建立双向兴趣集,利用否定选择算法的自体异常检测机制改善主动学习中的采样策略,并将双向兴趣集作为检测器,新增样本集作为自体集,对两者进行异常匹配.本文算法与在线垃圾邮件快速识别方法、增强差异性的半监督协同分类算法、垃圾邮件过滤方法、基于人工高免疫的多层垃圾邮件过滤算法和在线主动多领域学习方法在六个常用邮件语料集上进行了分析比较,结果表明本文算法具有较高的准确率、召回率、分类精度,和较低的用户标注负担.使用用户个性喜好转换为双向兴趣特征的方式有助于提高算法的分类能力;利用异常检测匹配选取未知类别特征的方式,有效地降低了用户标注负担.  相似文献   

4.
针对深度学习模型在实际应用场景中预测性能下降的问题,提出了一种基于风格迁移的数据增强方法。首先,使用少量原始数据和少量实际应用场景下的未标注数据学习风格迁移模型。然后,对大量已标注的原始数据进行风格迁移,得到与实际数据风格相近的大量有标签数据。最后,基于此数据训练面向实际应用场景的深度学习模型。实验结果表明,所提出的方法能有效地提升模型在实际应用场景数据上的预测性能,且效果优于传统数据增强方法。  相似文献   

5.
本文研究天波雷达基于距离?多普勒(Range?Doppler, RD)图像的干扰检测问题。在干扰检测过程中,错误检测可能是干扰的漏检与虚警问题,为此考虑采用主动学习方法,将算法模型难以判决的样本由专家标注,并将标注样本加入至训练集中以达到提升检测性能的目的。同时,也需要解决训练集样本的冗余问题,为此使用原型数据学习方法,建立有干扰和无干扰样本数据云,有效地降低训练集样本量。实测数据实验表明,原型方法将初始训练集样本数量降低至23.5%,主动学习方法取得的检测准确率为97.42%,而传统监督学习最近邻方法准确率为87.96%。因此,本文方法能够有效提升天波雷达干扰检测能力,为天波雷达是否需要进行干扰处理与换频检测等工作提供可靠依据。  相似文献   

6.
基于单分类支持向量机和主动学习的网络异常检测研究   总被引:1,自引:0,他引:1  
刘敬  谷利泽  钮心忻  杨义先 《通信学报》2015,36(11):136-146
对基于支持向量机和主动学习的异常检测方法进行了研究,首先利用原始数据采用无监督方式建立单分类支持向量机模型,然后结合主动学习找出对提高异常检测性能最有价值的样本进行人工标记,利用标记数据和无标记数据以半监督方式对基于单分类支持向量机的异常检测模型进行扩展。实验结果表明,所提方法能够利用少量标记数据获取性能提升,并能够通过主动学习减小人工标记代价,更适用于实际网络环境。  相似文献   

7.
近年来,很多高质量的数据集支撑了深度学习在计算机视觉、语音和自然语言处理领域的快速发展.但在电磁信号识别领域仍缺乏高质量的数据集,为促进深度学习在电磁信号识别中的应用,本文基于广播式自动相关监视(ADS-B)建立了一个大规模的真实电磁信号数据集.首先设计了一个自动数据收集和标注系统,在开放和真实的场景中自动捕获ADS-...  相似文献   

8.
凌广明  徐爱萍  王伟 《电子学报》2000,48(11):2081-2091
文本序列的自动标注能够解决深度学习普遍面临的人工标注成本过高的问题.本文针对地址信息的实体表述特征,构建基于实体边界矩阵(Entity Boundary Matrix,EBM)的表示模型,在此基础上提出了一种基于深度学习和KNN标签修正算法(K-Nearest Neighbours Correction Algorithm,KNN-CA)的不需要任何人工标注训练集的自动标注算法.首先获取预置小区数据集并构建离线特征库和初始化在线特征库;接着通过匹配算法求解EBM并利用KNN-CA进行优化,再通过数据增广得到自动标注的训练集;然后训练BiLSTM-CRF深度学习模型并预测所有未曾标注的地址信息的序列标注;最后再次利用KNN-CA优化可求解EBM的序列标注,由此构建适用于中文地理命名实体(Chinese Geospatial Named Entities,CGSNE)识别及相关研究的序列标注语料库.实验表明,标注数据的F1值达到了95.35%.  相似文献   

9.
基于深度学习的目标跟踪技术的研究综述   总被引:1,自引:0,他引:1  
罗元  肖航  欧俊雄 《半导体光电》2020,41(6):757-767
深度学习技术在计算机视觉领域的应用日趋广泛,基于深度学习的目标跟踪技术是当前计算机视觉领域的一项重要研究课题。文章首先对国内外目标跟踪技术的发展历程进行了回顾和梳理,详细介绍并对比了部分典型的基于深度学习的目标跟踪方法;然后介绍了几种目标跟踪领域的典型数据集;最后对基于深度学习的目标跟踪技术的研究进行了总结,并对未来的发展方向进行了展望。  相似文献   

10.
针对委员会成员模型投票不一致性的度量问题,提出了一种基于最小差异采样的主动学习图像分类方法。该方法首先基于标注样本集的重采样结果构建决策委员会,然后利用投票概率较高的2个类别的概率值的差异来度量未标注样本集每个样本的投票不一致性,选择概率差异最小的样本交由人工专家标注,如此迭代更新分类器。将新方法与EQB算法及nEQB算法在多个数据集上进行实验对比,实验结果表明所提方法能够有效提高分类的准确率。还对组成决策委员会的成员模型的数目设置进行了分析和讨论,结果表明在相同的成员模型数目时所提方法比nEQB算法更为有效。  相似文献   

11.
李平  李雨航 《电讯技术》2024,(4):504-511
针对时空相似度算法关联轨迹的局限性,采用深度学习方法进行轨迹关联,并提出了一种基于无监督预训练的匹配神经网络训练方式。利用Geohash向量嵌入对轨迹信号做特征工程处理,构建自注意力机制神经网络结构,使用无标注轨迹数据基于遮蔽预测任务进行模型预训练;然后构建孪生匹配网络结构,加载预训练模型参数;最后使用标注轨迹对数据基于均方差损失函数微调预训练模型参数得到轨迹对匹配模型。采用Geolife GPS轨迹数据集作为评估数据集进行模型训练与测试,实验结果显示,利用无监督预训练的轨迹关联方法较现有最优算法匹配准确率提高了5个百分点,达到了96.3%,充分证明了该方法的有效性。目前轨迹关联领域基于深度学习预训练模型的研究较少,该方法具有重要的参考意义。  相似文献   

12.
多视角主动学习是一种相比于传统主动学习能够取得更大程度版本空间缩减的技术,已被应用于多种类型的大数据分析中.本文针对现有的多视角主动学习算法在分类假设生成和采样策略中存在的不足分别提出了相应的改进方案.本文将Boosting思想应用到多视角主动学习框架中,通过将历史上各次查询得到的分类假设进行加权式投票来实现每次查询后分类假设的强化;与此同时,还提出了一种自适应的分级竞争采样策略,当分类争议样本规模较大时通过无监督谱聚类获得上述样本的空间分布描述,并在各个聚类中结合样本的分类不确定度和冗余度信息通过二次规划求解以获得可靠的批处理采样.为了证明上述改进的有效性,本文将多视角主动学习应用到图像分类领域中,并通过基于不同图像特征的视角来分别生成相应的分类假设.实验表明,本文提出的两点改进策略不仅均有助于提升多视角主动学习的性能,而且基于上述不同视角随机组合的多视角主动学习方法相比于经典的单视角主动学习算法能够更快地实现收敛并达到较高的场景分类准确性.  相似文献   

13.
辐射源个体识别作为一种电子侦察技术,在战场敌我识别、目标态势感知、无线网络安全、频谱资源管理等军用和民用领域均具有重要应用价值。通过对国内外辐射源个体识别领域的研究进行系统性梳理,介绍了基于传统机器学习、深度学习、迁移学习等3类辐射源个体识别方法并分析了其优缺点。传统基于深度学习的辐射源个体识别方法假设训练数据与测试数据是同分布的,但在真实测试场景中,由于辐射源个体的中心频率、发送速率、接收距离以及接收机等都可能发生变化,导致训练数据与测试数据分布往往不同。迁移学习作为一种解决数据不同分布的技术逐渐成为辐射源个体识别领域的主流研究方向,重点介绍了基于迁移学习的辐射源个体识别方法,讨论了所提出方法未来的研究方向与面临的挑战,并给出相应的解决方案,同时对辐射源个体识别的未来研究方向进行了展望。  相似文献   

14.
对多功能相控阵雷达工作模式准确识别可为电子对抗决策提供依据,具有重要研究意义。现有工作模式识别方法主要基于已知标签的训练集,而实际中先验信息匮乏,数据标签难以获知,极大影响了工作模式识别性能。为此,提出了一种在少量先验信息辅助下基于半监督学习聚类实现未知数据标注的工作模式识别方法。首先根据聚类算法的内部评价指标和外部评价指标对比分析AP聚类(affinity propagation clustering)、DBSCAN聚类(density-based spatial clustering of applications with noise)和模糊C均值聚类(fuzzy C-means clustering, FCM)3种典型聚类算法的性能,验证了AP聚类算法性能最优,并将其应用于对截获数据的数据标注中。然后利用卷积神经网络对雷达工作模式进行识别,并与已知标签训练集下的网络进行对比,验证了基于AP聚类算法进行数据标注的可行性,提升了相较传统识别网络的抗噪性,为后续多功能雷达行为认知提供了基础。  相似文献   

15.
分词是中文自然语言处理的重要基础,新词的不断涌现是分词的最大难题。针对新词识别定义不清、语料缺乏的实际问题,提出了一种以大规模神经网络预训练模型为基础,并结合主动学习和人工规则的新词识别算法。利用预训练模型高效识别候选新词,使用基于不确定性和代表性样本选择的主动学习策略辅助标注新词,利用热度规则、突发性规则和合成性规则识别和过滤新词发现结果。针对新词识别评价标准不一致的问题,给出了一般性准确率和受限制准确率两条规范测试指标。与现有最优算法进行实验对比,所提算法两项指标分别提高了16%和4%。  相似文献   

16.
建筑物边缘提取对智慧城市建设具有重要的研究意义,采用人工标注建筑物边缘的方法需要消耗大量的人力物力。目前,利用深度学习的方法已经能提取建筑物大致轮廓,但其需要大量的人工标注的精确样本进行训练。因此,文章构建了3个边缘检测数据集并复现了2个经典边缘检测网络RCF和BDCN进行交叉训练测试实验,评估边缘检测模型的可迁移性,为研究构建普适性更强的边缘检测网络提供思路。  相似文献   

17.
半监督学习是一种结合监督学习与无监督学习的学习方法,通过利用未标记数据,提高标记数据所建立模型的效果,目的是减少传统的机器学习任务中对大量标注数据的需求、降低人工成本.在中文电子病历实体识别领域,由于缺少足够的标注数据,且医学文本专业性较强、人工标注成本高,可以利用半监督学习方法,提升少量标注数据的训练效果.本文介绍了中文电子病历实体识别的研究背景和半监督学习的相关研究,并应用改进后的Tri-Training算法,提升中文电子病历实体识别模型的效果.  相似文献   

18.
相关反馈(reference feedback)是信息检索领域中一种常用技术,近年来,该技术被广泛应用与基于内容的图像检索(CBIR)领域中,旨在通过用户与图像检索系统间的交互过程,克服图像底层特征与高层语义之间的语义鸿沟问题。将主动学习算法结合到相关反馈技术当中,其目的是利用主动学习算法,从无标记图像集中选择最具有信息化的部分图像作为反馈图像,减少用户与系统之间的反馈次数。在COREL图像库和VOC图像库上,对基于主动学习的相关反馈技术进行实验验证,实验结果证明了,基于主动学习的相关反馈技术可以有效提高图像检索系统的性能。  相似文献   

19.
基于深度图的3D手部姿态估计通常需要大量人工标注数据以达到高精确度和鲁棒性,然而关节点标注过程冗杂且存在一定误差.现有研究工作使用自监督方法解决对标注数据的依赖,通过在虚拟数据集上预训练网络,并在无标注的真实数据集上进行模型拟合,实现3D姿态估计.自监督方法的关键在于设计模型拟合的能量函数以减小模型在真实数据集上的精度下降程度.为了减小模型拟合难度,本文提出局部深度一致性损失,依据初始姿态估计结果,提取输入与输出深度图的局部表征,将深度图显式地解耦为以关节点为中心的不同区域.通过有针对性地对不同关节点进行局部优化,减少虚拟与真实深度图之间的固有领域误差对网络学习的影响,增加训练的稳定性.本文方法在NYU数据集上相比基础方法平均关节点误差提升了21.9%.  相似文献   

20.
针对深度学习运用于雷达目标识别时存在的数据量欠缺和数据人工标注难等问题,提出将传统目标识别方法与人工智能技术结合,建立面向应用的新的目标识别架构,通过融合处理以及基于传统方法的机器自动标注,获得更优越的识别效果,大幅减少人工标注的工作量,确保系统在低数据量、低标注数据下仍可维持一定的识别效果。雷达实测数据证明了该识别框架的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号