首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 357 毫秒
1.
基于球结构支持向量机的多标签分类的主动学习   总被引:1,自引:0,他引:1  
蒋华  戚玉顺 《计算机应用》2012,32(5):1359-1361
为了实现数据的多标签分类,减少多标签训练样本开销,将球结构支持向量机与主动学习方法结合用于多标签分类,依据球重叠区域样本距离差值度确定样本类别,分析多标签分类特性,采用样本近邻方法更新分类器。实验结果表明,该方法可以用较少的训练样本获得更有效的分类结果。  相似文献   

2.
现有深度学习算法应用于PolSAR图像分类时,较少考虑该图像数据的复数特点,使得数据的复数域信息不能被充分利用;同时,深度学习需要大量的标签样本作为模型的训练样本,但是PolSAR图像可获取的标签样本十分有限.针对上述问题,结合Tri-training算法和复值卷积神经网络(CV-CNN)提出了半监督PolSAR图像分类算法.首先通过Wishart分类器和Tri-training算法获取一些可靠性较高的伪标签样本,然后将其加入到复值卷积神经网络的训练样本中并用于模型训练,最终完成图像分类任务.通过四幅PolSAR图像分类的仿真实验表明,该算法不仅能够有效提升伪标签样本的可靠性,同时还可提高模型的分类准确率.  相似文献   

3.
针对动态场景目标的分类问题,提出一种基于轮廓特征的运动目标分类方法.通过构建多种轮廓特征相结合的特征向量模型来描述动态目标,作为分类器学习判别的基础.该方法首先通过混合高斯模型提取出视频中的动态场景目标,经图像形态学的处理,获得较为精确的动态场景目标轮廓图像,然后使用特征向量模型提取轮廓的相关特征作为分类器学习判别的依据,并得到最终分类结果.以常见的运动目标汽车、行人、自行车作为分类类别进行实验.结果表明该方法有较高的分类精度,且具有实时性好,易于实现的特点.  相似文献   

4.
在远同源检测的蛋白质分类方法中,基于判别模型的分类器相对于其他方法取得了最高的准确性,但这类方法都面临训练建模时因正类样本不足导致的训练不平衡问题。为此提出一种基于优化判别模型的蛋白质分类方法,通过对正负样本设置不同的惩罚系数,平衡分类器正负训练集的权重,进一步提高基于判别模型的分类器性能。比对实验表明,基于优化判别模型的方法取得了更高的准确性,并且通过参数优化,该方法可以提高所有基于判别模型的分类器性能。  相似文献   

5.
“半监督学习”是利用已经标记好的训练样本和未标记的训练样本一起训练分类器.传统的半监督训练过程对噪声不作辨别,这种做法会因噪声的存在破坏分类器的训练过程,进而影响分类器的分类效果.针对该问题,提出了基于RSC模型和噪声去除的半监督训练方法,在样本训练过程中,使用RSC标签扩展的方法,并添加噪声去除环节.实验表明,该算法能有效降低半监督学习中噪声对分类器的影响,得到更加精确的分类边界,最终提高算法的性能和稳定性.  相似文献   

6.
真实数据集中存在的对抗样本一方面易导致分类器取得较差分类结果,另一方面如果能够被合理利用,分类器的泛化能力将得到显著提高。针对现有大部分分类算法并没有利用对抗样本训练分类模型,提出一种攻击标签信息的对抗分类算法(ACA)。该方法从给定数据集中选取一定比例样本并攻击所选取的样本标签使之成为对抗样本,即将样本标签替换成其他不同类型的标签。利用支持向量机(support vector machine,SVM)训练包含对抗样本的数据集,计算生成的SVM输出误差对于输入样本的一阶梯度信息并嵌入到输入样本特征中以更新输入样本。再次利用SVM训练更新后的样本以生成对抗的SVM(A-SVM)。原理分析与实验结果表明,一阶梯度信息不仅提供了一种分类器输出与输入之间的正相关关系,而且可提高A-SVM的实际分类性能  相似文献   

7.
提出了一种基于高斯混合模型核的半监督支持向量机(SVM)分类算法.通过构造高斯混合模型核SVM分类器提供未标示样本信息,使得SVM算法在学习标示样本信息的同时,能够兼顾整个训练样本集合的聚类假设.实验部分将该算法同传统SVM算法、直推式支持向量机(TSVM)以及随机游走(RW)半监督算法进行分类性能比较,结果证明该算法在拥有较少标示样本训练的情况下分类性能也有所提高且具有较高的鲁棒性.  相似文献   

8.
面对大量样本特征时很多分类器无法取得较好的分类效果,样本数有限导致贝叶斯算法无法获得精确的联合概率分布估计,在样本局部构建高质量分类器需要有效的样本相似性度量指标. 针对以上问题,提出了一种基于余弦相似度进行实例加权改进的朴素贝叶斯分类算法. 算法考虑特征对分类的决策权重不同,使用余弦相似度度量样本的相似性,选出最优训练样本子集,用相似度值作为训练样本的权值来训练修正后的贝叶斯模型进行分类. 基于UCI数据集的对比实验结果表明,提出的改进算法易于实现且具有更高的平均分类准确率.  相似文献   

9.
样本标记是一个重要但又比较耗时的过程。得到一个多标签分类器需要大量的训练样本,而手工为每个样本创建多个标签会存在一定困难。为尽可能降低标记样本的工作量,提出一种加权决策函数的主动学习方法,该方法同时考虑训练样本的数量和未知样本的置信度,使得分类器能在最小的成本下最快地达到比较满意的分类精度。  相似文献   

10.
基于生成对抗网络的图像识别方法拥有很高的识别率,但训练时需要大量有标签样本,在有标签样本较少的情况时识别效果不佳。针对这个问题,结合深度卷积生成对抗网络和半监督生成对抗网络的特点建立半监督深度生成对抗网络。根据有标签样本和无标签样本分布,模型生成拟合真实分布的样本输入并训练分类器,增加了训练样本数从而提升识别率。将模型优化调整并进行图像识别实验,结果表明,该方法仅用少量有标签样本即可实现准确的图像识别。  相似文献   

11.
虚拟样本是一种在学习过程中引入先验知识的有效手段,一定程度上提高了分类器的性能。然而由于生成的虚拟样本集的数据分布与原始训练集的分布不一致,因此利用虚拟样本扩充后的训练样本集进行学习的分类器分类性能上存在波动。针对这种不足,提出一种基于权重选择虚拟样本的新分类算法。该方法首先利用TrAdaBoost算法对扩充后的样本集进行预处理,然后选取权重大于某一给定阈值的样本构造新训练样本集,最后根据新样本集进行训练得到分类器。由于排出了不重要的样本,因此在新样本集上得到的分类器具有更高的精度。在部分UCI标准数据集与KDD cup 99网络入侵检测数据集上的对比实验说明了该算法较不产生虚拟样本的直接分类算法和利用虚拟样本全集进行训练的分类算法具有更高的精度。  相似文献   

12.
罪名预测是人工智能技术应用于司法领域的代表性任务. 该任务根据案情描述和事实预测被告人被判的罪名. 由于各类罪名样本数量高度不平衡, 分类模型训练时分类器易偏向高频罪名类别, 从而导致低频罪名预测性能不佳. 针对罪名预测类别不平衡问题, 提出融合类别先验Mixup数据增强策略的罪名预测模型, 改进低频罪名预测效果. 该模型利用双向长短期记忆网络与结构化自注意力机制学习文本向量表示, 在此基础上, 通过Mixup数据增强策略在向量表示空间中合成伪样本, 并利用类别先验使合成样本的标签偏向低频罪名类别, 以此来扩增低频罪名训练样本. 实验结果表明, 与现有方法相比, 该方法在准确率、宏精确率、宏召回率和宏F1值上都获得了大幅提升, 低频罪名预测的宏F1值提升达到13.5%.  相似文献   

13.
提出一种基于类别约束的主题模型用于实现场景分类.不同于现有方法,本文将图像场景类别信息引入模型参数推导过程中,采用与其类别相关的类主题集描述图像的语义内容.针对各场景类图像中潜在主题数量变化,提出了一种ATS-LDA(自适应主题数的潜在狄里克雷分布)模型实现中层语义的建模算法.该模型依据各场景类训练样本关于视觉词语表示的变化估计所需主题数,体现了各类场景中间语义的繁简变化.根据各类模型下的图像概率分布,采用最大似然估计实现测试样本的场景语义分类.改变了现有主题模型需要依赖于其它分类器完成场景分类的现状.通过多个图像数据集分类任务证明该模型能够在不需要太多训练的情况下取得较好地性能.  相似文献   

14.
针对变速器新产品故障检测问题,提出以阶次分析进行故障特征提取和支持向量机分类器进行故障分类的方法.通过建立二层支持向量机分类判别模型和对惩罚因子C的调整,解决了在训练样本集不平衡的情况下标准支持向量机分类器的分类面偏向样本数量较多类别的问题.通过对现场数据的实验结果表明,该方法的故障识别率和运行时间比BP神经网络和标准支持向量机算法均有较大提高.  相似文献   

15.
传统子空间学习方法在对齐领域总体分布时往往忽略样本类别信息,若原始样本判别力不足,将难以保证投影后子空间中样本的判别性.针对该问题,提出迁移子空间的半监督领域自适应方法.通过充分利用样本类别标签先验信息,在得到具有判别性子空间的同时充分挖掘重构矩阵中蕴含的鉴别信息,增强子空间跨领域特征表达的鉴别力和鲁棒性,提高模型的分类性能.在领域自适应问题常用的基准图像数据集上进行实验,其结果表明,该算法有较好的分类效果.  相似文献   

16.
基于代表样本动态生成的中文网页分类   总被引:2,自引:0,他引:2  
华北  曹先彬 《计算机应用》2006,26(10):2502-2504
针对中文网页分类问题该文设计了一种新的基于代表样本动态生成的分类算法。算法通过对原始训练样本集的训练逐个生成代表样本,并充分利用被裁剪训练样本的有效信息,对已生成的代表样本进行多次调整,从而使代表样本更具有代表性。基于该算法的中文网页分类器的实验结果表明,算法有效地压缩了原始训练样本集,提高了分类效率,同时保持了分类的准确性;具有较好的分类性能。  相似文献   

17.
莫建文  陈瑶嘉 《控制与决策》2021,36(10):2475-2482
针对神经网络模型进行类增量训练时产生的灾难性遗忘问题,提出一种基于分类特征约束变分伪样本生成器的类增量学习方法.首先,通过构造伪样本生成器记忆旧类样本来训练新的分类器及新的伪样本生成器.伪样本生成器以变分自编码器为基础,用分类特征进行约束,使生成的样本更好地保留旧类在分类器上的性能.然后,用旧分类器的输出作为伪样本的精馏标签,进一步保留从旧类获得的知识.最后,为了平衡旧类样本的生成数量,采用基于分类器分数的伪样本选择,在保持每个旧类伪样本数量平衡的前提下选择一些更具代表性的旧类伪样本.在MNIST、FASHION、E-MNIST和SVHN数据集上的实验结果表明,所提出的方法能有效减少灾难性遗忘的影响,提高图像的分类精度.  相似文献   

18.
针对实际工况下调压器标记样本稀缺导致故障诊断效果不佳的问题,基于自训练算法与半监督生成对抗网络(semi-supervisedgenerativeadversarialnetwork,SGAN)设计了故障诊断模型。首先,对燃气调压器一维压力信号进行预处理,得到灰度图像样本。之后,基于深度卷积生成对抗网络,设计SGAN进行特征提取,判别器采用具有共享权值的堆叠鉴别器模型。然后,设计自训练算法,使用训练好的初始分类器预测无标签样本的类别标签。最后,采用重复标记方式将满足要求的样本扩充到有标签样本集重新训练,保存最终的分类器。实验结果表明,在少量调压器标签样本的情况下,所提模型依旧具有良好的性能。  相似文献   

19.
针对相关滤波跟踪算法中训练样本污染容易导致模型漂移和目标丢失等问题,提出基于峰值旁瓣比样本分类的自适应去污算法,建立了样本污染特征、滤波器响应图和跟踪结果之间的内在联系,研究了样本分类机制和参数动态更新策略。通过样本分类阈值将训练样本划分为反映不同污染程度的样本集,并分别训练出对应各类样本集的滤波器;根据峰值旁瓣比动态更新特定样本集的样本权值及其滤波器参数;对各类样本集的相关滤波器进行加权融合实现目标跟踪。在OTB-50和TC-128数据集的测试结果表明:该方法有效抑制了严重污染样本的影响并提高了复杂场景目标跟踪的准确性和鲁棒性。  相似文献   

20.
陈刚  吴振家 《控制与决策》2020,35(3):763-768
非平衡数据的分类问题是机器学习领域的一个重要研究课题.在一个非平衡数据里,少数类的训练样本明显少于多数类,导致分类结果往往偏向多数类.针对非平衡数据分类问题,提出一种基于高斯混合模型-均值最大化方法(GMM-EM)的概率增强算法.首先,通过高斯混合模型(GMM)与均值最大化算法(EM)建立少数类数据的概率密度函数;其次,根据高概率密度的样本生成新样本的能力比低概率密度的样本更强的性质,建立一种基于少数类样本密度函数的过采样算法,该算法保证少数类数据集在平衡前后的概率分布的一致性,从数据集的统计性质使少数类达到平衡;最后,使用决策树分类器对已经达到平衡的数据集进行分类,并且利用评价指标对分类效果进行评判.通过从UCI和KEEL数据库选出的8组数据集的分类实验,表明了所提出算法比现有算法更有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号