首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
谭桥宇  余国先  王峻  郭茂祖 《软件学报》2017,28(11):2851-2864
弱标记学习是多标记学习的一个重要分支,近几年已被广泛研究并被应用于多标记样本的缺失标记补全和预测等问题.然而,针对特征集合较大、更容易拥有多个语义标记和出现标记缺失的高维数据问题,现有弱标记学习方法普遍易受这类数据包含的噪声和冗余特征的干扰.为了对高维多标记数据进行准确的分类,提出了一种基于标记与特征依赖最大化的弱标记集成分类方法EnWL.EnWL首先在高维数据的特征空间多次利用近邻传播聚类方法,每次选择聚类中心构成具有代表性的特征子集,降低噪声和冗余特征的干扰;再在每个特征子集上训练一个基于标记与特征依赖最大化的半监督多标记分类器;最后,通过投票集成这些分类器实现多标记分类.在多种高维数据集上的实验结果表明,EnWL在多种评价度量上的预测性能均优于已有相关方法.  相似文献   

2.
一种针对弱标记的直推式多标记分类方法   总被引:2,自引:1,他引:1  
多标记学习主要解决一个样本可以同时属于多个类别的问题,它广泛适用于图像场景分类、文本分类等任务.在传统的多标记学习中,分类器往往需要利用大量具有完整标记的训练样本才能获得较好的分类性能,然而,在很多现实应用中又往往只能获得少量标记不完整的训练样本.为了更好地利用这些弱标记训练样本,提出一种针对弱标记的直推式多标记分类方法,它可以通过标记误差加权来补全样本标记,同时也能更好地利用弱标记样本提高分类性能.实验结果表明,该方法在弱标记情况下的图像场景分类任务上具有较好的性能提高.  相似文献   

3.
在多标记学习与分类中,现有邻域粗糙集特征选择算法若将样本的分类间隔作为邻域半径,则会出现分类间隔过大导致分类无意义、样本距离过大容易造成异类样本和同类样本失效,以及无法处理弱标记数据等情况.为解决这些问题,提出一种基于多标记邻域粗糙集和多标记Relief的弱标记特征选择方法.首先,引入异类样本数和同类样本数来改进分类间...  相似文献   

4.
标记分布学习(label distribution learning,LDL)是一种用于解决标记多义性的新颖学习范式。现有的LDL方法大多基于完整数据信息进行设计,然而由于高昂的标注成本以及标注人员水平的局限性,很难获取到完整标注数据信息,且会导致传统LDL算法性能的下降。为此,本文提出了一种新型的结合局部序标记关系的弱监督标记分布学习算法,通过维持尚未缺失标记之间的相对关系,并利用标记相关性来恢复缺失的标记,在数据标注不完整的情况下提升算法性能。在14个数据集上进行了大量的实验来验证算法的有效性。  相似文献   

5.
面对多标签的大数据集,传统的分类识别方法识别质量不高,现提出基于分类规则挖掘的数据多标记特征分层识别方法.利用改进后的LLE(局部线性嵌入)方法进行数据降维处理,搜索数据特征,并对数据多标记特征选择,构成特征子集,根据特征子集,利用分类规则挖掘方法构建一个分类识别模型,实现数据多标记特征分层识别.结果 表明,与传统方法相比,所研究方法识别下,汉明损失度最小,数据多标记特征分层识别准确度最大,说明上述方法的识别质量较高,达到了研究的预期目标,为数据利用和挖掘提供了参考和借鉴.  相似文献   

6.
在多标记学习系统中,每个样本同时与多个类别标记相关,却均由一个属性特征向量描述。大部分已有的多标记分类算法采用的共同策略是使用相同的属性特征集合预测所有的类别标记,但它并非最佳选择,原因在于每个标记可能与其自身独有的属性特征相关性最大。针对这一问题,提出了融合标记独有属性特征的k近邻多标记分类算法—IML-kNN。首先对多标记数据的特征向量进行预处理,分别为每类标记构造对该类标记最具有判别能力的属性特征;然后基于得到的属性特征使用改进后的ML-kNN算法进行分类。实验结果表明,IML-kNN算法在yeast和image数据集上的性能明显优于ML-kNN算法以及其他3种常用的多标记分类算法。  相似文献   

7.
随着计算机计算能力的飞速提升,机器学习的作用越来越大,也成为近年来各行业的研究热点。作为全新的学习方法,机器学习主要取决于数据集的准备和标记工具,但现在比较流行的标记工具对于气象资料的标记较为无力,主要是因为气象资料包含了不同通道、不同层次的数据,标记较为复杂,因此需要找对气象资料的标记工具。基于此,笔者介绍了气象机器学习标记工具的设计,包括数据集管理功能、标记管理功能。  相似文献   

8.
针对不完备弱标记数据的学习问题,提出基于粗糙集理论的半监督协同学习模型.首先定义不完备弱标记数据的半监督差别矩阵,提出充分、具有差异性的约简子空间获取算法.然后在有标记数据集上利用各约简子空间训练两个基分类器.在无标记数据上,各分类器基于协同学习的思想标注信度较大的无标记样本给另一分类器学习,迭代更新直至无可利用的无标记数据.UCI数据集实验对比分析表明,文中模型可以获得更好的不完备弱标记数据的分类学习性能,具有有效性.  相似文献   

9.
针对多标记数据的不确定性以及噪声数据的存在,提出了一种新的多标记稳健模糊粗糙分类模型。该模型是处理单标记分类问题的k-mean稳健统计量模糊粗糙分类模型的扩展应用。对于每个待分类数据,首先根据相似性计算方法,得到它们相对于各标记的隶属度;然后根据隶属度定义待分类数据与各标记的相关度;最后为每一组相关度赋予合适的阈值,得到相关的标记集合。在3个标准多标记数据集和1个真实多标记文本数据集上的实验结果表明,对于多标记文本分类问题,所提模型在 6个常用的多标记评测指标上较常用的ML-kNN和rank-SVM多标记学习方法具有更高的准确率。  相似文献   

10.
在多标记学习中,特征选择是处理数据高维问题和提升分类性能的一种有效手段,然而现有特征选择算法大多是基于标记分布大致平衡这一假设,鲜有考虑标记分布不平衡的问题。针对这一问题,本文提出了一种边缘标记弱化的多标记特征选择算法(Multi-label feature selection algorithm with weakening marginal labels,WML),计算不同标记下正负标记的频数比率作为该标记的权值,然后通过赋权方式弱化边缘标记,将标记空间信息融入到特征选择的过程中,得到一组更为高效的特征序列,提升标记对样本描述的精确性。在多个数据集上的实验结果表明,本文算法具有一定优势,通过稳定性分析和统计假设检验进一步证明本文算法的有效性和合理性。  相似文献   

11.
集成分类通过将若干个弱分类器依据某种规则进行组合,能有效改善分类性能。在组合过程中,各个弱分类器对分类结果的重要程度往往不一样。极限学习机是最近提出的一个新的训练单隐层前馈神经网络的学习算法。以极限学习机为基分类器,提出了一个基于差分进化的极限学习机加权集成方法。提出的方法通过差分进化算法来优化集成方法中各个基分类器的权值。实验结果表明,该方法与基于简单投票集成方法和基于Adaboost集成方法相比,具有较高的分类准确性和较好的泛化能力。  相似文献   

12.
为了克服极限学习机(ELM)稳定性差、识别率不高的缺陷, 利用支持向量机(SVM)一对一投票式分类算法准确度高的优势, 提出一种改进的表情识别方法. 该方法将一对一分类算法和ELM算法相结合形成一个新的算法即OAO-ELM(One-Against-One-Extreme Learning Machine), 首先, 对样本采用一对一的分类并利用ELM训练成一个弱分类器, 然后, 将这些弱分类器组合成一个最终的强分类器. 预测结果, 采用投票方式. 用Gabor滤波提取表情特征, 由于提取后特征维度很高, 冗余大, 引入主成分分析(PCA)来降维. 基于JAFFE数据库实验结果表明, 该算法在人脸表情识别上具有较高分类识别率和稳定性.  相似文献   

13.
提出了一种残差加权的多元素协同表示算法. 该算法针对SRC的单一鉴别性不足,对样本提出样本与字典的多元素分解并分别进行相应的协同表示,自适应地学习出多元素的残差权重并进行线性加权,从而提高分类的性能. 实验表明:自适应残差加权的多元素协同表示分类算法,能够有效提高识别性能.  相似文献   

14.
唐玉华  杨晓元  张敏情  韩鹏 《计算机应用》2006,26(12):2887-2889
针对二类支持向量机分类器在图像密写分析应用中训练步骤复杂与推广性弱的缺点,把一类支持向量机(OC-SVM)引入算法,提出一种基于核的多超球面OC-SVM算法。算法利用核空间中样本特征差异突出的特性,首先对样本在核空间进行K-均值聚类,然后使用OC-SVMs对各子类训练建立多超球面分类模型,实现分类判决。实验结果表明,算法有效地实现了对隐秘图像的盲检测,提高了检测精度。  相似文献   

15.
传统的故障分类方法大多假设不同类别的数据样本量是相似或相等的. 然而在实际的工业过程中采集到的数据多数是正常数据, 少部分是故障数据, 这就造成了数据的不平衡. 针对不平衡数据问题, 本文提出了一种K-means Bayes与AdaBoost-SVM相结合的故障分类方法, 通过设计两种独立的分类器, 并利用D-S证据理论对分类结果融合, 以弥补各自对某些类别分类能力较弱的缺陷. 实验证明, 本文提出的故障分类方法与单一Bayes或SVM比较, 具有更高的分类准确率.  相似文献   

16.
提出了一种基于Adaboost算法和CART算法结合的分类算法。以特征为节点生成CART二叉树,用CART二叉树代替传统Adaboost算法中的弱分类器,再由这些弱分类器生成强分类器。将强分类器对数字样本和人脸样本分类,与传统Adaboost算法相比,该方法的错误率分别减少20%和86.5%。将分类器应用于目标检测上,实现了对这两种目标的快速检测和定位。结果表明,改进算法既减小了对样本分类的错误率,又保持了传统Adboost算法对目标检测的快速性。  相似文献   

17.
鉴于特征属性选择在网络流量分类中占据重要地位,为了确定最优特征子集,利用CFS作为适应度函数的改进遗传算法(GA-CFS),从网络流量的249个属性空间中提取主要属性并最终选定18个特征组合作为最优特征子集。通过AdaBoost算法把一系列的弱分类器提升为强分类器,对网络流量进行了深入的分类研究。实验结果表明,基于GA-CFS和AdaBoost的流量组合分类方法较弱分类器具有较高的分类准确率。  相似文献   

18.
针对旋转机械早期故障信号呈现微弱、相互干扰,易导致故障智能分类精度低的现状。提出一种融合优化的PSO-RVMD (Particle swarm optimization-Relevant Variational Mode Decomposition)与SAE (Stacked AutoEncoder)的旋转机械早期故障分类方法。智能分类方法主要有信号增强与智能分类两阶段组成。首先该方法利用所改进的PSO-RVMD分解电机-轴承系统的早期故障振动信号,通过定义的相关能量比概念计算各分量信号(IMFs)与原始信号之间的相关程度,筛选并重构相关程度高的分量,去除冗余与不相干的干扰与噪声成分,实现信号增强。最后,将增强的早期微弱信号输入到SAE模型中进行训练。利用SAE模型提取高层、抽象且利于分类的深度特征且在最后一层添加BP层,直接对提取的深度特征进行故障分类。通过仿真与实际电机-轴承系统振动信号验证了该方法的有效性,结果表明该方法能快速的实现旋转机械早期微弱故障的精确识别与诊断,提高故障特征学习与自动分类程度。  相似文献   

19.
提出了一种基于多特征字典的稀疏表示算法。该算法针对SRC的单特征鉴别性较弱这一不足,对样本提出多个不同特征并分别进行相应的稀疏表示。并根据SRC算法计算各个特征的鉴别性,自适应地学习出稀疏权重并进行线性加权,从而提高分类的性能。实验表明,基于自适应权重的多重稀疏表示分类算法,具有更好的分类效果。  相似文献   

20.
采用Adaboost算法进行面部表情识别   总被引:3,自引:0,他引:3  
Adaboost是一种有效的分类器组合方法,它能够提高弱分类器的分类性能。利用Adaboost方法对面部表情进行识别,探讨了Adaboost与主成分分析法的几种结合方案。仿真结果表明这几种方案可行,且识别效果较好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号