首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
在多标签分类问题中,标签之间往往是相关的,为了提高分类性能,利用标签之间的相关性,提出AdaBoost.MLR算法和标签相关性分析方法。AdaBoost.MLR算法采用余弦相似度来计算标签相关性矩阵,利用标签相关性矩阵对原始标签矩阵进行补全转换为模糊标签矩阵,将标签空间划分为标签集、标签相关集和标签无关集,结合标签之间的相关性和弱分类器的分类情况,对样本权重进行调整。AdaBoost.MLR算法也能解决多类别分类问题,在其标签相关性的计算中,根据已经训练的弱分类器得到的临时强分类器的分类结果,构造标签相似性矩阵。实验结果表明,文中提出的算法在实验数据集上优于现有的算法,尤其在标签相关性复杂的数据集上分类性能有显著提升。  相似文献   

2.
基于全监督学习的文本分类算法需要使用大量的标签数据,而文本数据的标注任务耗时耗力且标注难度较大。针对上述问题,提出了一种基于LOTClass模型的弱监督中文短文本分类算法。首先,使用少量的标签数据构建类别种子词表;其次,使用类别种子词表指导训练中文伪标签生成模型,并使用该模型生成大量伪标签数据;最后,利用优质伪标签数据训练一个中文短文本分类模型。在THUCNews新闻标题数据集和论文标题数据集上进行实验,结果表明,该算法在仅使用少量标签数据的情况下,其性能优于主流的半监督分类算法,同时不逊于一般的全监督分类算法,为无标签数据分类任务提供了一种较好的解决方案。  相似文献   

3.
在多标签新闻分类问题中,针对传统分类器链算法难以确定标签依赖顺序、集成模型运行效率低和无法应用复杂模型作为基分类器的问题,提出基于深度神经网络的双向分类器链算法. 该方法利用正向分类器链获取每个标签和前面所有标签的依赖关系,引入逆向分类器链,从正向链最后一个基分类器的输出开始反向学习每个标签和所有其他标签的相关性. 为了提取非线性标签相关性和提高预测性能,使用深度神经网络作为基分类器. 结合2条分类器链的均方误差,使用随机梯度下降算法对目标函数进行有效优化. 在多标签新闻分类数据集RCV1-v2上,将所提算法与当前主流的分类器链算法和其他多标签分类算法进行对比和分析. 实验结果表明,利用深度双向分类器链算法能够有效提升预测性能.  相似文献   

4.
为了实现Scratch可视化编程领域的作品分类,提出了一种基于标签关联性的多标签分类算法(MLLR),构建了一个有效的多标签Scratch分类模型.首先提取作品的Block使用特征、计算思维技能特征和复杂度特征3类特征作为分类特征;然后针对RAKEL算法随机选择标签子集,忽略了标签间的关联性,提出了改进的MLLR算法,该方法根据多标签之间的关联性来划分标签子集,再训练相应的标签幂集子分类器.实验结果表明,MLLR算法在分类性能和时间性能上优于RAKEL等多标签分类算法,构建的分类模型对于Scratch作品具有较强的适用性,分类的准确率达到81.3%.  相似文献   

5.
针对心脏瓣膜疾病模糊分类问题,提出了基于多标签AdaBoost的模糊分类改进算法。结合模糊集理论,采用隶属函数将疾病的严重程度映射到区间[0,1]内的实数值,将超声诊断结果用模糊标签向量表示。利用余弦相似性分析疾病之间的复杂关系,计算标签相关性矩阵并对模糊标签向量进行补充。结合实际问题选取合适的阈值,将标签空间划分为标签集、标签相关集和标签无关集。本文算法以最小化排序损失为目标,针对不同的标签给予不同的权值调整因子,调整样本权重更新速度,强迫弱分类器“关注”与样本标签相关性较高的标签。在临床超声心动图TEE监测数据集上的实验结果表明:在对超声诊断结果模糊化时,通过隶属函数将疾病的严重程度中的“无病”映射为0,“轻度”映射到区间[0.8,0.85],“中度”映射到区间[0.85,0.9],“重度”映射到区间[0.9,1],构造模糊标签矩阵,并通过标签相关性矩阵对其进行补充,此时所构造的分类器性能达到最优。将本文算法与AdaBoost.MLR算法、AdaBoost.MR算法、BPMLL算法、RankSVM算法和MLkNN算法进行对比分析,在多标签分类的5种评价指标上,本文算法的分类性能均优于其他对比算法,分类结果更接近超声诊断结果。相较于AdaBoost.MLR算法,本文算法的Ranking Loss 下降了15.8%左右, One error下降了23.8%左右;相较于AdaBoost.MR算法,本文算法的Ranking Loss和One error降低30%左右,Coverage下降了15.6%左右。  相似文献   

6.
提出一种改进的多核支持向量机算法。利用特征向量的信息熵,计算出特征向量关于分类标签的信息增益,用该信息增益作为数据集特征向量的权重系数,然后结合多核支持向量机的核学习能力,对特征向量非均等区别对待,使得分类更加准确。对比实验结果表明,与支持向量机、多核支持向量机相比,改进算法分类正确率得以提升。  相似文献   

7.
为了解决高光谱数据有标签样本数量有限的分类问题,提出将M-training算法应用于高光谱图像分类。采用两个SVM、一个K近邻(KNN)以及一个随机森林(RF)进行分类器组合,对传统M-training算法进行改进,增强分类器的多样性和差异性。为了充分考虑大量无标签样本的影响,采用有标签样本与无标签样本错误率加权作为有标签样本集更新的限制条件,从而有效地扩大了有标签样本集。实验结果表明:改进算法和传统的M-training算法相比较,在总体分类精度与Kappa系数上分别提高1. 85%~12. 10%与0. 021 5~0. 141 3,从而验证了该算法的有效性。  相似文献   

8.
现有的多层判别式字典学习算法中大多采用交替方向乘子法实现字典的更新,在图像分类方面的应用较为成熟。然而,当图像内容较为丰富且含有多个标签时,现有方法在多标签分类上的表现不佳。对此,可采用递归最小二乘法与去相关增强重建系数算法构成的二层判别式字典学习结构,更适用于图像多标签分类。通过多层判别式字典学习对数据进行多次稀疏分解,在最后一层判别式中用线性分类器对稀疏分解得到的特征向量进行分类,采用4个多标签分类指标对分类效果进行评判时,发现One-error, Coverage, Ranking-loss三个分类指标越小,Average-precision分类指标越大,算法的性能越优。实验结果表明,在明清服饰纹样数据集上使用多层字典学习算法的分类精度达到了82.17%,在同类算法中的性能最优。  相似文献   

9.
基于LS-SVM的多标签分类算法   总被引:2,自引:0,他引:2  
多标签分类是指部分样本同时归属多个类别.基于数据分解的算法因训练速度快、性能良好而得到广泛的应用.本文采用一对一分解策略,将k标签数据集分解为k(k-1)/2个两类单标签和两类双标签的数据子集.对每一训练子集统一用LS-SVM模型建立子分类器,当出现双标签样本时将其函数值设为0,并确定适当的分类阈值.对情感、景象和酵母数据集的实验结果表明,本文算法的某些性能指标优于现有一些常用的多标签分类方法.  相似文献   

10.
提出一种图像标注改善方法,利用数据集蕴含的语境相关信息进行标注改善。构建标签相关图和视觉内容相关图,利用正则化框架将标注改善问题描述为两个无向加权图上的损失函数最小化问题。采用数据分割,逐次优化和放松约束的策略,获得该问题的近似解。该方法充分利用标签的语境相关信息和图像内容相关信息,对数据集分割的粒度具有较好的鲁棒性,具备近似线性的时间复杂度。测试结果表明,该方法适用于大规模数据集,性能优于其它对比方法,可以较大幅度的提升图像标注性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号