首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
 该文基于稀疏编码和集成学习提出了一种新的多示例多标记图像分类方法。首先,利用训练包中所有示例学习一个字典,根据该字典计算示例的稀疏编码系数;然后基于每个包中所有示例的稀疏编码系数计算包特征向量,从而将多示例多标记问题转化为多标记问题;最后利用多标记分类算法进行求解。为了提高分类器的泛化能力,对多个分类器进行集成。在多示例多标记图像数据集上的实验结果表明所提方法与其它方法相比有更好的性能。  相似文献   

2.
本文针对多标记学习耗时大、很难处理大规模数据的问题,提出了一种哈希快速多标记学习算法(HFMLL),该算法将哈希算法与多标记学习算法结合,采用局部敏感哈希算法快速获得每个样本的近邻样本,并通过最小独立置换的MinHash算法快速找到每个标记的相关标记,根据其近邻样本及相关标记的信息,运用最大后验概率准则来预测新样本的标记集。实验表明HFMLL 算法在保持较高分类性能的情况下,算法速度明显优于目前的多标记算法,可以广泛应用于大规模的数据集。   相似文献   

3.
本文首先采用最小二乘法回归作为目标函数,通过添加L1正则化稀疏表示特征。通过邻域互信息将各标记的类属属性进一步约简。为验证本文所提算法性能,采用5个先进多标记算法在6个多标记基准数据集上与本文算法进行对比实验,结果说明本文算法的有效性。  相似文献   

4.
该文提出了一种利用多特征融合和集成学习的极化SAR图像监督分类算法。该算法首先提取极化SAR图像的多重特征,包括EPFS特征,Hoekman分解特征,Huynen分解特征,H/alpha/A分解特征以及扩展四分量分解特征。为保证集成学习中基本分类器的差异性与准确性,算法从5组特征集中每次随机选取两组不同的特征进行串联融合,作为SVM分类器的输入。最后,利用随机森林学习算法将所有基本分类器的预测概率集成输出最终分类结果。像素级和区域级的分类实验表明了该文算法的有效性。   相似文献   

5.
同类样本被认为是分布在同一个高维观测空间的低维流形上,针对多观测样本分类如何利用这一流形结构的问题,提出基于L1 -Graph表示的标记传播多观测样本分类算法.首先基于稀疏表示的思路构造L1 -Graph,进而得到样本之间的相似度矩阵,然后在半监督分类标记传播算法的基础上,限制所有的观测样本都属于同一个类别的条件下,得到一个具有特殊结构的类标矩阵,最后把寻找最优类标矩阵的计算转化为离散目标函数优化问题,进而计算出测试样本所属类别.在USPS手写体数据库、ETH- 80物体识别数据库以及Cropped Yale人脸识别数据库上进行了一系列实验,实验结果表明了本文提出方法的可行性和有效性.  相似文献   

6.
介绍了一种基于Wedgelel(楔波)变换的遥感图像分类算法.该算法将多尺度Wedgelet变换应用于遥感图像区域分割,在此基础上提取各分割区域的Gabor纹理特征实现对遥感图像的分类.为了检验该算法的可行性,将其应用于向海和查干湖遥感图像,并与灰度共生矩阵、高斯马尔科夫随机场等纹理分类算法进行了比较.结果表明,该算法要优于灰度共生矩阵及高斯马尔科夫随机场分类算法,能够得到较高的分类精度和Kappa系数.  相似文献   

7.
类不均衡的半监督高斯过程分类算法   总被引:1,自引:0,他引:1  
针对传统的监督学习方法难以解决真实数据集标记信息少、训练样本集中存在类不均衡的问题,提出了类不均衡的半监督高斯过程分类算法。算法引入自训练的半监督学习思想,结合高斯过程分类算法计算后验概率,向未标记数据中注入类标记以获得更多准确可信的标记数据,使得训练样本的类分布相对平衡,分类器自适应优化以获得较好的分类效果。实验结果表明,在类不均衡的训练样本及标记信息过少的情况下,该算法通过自训练分类器获得了有效标记,使分类精度得到了有效提高,为解决类不均衡数据分类提供了一个新的思路。  相似文献   

8.
公共场所的人群密度信息在公共安全、交通管理、应急减灾等方面具有重要作用,采用红外技术,可以在拍摄人群图像时避免环境光照影响。为了实现室内场景下的红外图像人群密度分类,提出一种融合灰度直方图高阶统计特征与灰度共生矩阵特征的人群密度分类方法。首先,根据红外图像的特点,分析并提取样本图像灰度直方图的高阶统计特征,随后与提取的灰度共生矩阵特征串行融合,最后作为多分类支持向量机的输入,对不同人群密度等级进行分类。实验结果表明,提出的方法对于不同密度人群图像的分类准确率可达92.13%,同时特征向量提取简洁、算法耗时短。  相似文献   

9.
随着深度学习技术在自然语言处理领域的广泛应用,短文本情感分类技术得到显著发展。该文提出了一种融合TextCNN-BiGRU的多因子权重文本情感分类算法。算法通过引入词语情感类别分布、情感倾向以及情感强度三个关键因子改进了词语的向量表示。将基于词向量表示的短文本分别作为TextCNN和BiGRU模型的输入,提取文本关键局部特征以及文本上下文的全局特征,将两种特征进行线性融合,实现中文短文本的情感分类。在公开的两个情感分类数据集上验证了多因子权重向量表示方法和融合TextCNN-BiGRU的情感分类模型的有效性,实验结果表明,文中提出的算法较单一模型在短文本情感分类准确率上提高了2%。  相似文献   

10.
在偏标记学习中,示例的真实标记隐藏在由一组候选标记组成的标记集中。现有的偏标记学习算法在衡量示例之间的相似度时,只基于示例的特征进行计算,缺乏对候选标记集信息的利用。该文提出一种候选标记感知的偏标记学习算法(CLAPLL),在构建图的阶段有效地结合候选标记集信息来衡量示例之间的相似度。首先,基于杰卡德距离和线性重构,计算出各个示例的标记集之间的相似度,然后结合示例相似度和标记集的相似度构建相似度图,并通过现有的基于图的偏标记学习算法进行学习和预测。3个合成数据集和6个真实数据集上实验结果表明,该文方法相比于基线算法消歧准确率提升了0.3%~16.5%,分类准确率提升了0.2%~2.8%。  相似文献   

11.
目前众多的研究者通常直接将标签置信度矩阵作为先验知识直接加入到分类模型中,并没有考虑未标注先验知识对标签集质量的影响.基于此,引入非平衡参数的方法,将先验知识获得的基础置信度矩阵进行非平衡化,从而提出一种非平衡化的标签补全的核极限学习机多标签学习算法(KELM-NeLC):首先使用信息熵计算标签之间的相关关系得到标签置信度矩阵,然后利用非平衡参数方法对基础的标签置信度矩阵进行改进,构建出一个非平衡的标签补全矩阵,最后为了学习获得更加准确的标签置信度矩阵,将非平衡化的标签补全矩阵与核极限学习机进行联合学习,依此解决多标签分类问题.提出的算法在公开的多个基准多标签数据集中的实验结果表明,KELM-NeLC算法较其他对比的多标签学习算法有一定优势,使用统计假设检验进一步说明所提出算法的有效性.  相似文献   

12.
朱赛赛  贾修一  李泽超 《电子学报》2000,48(12):2345-2351
多标记学习用于处理一个示例同时与多个类别标记相关的问题.在多标记学习中,标记相关性能够显著提升学习算法的性能.大多数现有的多标记学习算法在利用标记的相关性时,要么只使用被所有示例所共享的全局标记相关性,要么就使用局部标记相关性,它们认为不同簇中的示例应该存在不同的标记相关性.本文中,我们提出了一种同时利用全局和局部标记相关性的多标记学习算法,从而为学习进程提供更全面的标记信息.在计算全局和局部标记相关性时,我们使用了余弦相似性来获取不同标记之间的正相关性和负相关性,这样有助于我们进一步实现更可靠的多标记学习.我们在多种类型的数据集上进行了广泛的对比实验来验证所提算法的有效性.实验结果表明,该算法显著优于大多数对比算法,展现出其在多标记学习中的突出性能.  相似文献   

13.
为减少暴恐图像对社会发展和青少年成长造成的不利影响,本文提出一种基于集成分类的暴恐图像自动标注方法,辅助筛除网页中的暴恐信息。该方法将暴恐图像的标注视作多标签分类问题,利用迁移学习训练多个子网络,然后通过集成学习对子网络的输出进行融合,同时在融合过程中针对各个标签在不同网络上的准确率进行权重分配,最后经过一系列矩阵运算得到图像的标注结果。实验结果表明,与传统机器学习算法相比,本文方法在准确率和召回率上都有较大提升,并改善了样本不均衡所造成的不同标签类别上模型标注精确度差异较大的问题。  相似文献   

14.
投诉工单自动分类是通信运营商客服数字化、智能化发展的要求。客服投诉工单的类别有多层,每一层有多个标签,层级之间有所关联,属于典型的层次多标签文本分类问题,现有解决方法大多数基于分类器同时处理所有的分类标签,或者对每一层级分别使用多个分类器进行处理,忽略了层次结构之间的依赖。提出了一种基于矩阵分解和注意力的多任务学习的方法(MF-AMLA),处理层次多标签文本分类任务。在通信运营商客服场景真实投诉工单分类数据下,与该场景常用的机器学习算法和深度学习算法的Top1F1值相比分别最大提高了21.1%和5.7%。已在某移动运营商客服系统上线,模型输出的正确率97%以上,对客服坐席单位时间的处理效率提升22.1%。  相似文献   

15.
In this paper, a manifold learning based method named local maximal margin discriminant embedding (LMMDE) is developed for feature extraction. The proposed algorithm LMMDE and other manifold learning based approaches have a point in common that the locality is preserved. Moreover, LMMDE takes consideration of intra-class compactness and inter-class separability of samples lying in each manifold. More concretely, for each data point, it pulls its neighboring data points with the same class label towards it as near as possible, while simultaneously pushing its neighboring data points with different class labels away from it as far as possible under the constraint of locality preserving. Compared to most of the up-to-date manifold learning based methods, this trick makes contribution to pattern classification from two aspects. On the one hand, the local structure in each manifold is still kept in the embedding space; one the other hand, the discriminant information in each manifold can be explored. Experimental results on the ORL, Yale and FERET face databases show the effectiveness of the proposed method.  相似文献   

16.
刘煊  渠慎明 《激光技术》2022,46(6):808-816
为了解决基于监督学习的高光谱图像分类算法训练样本中存在的噪声标签会降低后续的分类精度的问题, 采用了一种基于低秩稀疏表示和改进光谱角制图(SAM)的高光谱图像误标签检测算法。首先对高光谱图像中信号子空间进行预测, 根据预测到的子空间对原始高光谱图像重构并去噪; 然后通过基于归一化的光谱角制图算法来获取每一类样本间的距离信息, 得到每类样本间的光谱相似度, 并利用密度峰值聚类算法得到每个训练样本的局部密度; 最后采用基于局部密度的决策函数对噪声标签进行检测, 使用支持向量机在两个真实数据集上验证。结果表明, 该算法比先进的层次结构的高光谱图像误标签检测算法提高了1.91%的总体精度。这一结果对高光谱图像分类是有帮助的。  相似文献   

17.
Automatic image annotation has emerged as a hot research topic in the last two decades due to its application in social images organization. Most studies treat image annotation as a typical multi-label classification problem, where the shortcoming of this approach lies in that in order to a learn reliable model for label prediction, it requires sufficient number of training images with accurate annotations. Being aware of this, we develop a novel graph regularized low-rank feature mapping for image annotation under semi-supervised multi-label learning framework. Specifically, the proposed method concatenate the prediction models for different tags into a matrix, and introduces the matrix trace norm to capture the correlations among different labels and control the model complexity. In addition, by using graph Laplacian regularization as a smooth operator, the proposed approach can explicitly take into account the local geometric structure on both labeled and unlabeled images. Moreover, considering the tags of labeled images tend to be missing or noisy, we introduce a supplementary ideal label matrix to automatically fill in the missing tags as well as correct noisy tags for given training images. Extensive experiments conducted on five different multi-label image datasets demonstrate the effectiveness of the proposed approach.  相似文献   

18.
基于标签关联的多标签演化超网络   总被引:1,自引:0,他引:1       下载免费PDF全文
王进  刘彬  孙开伟  陈乔松  邓欣 《电子学报》2018,46(4):1012-1018
针对多标签学习中如何有效挖掘利用高阶标签关联的问题,提出了一种基于标签关联的多标签演化超网络模型.该模型通过输入任意多标签学习方法的预测结果,利用超边表征挖掘高阶标签关联,并综合标签关联和特征信息作为最终的预测结果.与3种传统多标签学习方法在6个多标签数据集上的对比实验表明,本文提出模型不仅能够有效提升多个传统多标签学习方法的性能,而且能够提供具有良好可读性的学习结果.  相似文献   

19.
多标签分类已在很多领域得到了实际应用,所用标签大多具有很强的关联性,甚至存在非完备标签或部分标签遗失。然而,现有的多标签分类算法难以同时处理这两种情况。基于此,提出一种新的概率模型处理方法,实现同时对具有标签关联性和遗失标签情况进行多标签分类。该方法可以自动获知和掌握多标签的关联性。此外,通过整合遗失的标签信息,该方法能够提供一个自适应策略来处理遗失的标签。在完备标签和非完备标签的数据上进行实验,结果表明,与现有的多标签分类算法相比,提出的方法得到了较好的分类预测评价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号