共查询到19条相似文献,搜索用时 78 毫秒
1.
已有单类分类算法通常采用欧氏测度描述样本间相似关系,然而欧氏测度有时难以较好地反映一些数据集样本的内在分布结构,为此提出一种用于改善单类分类器描述性能的高维空间单类数据距离测度学习算法,与已有距离测度学习算法相比,该算法只需提供目标类数据,通过引入样本先验分布正则化项和L1范数惩罚的距离测度稀疏性约束,能有效解决高维空间小样本情况下的单类数据距离测度学习问题,并通过采用分块协调下降算法高效的解决距离测度学习的优化问题.学习得到的距离测度能容易地嵌入到单类分类器中,仿真实验结果表明采用学习得到的距离测度能有效改善单类分类器的描述性能,特别能够改善覆盖分类的描述能力,从而使得单类分类器具有更强的推广能力. 相似文献
2.
由于计算机内存资源限制,分类器组合的有效性及最优性选择是机器学习领域的主要研究内容。经典的集成分类算法在处理小数据集时,拥有较高的分类准确性,但面对大量数据时,由于多基分类器学习、分类共用1台计算机资源,导致运算效率较低,这显然不适合处理当今的海量数据。针对已有集成分类算法只适合作用于小规模数据集的缺点,剖析了集成分类器的特性,采用基于聚合方式的集成分类器和云计算的MapReduce技术设计了并行集成分类算法(EMapReduce),达到并行处理大规模数据的目的。并在Amazon计算集群上模拟实验,实验结果表明该算法具有一定的高效性和可行性。 相似文献
3.
越来越多的研究表明,借助量子计算技术可以提高有监督分类算法和无监督聚类算法的计算效率,甚至是学习精度.通常采用的方法有:基于量子理论将经典信息转换为量子态的形式存储起来,用量子态来表示所有样本;以量子态之间的距离替代样本数据之间的经典距离,形成新的相似度来度量样本数据间的相似性等.通过理论和模拟验证表明,量子计算可以实现对经典机器学习算法的加速.最后,总结了量子机器学习技术的优势和目前所存在的问题,并展望了未来该领域的发展趋势. 相似文献
4.
朴素贝叶斯分类算法由于其计算高效在生活中应用广泛。本文根据集成算法的差异性特征,聚类算法聚类点的选择方式的可变性,提出了基于K-medoids聚类技术的贝叶斯集成算法,朴素贝叶斯的泛化性能得到了提升。首先,通过样本集训练出多个朴素贝叶斯基分类器模型;然后,为了增大基分类器之间的差异性,利用K-medoids算法对基分类器在验证集上的预测结果进行聚类;最后,从每个聚类簇中选择泛化性能最佳的基分类器进行集成学习,最终结果由简单投票法得出。将该算法应用于UCI数据集,并与其他类似算法进行比较可得,本文提出的基于K-medoids聚类的贝叶斯集成算法(NBKME)提高了数据集的分类准确率。 相似文献
5.
基于集成学习提出了一种新的模糊分类规则的产生算法。将分类规则的前件、后件模糊化,在自适应提升(Adaptive Boosting,AdaBoost)算法的迭代中,调整训练实例的分布,利用遗传算法产生模糊分类规则。并在规则学习的适应度函数中引入训练实例的分布,使得模糊分类规则在产生阶段就考虑相互之间的协作,产生具有互补性的分类规则集。从而改善了模糊分类规则的整体识别能力,提高了分类识别精度。 相似文献
6.
全极化合成孔径雷达(PolSAR)图像蕴含更丰富的散射信息,具有更多的可用特征。如何使用这些特征是极化SAR图像分类中非常重要的一步,但是目前尚未对此提出非常明确的准则。为了能够有效地解决上述问题,该文提出一种基于特征加权集成的极化SAR图像分类算法。该算法采用0-1矩阵分解集成方法对包括不同特征的数据集进行学习获得相应加权系数,并通过对每个特征集获得的预测结果进行加权集成来提高极化SAR图像分类性能。首先,输入极化SAR数据,获得极化特征作为原始特征集,并对其进行随机抽取获得不同的特征子集;然后,使用0-1矩阵集成算法得到每个特征值相对应的加权系数;最后,通过对各个特征子集的预测结果进行集成得到最终极化SAR图像分类结果。实测L波段和C波段极化数据的实验结果表明,该算法可以有效地提高极化SAR图像分类的准确度。 相似文献
7.
基于信息熵差异性度量的数据流增量集成分类算法 总被引:2,自引:0,他引:2
对分类器之间的差异性进行了研究,提出了一种基于信息熵差异性度量的增量集成分类算法,将信息熵差异性度量方法融入到基分类器选择过程中,通过对训练数据集的基分类结果的信息熵差异度计算,采用循环迭代优化的选择方法,以熵差异性最优化为约束目标,动态调整基分类器个数,实现了分类准确稳定,减少了系统开销。通过实验比对,证明了算法在数据流处理时比其他算法具有更小的开销和较强的适应性。 相似文献
8.
9.
10.
分类预测是机器学习的基础任务,在机器视觉、文本分析、在线广告等领域均有广泛的应用,对行业发展具有极大的促进作用。随着信息技术的发展,数据规模不断扩大,复杂的高维数据使得传统的分析方法变得困难,以至于现有的深度学习模型在对复杂数据集进行分类预测时,常常出现预测性能不够理想的情况。在广告点击预测领域,通过引入聚类方法,充分利用数据内在的隐式关系,有助于构建更准确、鲁棒性更好的分类模型。 相似文献
11.
最小生成树数据描述方法在刻画高维空间样本点分布时,将所有图形的边作为新增虚拟样本以提供同类样本分布描述,这种描述存在分支多覆盖模型复杂,且局部覆盖不够合理的问题。针对该问题,依据特征空间中同类样本分布的连续性规律,提出基于高维空间典型样本Steiner最小树覆盖模型的一类分类算法,该算法首先对目标类训练集进行样本修剪,去除冗余信息和噪声信息,选择最具代表性的样本作为训练集,然后对保留的典型样本构建Steiner最小树覆盖模型。算法分析和仿真实验结果表明,相比最小生成树数据描述,文中提出的方法能在较低覆盖模型复杂度的前提下更合理的描述目标类样本空间分布,构建更合理的覆盖模型,在分类正确率和适用样本规模上都表现出一定的优越性。 相似文献
12.
在红外目标跟踪中,由于目标所处的背景信息复杂多变和目标外观的显著变化,单一的分类器不足以拟合多模态的数据。该文结合核相关滤波器(KCF)将多个核相关分类器通过集成学习整合到一个框架中。利用KCF分类器具有解析解的特点平衡跟踪鲁棒性与实时性之间的矛盾,从而解决单个分类器无法处理复杂背景与显著的外观变化问题,并显著提升目标跟踪的性能与稳定性。为了验证算法的有效性,该文利用两个核相关跟踪器联合学习出1个强分类器。大量的定性定量实验表明所提的算法的跟踪性能超过传统的KCF算法,且跟踪速度也超过大多数比较算法。 相似文献
13.
结合集成比例训练的彩色JPEG图像隐写分析 总被引:1,自引:0,他引:1
该文提出一种YCbCr颜色空间的彩色JPEG图像隐写分析方法。该方法中的特征包括通道内特征和通道间特征,首先从Y通道提取Markov特征,扩展DCT特征以及共生矩阵特征构成通道内特征集合,通道内特征可以有效捕捉到Y通道内DCT系数之间的相关性;然后对Y通道进行下采样,从采样平面与CbCr平面相互之间的差分平面上提取特征构成通道间特征集合,通道间特征可以捕捉到两两通道之间的相关性。由于通道内特征和通道间特征在分类性能上有着较大差别,在分类阶段由通道内特征和通道间特征分别训练子分类器,通过调整两类子分类器的比例,使用多数投票方式来合成集成判决结果,最终获得最佳的检测性能。实验结果表明,该方法不仅适合小嵌入率的彩色JPEG图像,而且在性能上优于已有的JPEG图像隐写分析方法。 相似文献
14.
随着机器学习被广泛的应用,其安全脆弱性问题也突显出来。该文提出一种基于粒子群优化(PSO)的对抗样本生成算法,揭示支持向量机(SVM)可能存在的安全隐患。主要采用的攻击策略是篡改测试样本,生成对抗样本,达到欺骗SVM分类器,使其性能失效的目的。为此,结合SVM在高维特征空间的线性可分的特点,采用PSO方法寻找攻击显著性特征,再利用均分方法逆映射回原始输入空间,构建对抗样本。该方法充分利用了特征空间上线性模型上易寻优的特点,同时又利用了原始输入空间篡改数据的可解释性优点,使原本难解的优化问题得到实现。该文对2个公开数据集进行实验,实验结果表明,该方法通过不超过7%的小扰动量生成的对抗样本均能使SVM分类器失效,由此证明了SVM存在明显的安全脆弱性。 相似文献
15.
基于视图的3维模型分类方法与深度学习融合能有效提升模型分类的准确率。但目前的方法将相同类别的3维模型所有视点上的视图归为一类,忽略了不同视点上的视图差异,导致分类器很难学习到一个合理的分类面。为解决这一问题,该文提出一个基于深度神经网络的3维模型分类方法。该方法在3维模型的周围均匀设置多个视点组,为每个视点组训练1个视图分类器,充分挖掘不同视点组下的3维模型深度信息。这些分类器共享1个特征提取网络,但却有各自的分类网络。为了使提取的视图特征具有区分性,在特征提取网络中加入注意力机制;为了对非本视点组的视图建模,在分类网络中增加了附加类。在分类阶段首先提出一个视图选择策略,从大量视图中选择少量视图用于分类,以提高分类效率。然后提出一个分类策略通过分类视图实现可靠的3维模型分类。在ModelNet10和ModelNet40上的实验结果表明,该方法在仅用3张视图的情况下分类准确率高达93.6%和91.0%。 相似文献
16.
The rapid growth of multimedia content necessitates powerful technologies to filter, classify, index and retrieve video documents more efficiently. However, the essential bottleneck of image and video analysis is the problem of semantic gap that low level features extracted by computers always fail to coincide with high-level concepts interpreted by humans. In this paper, we present a generic scheme for the detection video semantic concepts based on multiple visual features machine learning. Various global and local low-level visual features are systematically investigated, and kernel-based learning method equips the concept detection system to explore the potential of these features. Then we combine the different features and sub-systems on both classifier-level and kernel-level fusion that contribute to a more robust system. Our proposed system is tested on the TRECVID dataset. The resulted Mean Average Precision (MAP) score is much better than the benchmark performance, which proves that our concepts detection engine develops a generic model and performs well on both object and scene type concepts. 相似文献
17.
该文基于稀疏编码和集成学习提出了一种新的多示例多标记图像分类方法。首先,利用训练包中所有示例学习一个字典,根据该字典计算示例的稀疏编码系数;然后基于每个包中所有示例的稀疏编码系数计算包特征向量,从而将多示例多标记问题转化为多标记问题;最后利用多标记分类算法进行求解。为了提高分类器的泛化能力,对多个分类器进行集成。在多示例多标记图像数据集上的实验结果表明所提方法与其它方法相比有更好的性能。 相似文献
18.