排序方式: 共有7条查询结果,搜索用时 15 毫秒
1
1.
在很多的机器学习和数据挖掘任务中,特征子集选择是重要的数据预处理步骤之一。提出一种基于图方法的无监督式特征选择方法(GBFS),构造一个以样本数据为顶点,数据间相似性作为边的图,再根据各特征的得分优先选择那些具有局部信息保持和全局区分能力的特征。实验结果表明,基于该方法选择的特征子集,在大多数情况下都能取得较好的分类效果。 相似文献
2.
弱标记学习是多标记学习的一个重要分支,近几年已被广泛研究并被应用于多标记样本的缺失标记补全和预测等问题.然而,针对特征集合较大、更容易拥有多个语义标记和出现标记缺失的高维数据问题,现有弱标记学习方法普遍易受这类数据包含的噪声和冗余特征的干扰.为了对高维多标记数据进行准确的分类,提出了一种基于标记与特征依赖最大化的弱标记集成分类方法EnWL.EnWL首先在高维数据的特征空间多次利用近邻传播聚类方法,每次选择聚类中心构成具有代表性的特征子集,降低噪声和冗余特征的干扰;再在每个特征子集上训练一个基于标记与特征依赖最大化的半监督多标记分类器;最后,通过投票集成这些分类器实现多标记分类.在多种高维数据集上的实验结果表明,EnWL在多种评价度量上的预测性能均优于已有相关方法. 相似文献
3.
基于谱理论的特征选择算法FSST优先选择最具有局部信息保持能力和全局区分能力的特征.在实验分析该算法的基础上,采用分治策略对该算法最耗时的部分(规范化数据,构造Laplacian图和计算特征得分)进行并行化,从而提出一种基于谱理论的并行特征选择算法PFSST(Parallel Feature Selection with Spectral Theory),在多核系统上的实验证明了PFSST的并行有效性. 相似文献
5.
6.
维数灾难是机器学习算法在高维数据上学习经常遇到的难题,基于局部保持的投影方法(Locality Preserving Projection,LPP),可以很好地解决维数灾难难题。然而传统LPP的相似性度量方法对噪音敏感,为此利用鲁棒路径相似的度量方法,提出一种增强的局部保持投影方法。在高维流形数据上的降维实验证实了该方法对噪声和离群点的有效性。 相似文献
7.
为了克服保局投影方法(locality preserving projection,LPP)对噪音敏感,有效性依赖于近邻图构造等缺点,提出一种基于集成图的保局投影方法(graphs ensemble based LPP,GELPP).该方法先根据鲁棒统计原理定义出对噪声鲁棒的样本间相似性度量,再以该度量为基础构造多个近似的最大生成树;然后利用集成学习泛化能力强的优点来组合多个树为一个集成图;最后通过替换LPP的近邻图和相似性度量来进行保局投影.在高维人脸图像上的降维实验结果表明,该方法对噪声鲁棒,以及在集成图上降维的有效性. 相似文献
1