共查询到18条相似文献,搜索用时 453 毫秒
1.
2.
3.
分析了传统的主成分分析方法的不足,论述了KPCA方法及其时间复杂度高的缺陷。在此基础上,提出基于核函数构造的协方差矩阵的主成分分析,相比 KPCA,该方法具有快的降维速度。实验结果显示:把该方法用于QAR数据具有良好的降维效果和高分类正确率。 相似文献
4.
主成分分析PCA(PrincipleComponentAnalysis)是一种重要的分析方法,广泛应用于图像检索、机器学习、模式识别等领域。随着近年来数据维数越来越大,算法的稳定性、时间复杂度和内存使用成了PCA进一步应用所必须要解决的问题。为此提出一种快速算法,该算法利用随机矩阵构造卷数据降维矩阵,在保持点与点之间“核距离”不变的情况下,将待分解矩阵变换成一个低维矩阵。在没有偏差的情况下,将对原始大矩阵的分解变成对这个低维矩阵的分解,大幅降低了时间复杂度,减少了对内存的使用,同时增加了算法的稳定性,从而在根本上解决了上述3个问题。 相似文献
5.
6.
全局与局部判别信息融合的转子故障数据集降维方法研究 总被引:1,自引:0,他引:1
针对传统的数据降维方法无法兼顾保持全局特征信息与局部判别信息的问题,提出一种核主元分析(Kernel principal component analysis,KPCA)和正交化局部敏感判别分析(Orthogonal locality sensitive discriminant analysis,OLSDA)相结合的转子故障数据集降维方法.该方法首先利用KPCA算法有效降低数据集的相关性、消除冗余属性,由此实现了最大程度地保留原始数据全局非线性信息的作用;然后利用OLSDA算法充分挖掘出数据的局部流形结构信息,达到了提取出具有高判别力低维本质特征的目的.上述方法的特点是通过同时进行的正交化处理可避免局部子空间结构发生失真,采用三维图直观显示出低维结果,以低维特征子集输入最近邻分类器(K-nearest neighbor,KNN)的识别率和聚类分析之类间距Sb、类内距Sw作为衡量降维效果的指标.实验表明该方法能够全面地提取出全局与局部判别信息,使故障分类更清晰,相应地识别准确率得到了明显提升.该研究可为解决高维和非线性机械故障数据集的可视化与分类问题,提供理论参考依据. 相似文献
7.
针对传统谱聚类算法难以应用于大规模高光谱图像,以及现有的改进谱聚类算法对大规模高光谱图像的处理效果不佳的问题,为降低聚类数据的复杂度,以降低聚类过程的计算成本从而多方面提升聚类性能,提出一种基于超像素锚图二重降维的高光谱聚类算法。首先,对高光谱数据进行主成分分析(PCA)处理,并针对高光谱图像的区域特性对其进行基于超像素切割的降维;其次,通过构造锚图的思想对上一步所得数据进行锚点的选取,并构建邻接锚图来实现二重降维,从而进行谱聚类;同时,为去除算法运行中人为调节参数的环节,在构建锚图时采用一种去除高斯核的无核锚图构造方式以实现自动构图。在Indian Pines数据集和Salinas数据集上的实验结果表明所提算法在保证可用性与低耗时的前提下可提高聚类的整体效果,从而验证了所提算法能提高聚类的质量与性能。 相似文献
8.
基于增量核主成分分析的数据流在线分类框架 总被引:4,自引:0,他引:4
核主成分分析(Kernel principal component analysis, KPCA)是一种非线性降维工具, 在降低数据流分类处理量方面发挥着积极作用. 然而, 由于复杂性太高, 导致KPCA的降维能力有限. 为此, 本文给出了一种增量核主成分分析算法(Incremental KPCA for dimensionality-reduction, IKDR), 该算法在每步迭代估计中只需线性内存开销, 大大降低了复杂性. 在IKDR的基础上, 结合BP (Back propagation)神经网络提出了数据流在线分类框架: IKOCFrame (Online classification frame based on IKDR). 通过一系列真实和人工数据集上的实验, 检验了IKDR算法的收敛性, 并且验证了IKOCFrame相对于同类基于成分分析的分类算法的优越性. 相似文献
9.
10.
数据降维方法分析与研究 * 总被引:9,自引:0,他引:9
全面总结现有的数据降维方法,对具有代表性的降维方法进行了系统分类,详细地阐述了典型的降维 方法,并从算法的时间复杂度和优缺点两方面对这些算法进行了深入的分析和比较。最后提出了数据降维中仍 待解决的问题。 相似文献
11.
12.
提出利用非线性特征提取(核主成分分析(KPCA)和核独立成分分析)消除数据的不相关性,降低维数。核主成分分析利用核函数把输入数据映射到特征空间,进行线性主成分分析计算提取特征;核独立成分分析在KPCA白化空间进行线性独立成分分析(ICA)变换提取独立成分。提取的特征作为最小二乘支持向量机分类器的输入,构建融合非线性特征提取和最小二乘支持向量机的智能故障分类方法。研究了该方法应用到某石化企业润滑油生产过程的故障诊断中的有效性和可行性。 相似文献
13.
《国际计算机数学杂志》2012,89(5):956-968
Principal component analysis (PCA) is well recognized in dimensionality reduction, and kernel PCA (KPCA) has also been proposed in statistical data analysis. However, KPCA fails to detect the nonlinear structure of data well when outliers exist. To reduce this problem, this paper presents a novel algorithm, named iterative robust KPCA (IRKPCA). IRKPCA works well in dealing with outliers, and can be carried out in an iterative manner, which makes it suitable to process incremental input data. As in the traditional robust PCA (RPCA), a binary field is employed for characterizing the outlier process, and the optimization problem is formulated as maximizing marginal distribution of a Gibbs distribution. In this paper, this optimization problem is solved by stochastic gradient descent techniques. In IRKPCA, the outlier process is in a high-dimensional feature space, and therefore kernel trick is used. IRKPCA can be regarded as a kernelized version of RPCA and a robust form of kernel Hebbian algorithm. Experimental results on synthetic data demonstrate the effectiveness of IRKPCA. 相似文献
14.
针对人脸检测数据集中的信息均为高维特征向量且人脸识别易受表情变化影响等问题,本文提出一种基于测地距离的KPCA人脸识别方法,该方法利用非线性方法提取主成分。先采用KPCA方法把人脸数据映射到高维空间,进而在高维空间中提取人脸的主成分,其中核函数为多项式核函数;然后引入测地距离替换原来的欧氏距离进行相似度量,其能更准确地测量出两像素点间的实际距离,使得人脸识别率受表情变化影响小。该方法不但可以实现降维,而且还能达到有效提取特征的目的。在ORL人脸库上的实验结果表明,该方法的识别率明显优于PCA、KPCA等方法的识别率。 相似文献
15.
主成份分析法是用于简化数据的一种技术,现实世界中的数据复杂且庞大,对于某些复杂数据就可应用主成分分析法对其进行简化。文中着重介绍了健壮性KPCA算法并引入了粒度的思想,健壮性KPCA算法能推导出特征空间中信号重组的最小错误标准,并自动识别训练样本集中的无关数据,且经过计算消除它们对KPCA算法准确度的影响。可以将其应用于股票数据中,并将所得的主分量图与原图比较,发现效果明显,由此可看出KPCA算法是一种相当有用的算法。 相似文献
16.
The Principal Component Analysis (PCA) is a powerful technique for extracting structure from possibly high-dimensional data
sets. It is readily performed by solving an eigenvalue problem, or by using iterative algorithms that estimate principal components.
This paper proposes a new method for online identification of a nonlinear system modelled on Reproducing Kernel Hilbert Space
(RKHS). Therefore, the PCA technique is tuned twice, first we exploit the Kernel PCA (KPCA) which is a nonlinear extension
of the PCA to RKHS as it transforms the input data by a nonlinear mapping into a high-dimensional feature space to which the
PCA is performed. Second, we use the Reduced Kernel Principal Component Analysis (RKPCA) to update the principal components
that represent the observations selected by the KPCA method. 相似文献
17.
叙述了传统的PCA方法在处理QAR数据相似性问题的不足,提出基于EROS的KPCA方法处理QAR数据之间的相似性问题。通过引入EROS方法而不需要对数据进行向量化,引入核矩阵对QAR数据进行主成分分析,可以有效降低数据的维数。选取两组QAR数据集,采用支持向量积方法,选用不同数目的主成分进行分类实验,同SPCA方法和GPCA方法进行比较,实验结果显示把该方法运用到QAR数据集,具有较好的分类结果。 相似文献