首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 125 毫秒
1.
广泛应用的第一主成分是对数据集的一维线性最优描述,主曲线是第一主成分的非线性推广。线性主成分分析是一种线性分析方法,而数据通常是非线性的。用线性方法分析非线性数据在分析能力上常常是受限的。为此在对线性主成分分析非线性数据研究的基础上,提出了一种新的非线性成分分析方法,即主曲线成分分析。该方法从数据本身出发进行非线性分析,强调非参数特性,能有效地建模非线性数据。实现主曲线成分分析时,采用了改进的神经网络建模方法,该建模方法以其较强的近似性能很好地表达了非线性关系。仿真实验结果表明,主曲线成分分析能很好地解决非线性主成分问题,应用前景广阔。  相似文献   

2.
HS主曲线的数学特性   总被引:2,自引:0,他引:2  
主曲线被定义作穿过多维数据分布“中间”的满足“自相合”的光滑曲线,它是第一主成分的非线性推广,第一主成分是对数据集的一维线性最优描递。HS主曲线强调非参数模型,对其参数无关性本文给出了具体证明。同时为了全面理解主曲线,本文以空间主曲线为例,分析了它的横截性质。  相似文献   

3.
信息复合的目的是为了把多种遥感器数据的特性进行互补。复合图像与原图像相比,既具有多光谱特性,而且空间分辨率也得到了提高,这样它更有利于目视判读或计算机自动化处理。运用主成分变换-逆变换的方法对ADEOSAVNIR的多光谱数据(16 m)和全色波段数据(8 m)进行了复合研究。即先对多光谱图像进行主成分变换,求出第一主成分。然后用全色波段数据取代第一主成分并进行主成分逆变换得到所需的复合图像。复合图像的空间分辨率为8 m,而且具有4个波段。  相似文献   

4.
王真  曹立明 《计算机科学》2007,34(2):227-229
主曲线是一种用于数据压缩和特征提取的有效方法,是对主成分分析的非线性推广。由于主曲线与主成分的密切联系,主曲线生成算法通常以第二主成分线做初始值。然而实验发现第一主成分未必是算法初始化的最佳选择。本文将以HS算法和多边形算法为例,就初始值的选取对生成主曲线的影响做出分析并通过实验得出结论:HS算法以原点作初值效果较好,多边彤算法应根据数据点集的不同结构选择合适的初值。  相似文献   

5.
祁云篙  孙怀江 《计算机科学》2010,37(12):203-205
提出了一种基于主曲线(principal curves)的微阵列数据分类方法(PC)。主曲线是第一主成分的非线性推广,它是数据集合的“骨架”,数据集合是主曲线的“云”。基于主曲线的微阵列数据分类方法,首先利用专门设计的算法在训练数据集上计算出每类样本的主曲线,然后根据测试样本与各类样本主曲线距离的期望方差来确定测试样本所属的类别。实验结果表明,该分类方法在进行小样本微阵列数据分类时性能优于现有的方法。  相似文献   

6.
多时机NOAA—AVHRR数据主成分分析的生物学意义   总被引:3,自引:0,他引:3       下载免费PDF全文
利用多时上NOAA-AVHRR的中国归一化植被指数NDVI数据进行主成分分析,并与从NDVI派生的4个生物不数作相关分析,结果表明:主成分变换既压缩了信息,将21个月的信息主要压缩到前4个主分量,又提取了关键的变化信息,第一主分量反映基本植被覆信息,第二、第三和第四主分量反映植被季相变化信息,正是由于一年12个月的NDVI曲线反映了植被季相变化特征,使得主成分变换得到的各主分量具有一定的生物学意义,而且17种中国典型植被在这4个主分量图像上存在一定的差异性,使其具有进行较高精度土地覆盖分类的潜力。  相似文献   

7.
传统的主曲线算法在小规模数据集上能获得良好的效果,但单节点的计算和存储能力都不能满足海量数据主曲线的提取要求,而算法分布式并行化是目前解决该类问题最有效的途径之一。本文提出基于MapReduce框架的分布式软K段主曲线算法 (Distributed soft k-segments principal curve,DisSKPC)。首先,基于分布式K-Means算法,采用递归粒化方法对数据集进行粒化,以确定粒的大小并保证粒中数据的关联性。然后调用软K段主曲线算法计算每个粒数据的局部主成分线段,并提出用噪声方差来消除在高密集、高曲率的数据区域可能产生的过拟合线段。最后借助哈密顿路径和贪婪算法连接这些局部主成分线段,形成一条通过数据云中间的最佳曲线。实验结果表明,本文所提出的DisSKPC算法具有良好的可行性和扩展性。  相似文献   

8.
针对矿山排土场滑坡的过程是一个动态、大延迟、情况复杂的特性问题,影响矿山排土场滑坡的因素众多,各个特性指标间相互影响,而关于排土场滑坡预警并没有严格的划分标准,本文提出主成分关联长短期记忆(PCA-LSTM)网络模型,利用主成分分析和关联性分析,挖掘出所有特性指标当中的第一主成分,与第一主成分关联性较强的其它特性指标,将得到的其它特性指标和第一主成分作为预测排土场滑坡的主要特性指标,利用长短期记忆网络(LSTM)在处理时间序列问题能够将现有输入的信息与历史信息相互结合的特点;采用LSTM网络模型通过多个其它特性指标对第一主成分地表位移指标进行预测,并取得了较好的效果.  相似文献   

9.
要提高脱机手写字符识别的识别率,关键是特征的提取。主曲线是主成分分析的非线性推广,是通过数据分布“中间”并满足“自相合”的光滑曲线。通过对现有主曲线算法分析可知:软K段主曲线算法对提取出分布在弯曲度很大或相交曲线周围的数据的主曲线效果较好。因此本文尝试用谊主曲线算法来提取脱机手写字符的结构特征。实验结果表明,利用该主曲线算法来提取脱机手写字符的结构特征不但是可行的,而且取得较好的实验效果。它为脱机手写字符特征提取的研究提供了一条新途径。  相似文献   

10.
焦娜 《计算机科学》2017,44(9):49-52
车牌识别是智能交通系统的重要组成部分,提高车牌字符识别率的关键在于提取字符的特征。主曲线是主成分分析的非线性推广,它是通过数据分布“中间”并满足“自相合”的光滑曲线。通过对现有主曲线算法的分析可知:软K段主曲线算法对提取分布在弯曲度很大或相交曲线周围的数据的主曲线的效果较好。因此,尝试用该主曲线算法来提取车牌字符的结构特征。实验结果表明,利用该主曲线算法来提取车牌识别的结构特征能够取得较好的实验效果。所提方法为提取 车牌字符特征的研究提供了一条新途径。  相似文献   

11.
传统的主曲线算法已被广泛应用到很多领域,但在复杂数据的主曲线提取上效果不佳,而有效的融合粒计算与主曲线学习算法是解决该类问题最有效的途径之一。为此,本文提出了基于粒计算的复杂数据多粒度主曲线提取算法。首先,利用基于t最近邻(T-nearest-neighbors, TNN)的谱聚类算法对数据进行粒化,提出拐点估计方法来自动确定粒的个数;然后调用软K段主曲线算法对每个粒进行局部主曲线提取,并提出通过消除假边来优化每个粒的主曲线提取过程;最后采用局部到全局的策略进行多粒度主曲线提取,并对过拟合线段进行优化,最终形成一条能较好描述数据原始分布形态的主曲线。实验结果表明该算法是一种行之有效的多粒度主曲线提取算法。  相似文献   

12.
Feng Zhang 《Machine Learning》2005,61(1-3):105-127
This article addresses the problem of identifying multiple linear and nonlinear patterns from multivariate noisy data represented by an additive model. Following the proposed nonlinear model, the blind source separation (BSS) criterion, as a function of high-order cumulants, is shown to produce a block-structured joint cumulant matrix by an orthogonal rotation. An intuitive interpretation of this criterion is to rotate the elements of whitened principal component analysis (PCA) scores such that they are as independent as possible. The resulting optimal joint cumulant matrix contains diagonal “blocks” that correspond to the linear and nonlinear patterns caused by independent sources, from which linear patterns are recognized as in linear BSS. The nonlinear patterns are identified by extracting their lower-dimensional manifolds via the principal curves method and then transforming back to the original data space. As illustrated in the experimental study, the estimated linear and nonlinear patterns will provide more accurate diagnosing of the root causes that contribute to the observed variability in multivariate manufacturing. Editor: Dale Schuurmans  相似文献   

13.
为了解决多维数据的维数过高、数据量过大带来的平行坐标可视化图形线条密集交叠以及数据规律特征不易获取的问题,提出基于主成分分析和K-means聚类的平行坐标(PCAKP,principal component analysis and k-means clustering parallel coordinate)可视化方法。该方法首先对多维数据采用主成分分析方法进行降维处理,其次对降维后的数据采用K-means聚类处理,最后对聚类得到的数据采用平行坐标可视化技术进行可视化展示。以统计局网站发布的数据为测试数据,对PCAKP可视化方法进行测试,与传统平行坐标可视化图形进行对比,验证了PCAKP可视化方法的实用性和有效性。  相似文献   

14.
高效的数据过滤是减少距离函数计算次数的捷径.提出了一种高效处理高维数据的索引算法-在空间映射的基础上,选取信息蕴含丰富的一组维为主维,结合三角不等式完成数据过滤,实现分层聚类、分级索引,构成一种基于主维过滤的索引结构:PD-Tree.用方差覆盖权对主维的信息保持量做了定量分析.不同数据规模下的实验均显示:PD-Tree进一步减少了距离函数的计算次数,降低了CPU开销,提高了检索速度.  相似文献   

15.
模式特征的提取与选择是提高手写体字符识别率的关键因素。主曲线是主成分分析的非线性推广,它是通过数据分布“中间”并满足“自相合”的光滑曲线,能够很好地描述数据分布的结构特征。利用软K段主曲线算法提取训练数据的特征,在分析手写体字符结构特点的基础上,选出手写体字符识别所使用的粗分类与细分类特征,利用这些分类特征对手写字符进行识别。该方法在CEDAR手写体数字和字符数据库上的实验表明:选取的分类特征能够有效区分相似的手写体字符,提高手写字符的识别率,为脱机手写字符识别研究提供了一种新的方法。  相似文献   

16.
一种PCA算法及其应用   总被引:4,自引:0,他引:4  
张媛  张燕平 《微机发展》2005,15(2):67-68,72
主成分分析是用于简化数据的一种技术,对于某些复杂数据就可应用主成分分析法对其进行简化。文中所用到的是一种连续统一的主分量分析法,它利用特征结构的正交性,提取出用于下一主分量的初始权向量,并且任何一种适用于线性前向反馈神经网络的主分量分析法都可作为此算法中的权修正等式。最后,将这种PCA法与普通PCA法运用于股票数据之中进行比较,结果对比证明用此方法提取出的数据比以前有所改进。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号