首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
自适应局部线性降维方法   总被引:1,自引:0,他引:1  
高维数据降维方法已经被广泛应用在信息检索、模式识别、数据挖掘和人工智能等领域。针对目前流形学习方法的嵌入效果非常敏感于局部邻域的选取方式,提出一种自适应邻域选择的局部线性降维方法。该方法评估真实数据的固有维数,判断每一数据点的局部切方向,以便自适应地选择每一数据点的邻域数,使得不同数据集与邻域选取方式之间存在很好的自适应性,实现更好的降维效果。在人工生成数据集和医学数据上的仿真结果表明,该方法起到了良好的降维效果。  相似文献   

2.
李冬睿  许统德 《计算机应用》2012,32(8):2253-2257
针对现有基于流形学习的降维方法对局部邻域大小选择的敏感性,且降至低维后的数据不具有很好的可分性,提出一种自适应邻域选择的数据可分性降维方法。该方法通过估计数据的本征维度和局部切方向来自适应地选择每一样本点的邻域大小;同时,使用映射数据时的聚类信息来汇聚相似的样本点,保证降维后的数据具有良好的可分性,使之实现更好的降维效果。实验结果表明,在人工生成的数据集上,新方法获得了较好的嵌入结果;并且在人脸的可视化分类和图像检索中得到了期望的结果。  相似文献   

3.
针对线性降维技术应用于具有非线性结构的数据时无法得到令人满意的结果的问题,提出一种新的着重于保持高维空间局部最近邻信息的非线性随机降维算法(NNSE)。该算法首先在高维空间中通过计算样本点之间的欧氏距离找出每个样本点的最近邻点,接着在低维空间中产生一个随机的初始分布;然后通过将低维空间中的样本点不断向其最近邻点的平均位置移动,直到产生稳定的低维嵌入结果。与一种先进的非线性随机降维算法——t分布随机邻域嵌入(t-SNE)相比,NNSE算法得到的低维结果在可视化方面与t-SNE算法相差不大,但通过比较两者的量化指标可以发现,NNSE算法在保持最近邻信息方面上明显优于t-SNE算法。  相似文献   

4.
样本点的边界信息对于分类具有重要意义。针对于边界Fisher分析(MFA)和局部敏感判别分析(LSDA)构造本征图和惩罚图所利用的样本点边界信息,在一些情况下并不能很好地表征不同类样本点的可分性,提出了一种新的图嵌入降维算法——边界流形嵌入(MME)。MME算法根据样本点的标签信息,寻找距离每个样本点最近的异类边界子流形,再返回本类中寻找距离异类边界子流形最近的同类边界子流形,从而定义出不同类样本间密切联系的同类边界邻域和异类边界邻域。通过最大化所有成对的边界子流形之间的距离,MME算法可以得到更具有鉴别意义的低维特征空间。同时,MME算法能将徘徊在边界的离群点收入到边界邻域里,这对减弱离群点给算法带来的负面的影响有一定的帮助。在人脸数据库上的实验结果表明了MME算法提取的低维特征能够提升分类的准确率。  相似文献   

5.
为了有效地约简稀疏数据的维度,提出一种基于切空间判别的稀疏数据局部降维方法,其思想是扩展局部邻域,增大样本点间的重叠信息,使之在稀疏降维过程中通过充分的信息达到精确的低维嵌入;利用切空间判别的方法对扩展后局部区域的样本点进行选择保留,弃除切方向变化较大的点,使之实现更好的降维效果。实验结果表明,在人工生成的数据集上,新方法获得了较好的嵌入结果;并且在人脸识别与图像检索中得到了期望的可视化分类结果。  相似文献   

6.
为解决局部线性嵌入算法(LLE)性能受初始邻域值大小和相似性度量选取的制约,提出一种基于密度和相关分量分析(relevant component analysis,RCA)的局部线性嵌入算法(DRLLE).对每一个样本点计算一个密度缩放因子,根据密度缩放因子对样本点的初始邻域值进行自适应调整,计算RCA距离作为LLE算法的相似性度量,得到样本点的近邻集,进行降维处理.将DRLLE和其它LLE改进算法在Swiss roll、Swiss roll hole和ORL数据库上进行对比实验,其结果表明,DRLLE算法具有良好的降维效果和识别性能.  相似文献   

7.
非线性降维方法是目前对降维研究有着重要影响的方法,但在降维过程中经常会遇到局部邻域信息量不足、短路和噪声干扰等问题,严重影响降维效果,很难广泛应用于真实数据的处理中.对以上问题分析发现,其主要原因在于经典降维算法都是采用全局固定的邻域大小.提出了一种基于压缩感知的邻域优化算法,运用压缩感知技术对高维空间目标点近邻进行压缩采样,构建“收—放”模型,自适应得到最优子空间,同时优化邻域组成元素,使得数据的整体降维效果更加稳定.通过手工流形和真实数据集的实验,验证了算法的有效性和稳定性.  相似文献   

8.
扩散映射(diffusion maps)是一种基于流形学习的非线性降维方法。为了提高降维的效果, 根据近邻点的选取对diffusion maps的降维效果影响, 利用数据近邻点分布的不同, 挖掘该数据点局部的密度信息, 能够更好地保持数据的流形结构。利用样本点聚类后的类别信息构造密度信息指数, 提出了一种改进的diffusion maps算法, 有效地保持了高维数据中的流形结构, 所提的新算法在多种实验中得到了证实。  相似文献   

9.
采用目前方法对企业财务信息进行控制时,未考虑降维处理财务信息,导致财务内控的信息化建设受数据维数的影响较大,存在Kappa系数和特征贡献率低的问题。为此提出财务内控信息化方法探索。采用加权距离度量测度方法,降维处理财务信息,抑制干扰样本点并充分发挥样本点的贡献。通过自适应权重聚类算法,对降维处理后的财务数据进行聚类处理,获得谱系聚类树状图,实现企业财务内控信息化。实验结果表明,所提方法财务内控的信息化建设受数据维数的影响较小,Kappa系数和特征贡献率较高。  相似文献   

10.
扩散映射(Diffusion Maps)是一种基于流形学习的非线性降维方法。基于对扩散映射的研究,提出了一种新的非线性降维算法。根据近邻点分布的不同和模糊聚类原理,新算法定义了扩散映射算法构建权值矩阵的误差近似系数,并采用改进的距离公式来选取样本点的近邻点,很大程度地降低了近邻点的选取对降维效果的影响。实验结果表明,新算法有效地保持了高维数据中的流形结构,具有更好的降维效果,并在基于内容的图像检索中达到很高的查准率,新算法的有效性和优越性得到了证实。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号