共查询到10条相似文献,搜索用时 15 毫秒
1.
自适应局部线性降维方法 总被引:1,自引:0,他引:1
《计算机应用与软件》2013,(4)
高维数据降维方法已经被广泛应用在信息检索、模式识别、数据挖掘和人工智能等领域。针对目前流形学习方法的嵌入效果非常敏感于局部邻域的选取方式,提出一种自适应邻域选择的局部线性降维方法。该方法评估真实数据的固有维数,判断每一数据点的局部切方向,以便自适应地选择每一数据点的邻域数,使得不同数据集与邻域选取方式之间存在很好的自适应性,实现更好的降维效果。在人工生成数据集和医学数据上的仿真结果表明,该方法起到了良好的降维效果。 相似文献
2.
针对现有基于流形学习的降维方法对局部邻域大小选择的敏感性,且降至低维后的数据不具有很好的可分性,提出一种自适应邻域选择的数据可分性降维方法。该方法通过估计数据的本征维度和局部切方向来自适应地选择每一样本点的邻域大小;同时,使用映射数据时的聚类信息来汇聚相似的样本点,保证降维后的数据具有良好的可分性,使之实现更好的降维效果。实验结果表明,在人工生成的数据集上,新方法获得了较好的嵌入结果;并且在人脸的可视化分类和图像检索中得到了期望的结果。 相似文献
3.
针对线性降维技术应用于具有非线性结构的数据时无法得到令人满意的结果的问题,提出一种新的着重于保持高维空间局部最近邻信息的非线性随机降维算法(NNSE)。该算法首先在高维空间中通过计算样本点之间的欧氏距离找出每个样本点的最近邻点,接着在低维空间中产生一个随机的初始分布;然后通过将低维空间中的样本点不断向其最近邻点的平均位置移动,直到产生稳定的低维嵌入结果。与一种先进的非线性随机降维算法——t分布随机邻域嵌入(t-SNE)相比,NNSE算法得到的低维结果在可视化方面与t-SNE算法相差不大,但通过比较两者的量化指标可以发现,NNSE算法在保持最近邻信息方面上明显优于t-SNE算法。 相似文献
4.
样本点的边界信息对于分类具有重要意义。针对于边界Fisher分析(MFA)和局部敏感判别分析(LSDA)构造本征图和惩罚图所利用的样本点边界信息,在一些情况下并不能很好地表征不同类样本点的可分性,提出了一种新的图嵌入降维算法——边界流形嵌入(MME)。MME算法根据样本点的标签信息,寻找距离每个样本点最近的异类边界子流形,再返回本类中寻找距离异类边界子流形最近的同类边界子流形,从而定义出不同类样本间密切联系的同类边界邻域和异类边界邻域。通过最大化所有成对的边界子流形之间的距离,MME算法可以得到更具有鉴别意义的低维特征空间。同时,MME算法能将徘徊在边界的离群点收入到边界邻域里,这对减弱离群点给算法带来的负面的影响有一定的帮助。在人脸数据库上的实验结果表明了MME算法提取的低维特征能够提升分类的准确率。 相似文献
5.
为了有效地约简稀疏数据的维度,提出一种基于切空间判别的稀疏数据局部降维方法,其思想是扩展局部邻域,增大样本点间的重叠信息,使之在稀疏降维过程中通过充分的信息达到精确的低维嵌入;利用切空间判别的方法对扩展后局部区域的样本点进行选择保留,弃除切方向变化较大的点,使之实现更好的降维效果。实验结果表明,在人工生成的数据集上,新方法获得了较好的嵌入结果;并且在人脸识别与图像检索中得到了期望的可视化分类结果。 相似文献
6.
为解决局部线性嵌入算法(LLE)性能受初始邻域值大小和相似性度量选取的制约,提出一种基于密度和相关分量分析(relevant component analysis,RCA)的局部线性嵌入算法(DRLLE).对每一个样本点计算一个密度缩放因子,根据密度缩放因子对样本点的初始邻域值进行自适应调整,计算RCA距离作为LLE算法的相似性度量,得到样本点的近邻集,进行降维处理.将DRLLE和其它LLE改进算法在Swiss roll、Swiss roll hole和ORL数据库上进行对比实验,其结果表明,DRLLE算法具有良好的降维效果和识别性能. 相似文献
7.
8.
9.
采用目前方法对企业财务信息进行控制时,未考虑降维处理财务信息,导致财务内控的信息化建设受数据维数的影响较大,存在Kappa系数和特征贡献率低的问题。为此提出财务内控信息化方法探索。采用加权距离度量测度方法,降维处理财务信息,抑制干扰样本点并充分发挥样本点的贡献。通过自适应权重聚类算法,对降维处理后的财务数据进行聚类处理,获得谱系聚类树状图,实现企业财务内控信息化。实验结果表明,所提方法财务内控的信息化建设受数据维数的影响较小,Kappa系数和特征贡献率较高。 相似文献