摘 要: | 特征提取是处理高维数据的最有效工具之一。然而,当前特征提取方法存在两个问题:一是它们没有同时捕捉数据的局部和全局结构;二是构建的图脱离数据的聚类数,没有与聚类相同的连通分量。为了解决这些问题,提出了面向无监督特征提取的结构化图嵌入方法(structured graph embedding,SGE)。通过构建数据表征的K近邻和使用最小二乘回归,SGE能够同时保持数据的局部与全局相关结构。而且,SGE对表征图的拉普拉斯矩阵施加秩约束,使构建的最优图具有与c个聚类一致的c个连通分量,从而能揭示数据的聚类结构。因此,SGE能够找到更有判别力的投影。在多个真实数据集的实验表明,SGE优于其他主流降维方法。特别是在PIE数据集上,SGE的聚类精度比LRPP_GRR的聚类精度高出18.7%。这些结果表明SGE方法可以有效降低数据维数。
|