首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
引入了拓扑邻域、拓扑结构和规则拓扑结构的概念.对拓扑邻域进行了理论分析,说明其是自适应的,随着维数的不断升高,趋于平凡拓扑邻域.为了寻求具有规则拓扑结构的低维数据集,构造了数据结构规则性的度量,提出了保持数据集拓扑结构不变的降维方法.该方法是节省参数的,降维结果是近似规则的.结果表明,它能更好的揭示数据集的结构.  相似文献   

2.
基于LLE方法的本征维数估计   总被引:1,自引:0,他引:1  
基于局部线性嵌入(LLE)方法所确定的数据集的拓扑结构和高维数据空间的距离特性,提出了自逼近度和可分离度的概念,然后利用二者构建了一种新的本征维数估计方法.这种估计方法揭示了LLE降维过程中涉及的数据维数与邻域大小的选取之间的内在关联.最后,通过与主成分分析(PCA)进行实例对比,说明这种方法更加合理,更能反映数据集的本征特性.  相似文献   

3.
李智杰  李昌华  姚鹏  刘欣 《计算机应用》2014,34(10):2891-2894
针对结构模式识别领域中通用图嵌入方法缺乏且计算复杂度较高的问题,基于空间句法理论提出一种融合多尺度特征的图嵌入方法。通过提取图的节点数、边数和智能度等全局特征、节点拓扑特征、边领域特征差异度和边拓扑特征差异度等局部特征和节点与边上的数值属性和符号属性等细节特征,利用多尺度直方图统计的方法构造描述图特征的特征向量,以此将桥梁将结构模式识别问题转化为统计模式识别问题,进而借助支持向量机(SVM)实现图的分类识别。实验结果表明,所提出的图嵌入方法在不同的图数据集上均具有较高的分类识别率。与其他图嵌入方法相比,该方法对图的拓扑表达能力强,并且可融合图的领域方面的非拓扑特征,通用性较好,计算复杂度较低。  相似文献   

4.
针对基于图卷积的自编码器模型对原始图属性和拓扑信息的保留能力有限、无法学习结构和属性之间深度关联信息等问题,提出基于多通道图卷积自编码器的图表示学习模型。设计拓扑和属性信息保留能力实验,验证了基于图卷积的自编码器模型具备保留节点属性和拓扑结构信息的能力。构建特定信息卷积编码器和一致信息卷积编码器,提取图的属性空间特征、拓扑空间特征以及两者关联特征,生成属性嵌入、拓扑嵌入和一致性嵌入,同时建立与编码器对称的卷积解码器,还原编码器过程。使用重构损失、局部约束和一致性约束,优化各编码器生成的低维嵌入表示。最终将蕴含不同图信息的多种嵌入进行融合,生成各节点的嵌入表示。实验结果表明,该模型在BlogCatalog和Flickr数据集上节点分类的Micro-F1和Macro-F1明显高于基线模型,在Citeseer数据集上节点聚类的精度和归一化互信息相比于表现最优的基线模型提升了11.84%和34.03%。上述实验结果证明了该模型采用的多通道方式能够在低维嵌入中保留更丰富的图信息,提升图机器学习任务的性能表现。  相似文献   

5.
传统多维标度方法学习得到的低维嵌入保持了数据点的拓扑结构,但忽略了低维嵌入数据类别间的判别性。基于此,提出一种基于多维标度法的无监督判别性特征学习方法——判别多维标度模型(DMDS),该模型能在学习低维数据表示的同时发现簇结构,并通过使同簇的低维嵌入更接近,让学习到的数据表示更具有判别性。首先,设计了DMDS对应的目标公式,体现所学习特征在保留拓扑性的同时增强判别性;其次,对目标函数进行了推理和求解,并根据推理过程设计所对应的迭代优化算法;最后,在12个公开的数据集上对聚类平均准确率和平均纯度进行对比实验。实验结果表明,根据Friedman统计量综合评价DMDS在12个数据集上的性能优于原始数据表示和传统多维标度模型的数据表示,它的低维嵌入更具有判别性。  相似文献   

6.
随着现代网络通信和社会媒体等技术的飞速发展,网络化的大数据由于缺少高效可用的节点表示而难以应用。将高维稀疏难于应用的网络数据转化为低维、紧凑、易于应用的节点表示的网络嵌入方法受到广泛关注。然而已有网络嵌入方法得到节点低维特征向量后,再将其作为其他应用(节点分类、社区发现、链接预测、可视化等)的输入来作进一步分析,没有针对具体应用构建模型,难以取得满意的结果。针对网络社区发现这一具体应用,提出结合社区结构优化进行节点低维特征表示的深度自编码聚类模型CADNE。首先基于深度自编码模型,通过保持网络局部及全局链接的拓扑特性来学习节点的低维表示,然后利用网络聚类结构对节点低维表示进一步优化。该方法同时学习节点的低维表示和节点所属社区的指示向量,使节点的低维表示不仅能保持原始网络结构中的拓扑结构特性,而且能保持节点的聚类特性。与已有的经典网络嵌入方法进行对比,结果显示CADNE模型在Citeseer和Cora上取得最优聚类结果,在20NewsGroup上准确率提升最高达0.525;分类性能在Blogcatalog、Citeseer数据集上取得最好结果,在Blogcatalog上训练比例20%时比基线方法提升最高达0.512;并且CADNE模型在可视化对比中能够得到类边界更加清晰的节点低维表示,验证了所提方法具有较好的节点低维表示能力。  相似文献   

7.
邵超  万春红 《计算机应用》2013,33(7):1917-1921
针对自组织映射(SOM)在学习和可视化高维数据内在的低维流形结构时容易产生“拓扑缺陷”的这一问题,提出了一种新的流形学习算法——动态自组织映射(DSOM)。该算法按照数据的邻域结构逐步扩展训练数据集合,对网络进行渐进训练,以避免局部极值,克服“拓扑缺陷”问题;同时,网络规模也随之动态扩展,以降低算法的时间复杂度。实验表明,该算法能更加真实地学习和可视化高维数据内在的低维流形结构;此外,与传统的流形学习算法相比,该算法对邻域大小和噪声也更加鲁棒。所提算法的网络规模和训练数据集合都将按照数据内在的邻域结构进行同步扩展,从而能更加简洁并真实地学习和可视化高维数据内在的低维流形结构。  相似文献   

8.
目前大多数流形学习算法无法获取高维输入空间到低维嵌入空间的映射,无法处理新增数据,因此无增量学习能力。而已有的增量流形学习算法大多是通过扩展某一特定的流形学习算法使其具备增量学习能力,不具有通用性。针对这一问题,提出了一种通用的增量流形学习(GIML)算法。该方法充分考虑流形的局部平滑性这一本质特征,利用局部主成分分析法来提取数据集的局部平滑结构,并寻找包含新增样本点的局部平滑结构到对应训练数据的低维嵌入坐标的最佳变换。最后GIML算法利用该变换计算新增样本点的低维嵌入坐标。在人工数据集和实际图像数据集上进行了系统而广泛的比较实验,实验结果表明GIML算法是一种高效通用的增量流形学习方法,且相比当前主要的增量算法,能更精确地获取增量数据的低维嵌入坐标。  相似文献   

9.
无线 Mesh网络规则拓扑结构与容量研究*   总被引:1,自引:0,他引:1  
拓扑控制技术可以有效地提高无线Mesh网络的网络容量并增强网络可靠性,采用拓扑控制所构成的规则网络拓扑结构还具有良好网络路由和链路分集能力。通过对随机拓扑和规则拓扑的网络容量与拓扑特征的分析,表明规则拓扑在无线Mesh网络中具有优良网络品质。为了使规则拓扑适应密集组网的应用环境,设计一种虚拟层次化的规则拓扑结构;进一步通过拓扑分割构成微虚拟小区解决网络的可扩展性问题。仿真证明规则拓扑及其拓扑分割技术提高了无线Mesh网络容量等网络性能。  相似文献   

10.
现有的非负矩阵分解方法(NMF)还存在一些不足之处。一方面,NMF方法直接在高维原始图像数据集上计算它的低维表示,而实际上原始图像数据集的有效信息常常隐藏在它的低秩结构中;另一方面,NMF方法还存在对噪声数据和不可靠图敏感以及鲁棒性差的缺点。为了解决这些问题,提出了一种非负低秩图嵌入算法(NLGE),该算法同时考虑了原始图像数据的几何信息和有效低秩结构,使得其鲁棒性有了进一步的提高。此外,还给出了一种求解NLGE算法的迭代规则,并进一步证明了该求解算法的收敛性。最后,在ORL、CMU PIE、YaleB和USPS数据库上的实验结果表明了NLGE算法的有效性。  相似文献   

11.
几种流形学习算法的比较研究   总被引:1,自引:0,他引:1  
如何发现高维数据空间流形中有意义的低维嵌入信息是流形学习的主要目的。目前,大部分流形学习算法都是用于非线性维数约简或是数据可视化的,如等距映射(Isomap),局部线性嵌入算法(LLE),拉普拉斯特征映射算(laplacian Eigenmap)等等,文章对这三种流形学习算法进行实验分析与比较,目的在于了解这几种流形学习算法的特点,以便更好地进行数据的降维与分析。  相似文献   

12.
杨红敏  何丕廉 《计算机仿真》2007,24(11):221-223
提出了一种基于增量式拉普拉斯嵌入和支持向量机的图像识别方法,该方法首先利用增量式拉普拉斯特征映射对数据点进行维数约减和特征提取;再应用以统计学习理论为基础的支持向量机对图像进行分类识别.在降维过程中,该方法能够最优保持原始空间数据点的局部信息,克服了PCA降维算法从全局考虑而丢失局部信息的缺点,并且对测试集的嵌入坐标增量式计算的特点很好地减少了运算量.实验证明,该方法的图像识别率明显高于传统的PCA线性降维方法,具有可行性.  相似文献   

13.
In this study, a new Locally Linear Embedding (LLE) algorithm is proposed. Common LLE includes three steps. First, neighbors of each data point are determined. Second, each data point is linearly modeled using its neighbors and a similarity graph matrix is constructed. Third, embedded data are extracted using the graph matrix. In this study, for each data point mutual neighborhood conception and loading its covariance matrix diagonally are used to calculate the linear modeling coefficients. Two data points will be named mutual neighbors, if each of them is in the neighborhood of the other. Diagonal loading of the neighboring covariance matrix is applied to avoid its singularity and also to diminish the effect of noise in the reconstruction coefficients. Simulation results demonstrate the performance of applying mutual neighborhood conception and diagonal loading and their combination. Also, the results of applying the mutual neighborhood on Laplacian Eigenmap (LEM) demonstrate the good performance of the proposed neighbor selection method. Our proposed method improves recognition rate on Persian handwritten digits and face image databases.  相似文献   

14.
半监督拉普拉斯特征映射算法   总被引:1,自引:0,他引:1  
为了使流形学习方法具有半监督的特点,利用流形上某些已知低维信息的数据去学习推测出其它数据的低维信息,扩大流形学习算法的应用范围,把拉普拉斯特征映射算法(Laplacian Eigenmap,LE)与半监督的机器学习相结合,提出一种半监督的拉普拉斯特征映射算法(semi-supervised Laplacian Eigenmap,SSLE),这种半监督的流形学习算法在分类识别等问题上,具有很好的效果.模拟实验和实际例子都表明了SSLE算法的有效性.  相似文献   

15.
基于拉普拉斯特征映射的分类器设计   总被引:1,自引:1,他引:0       下载免费PDF全文
周梅  刘秉瀚 《计算机工程》2009,35(16):178-179
引用监督学习策略,定义类内和类间不同的距离度量方式,以替代原来的欧式距离度量,实现对拉普拉斯特征映射算法的改进。将降维之后的结果作为BP神经网络的输入,实现分类。实验结果表明,基于改进的拉普拉斯特征映射算法降维之后的结果,减少了神经网络的训练时间,具有较好的分类正确率。  相似文献   

16.
Unsupervised feature selection is fundamental in statistical pattern recognition, and has drawn persistent attention in the past several decades. Recently, much work has shown that feature selection can be formulated as nonlinear dimensionality reduction with discrete constraints. This line of research emphasizes utilizing the manifold learning techniques, where feature selection and learning can be studied based on the manifold assumption in data distribution. Many existing feature selection methods such as Laplacian score, SPEC(spectrum decomposition of graph Laplacian), TR(trace ratio) criterion, MSFS(multi-cluster feature selection) and EVSC(eigenvalue sensitive criterion) apply the basic properties of graph Laplacian, and select the optimal feature subsets which best preserve the manifold structure defined on the graph Laplacian. In this paper, we propose a new feature selection perspective from locally linear embedding(LLE), which is another popular manifold learning method. The main difficulty of using LLE for feature selection is that its optimization involves quadratic programming and eigenvalue decomposition, both of which are continuous procedures and different from discrete feature selection. We prove that the LLE objective can be decomposed with respect to data dimensionalities in the subset selection problem, which also facilitates constructing better coordinates from data using the principal component analysis(PCA) technique. Based on these results, we propose a novel unsupervised feature selection algorithm,called locally linear selection(LLS), to select a feature subset representing the underlying data manifold. The local relationship among samples is computed from the LLE formulation, which is then used to estimate the contribution of each individual feature to the underlying manifold structure. These contributions, represented as LLS scores, are ranked and selected as the candidate solution to feature selection. We further develop a locally linear rotation-selection(LLRS) algorithm which extends LLS to identify the optimal coordinate subset from a new space. Experimental results on real-world datasets show that our method can be more effective than Laplacian eigenmap based feature selection methods.  相似文献   

17.
对点目标的图像变化检测,现有的变化检测技术结果往往存在着虚警过大的问题。通过深入分析多个传统的变化检测方法的特点,利用各方法的互补性,提出了利用Laplacian Eigenmap对多个方法检测结果进行降维分类的优化技术。首先把各个方法对某个像素的检测结果用向量的形式进行表示,然后利用Laplacian Eigenmap对整个图像的数据流形在低维空间展开,最后利用模糊分类进行分类。该技术有两个优势:(1)在保证现有较高检测率的同时,大大降低了结果的虚警率;(2)它极大地降低了在传统方法中由于人为阈值取舍带来的偏差风险。但该技术的不足之处是增加了计算量。  相似文献   

18.
In this paper, two significant weaknesses of locally linear embedding (LLE) applied to computer vision are addressed: “intrinsic dimension” and “eigenvector meanings”. “Topological embedding” and “multi-resolution nonlinearity capture” are introduced based on mathematical analysis of topological manifolds and LLE. The manifold topological analysis (MTA) method is described and is based on “topological embedding”. MTA is a more robust method to determine the “intrinsic dimension” of a manifold with typical topology, which is important for tracking and perception understanding. The manifold multi-resolution analysis (MMA) method is based on “multi-resolution nonlinearity capture”. MMA defines LLE eigenvectors as features for pattern recognition and dimension reduction. Both MTA and MMA are proved mathematically, and several examples are provided. Applications in 3D object recognition and 3D object viewpoint space partitioning are also described.  相似文献   

19.
针对已有的运动捕获数据关键帧提取方法常常忽略运动数据局部拓扑结构特性问题,提出了一种基于拉普拉斯分值LS特征选择的人体运动数据关键帧提取方法。该方法首先从原始运动数据集中提取两种代表性的特征向量并对其归一化,利用LS算法对组合后的特征向量进行打分和特征权重学习,以获取能够判别性揭示局部运动信息的特征子向量;其次,通过构建综合特征函数并基于极值判别原理,得到初始候选关键帧序列;最后,根据时间阈值约束和姿态相似判别策略,利用改进的k-means算法对候选帧进行聚类筛选,以达到去除冗余关键帧的目的,从而得到最终关键帧序列集合。仿真实验结果表明,该方法提取的关键帧序列具有典型性,能较好地对整体运动捕获数据进行视觉概括。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号