首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
在特征降维方面,图嵌入框架统一了PCA,LDA等一系列特征降维算法,方便求解,但相似度矩阵计算有赖于人为假设.而最大互信息(MMI)从信息论的角度得到有效的特征降维变换,但是求解复杂.针对这种情况,本文指出了图嵌入和最大互信息的联系,给出了基于两者组合的新算法GE-MMI.该算法继承了两者的优点,是一种有效的特征降维方法.  相似文献   

2.
针对复杂高维数据的维度约减问题,提出一种鲁棒的无监督维度约简方法。将自适应的图学习和投影学习融入一个联合学习框架,自适应捕获数据的本质局部结构,以此指导模型学习到全局最优的投影;为捕获数据的全局信息,引入一个PCA项,该项的引入能够减少维度约简过程中的信息损失;为选择最重要的特征进行维度约简,引入一个行稀疏约束,增强对于噪声的鲁棒性。在多个数据集上的实验验证了所提方法的有效性。  相似文献   

3.
自适应局部线性降维方法   总被引:1,自引:0,他引:1  
高维数据降维方法已经被广泛应用在信息检索、模式识别、数据挖掘和人工智能等领域。针对目前流形学习方法的嵌入效果非常敏感于局部邻域的选取方式,提出一种自适应邻域选择的局部线性降维方法。该方法评估真实数据的固有维数,判断每一数据点的局部切方向,以便自适应地选择每一数据点的邻域数,使得不同数据集与邻域选取方式之间存在很好的自适应性,实现更好的降维效果。在人工生成数据集和医学数据上的仿真结果表明,该方法起到了良好的降维效果。  相似文献   

4.
孙圣姿  万源  曾成 《计算机应用》2018,38(12):3391-3398
半监督模式下的多视角特征降维方法,大多并未考虑到不同视角间特征投影的差异,且由于缺乏对降维后的低维矩阵的稀疏约束,无法避免噪声和其他不相关特征的影响。针对这两个问题,提出自适应嵌入的半监督多视角特征降维方法。首先,将投影从单视角下相同的嵌入矩阵扩展到多视角间不同的矩阵,引入全局结构保持项;然后,将无标签的数据利用无监督方法进行嵌入投影,对于有标签的数据,结合分类的判别信息进行线性投影;最后,再将两类多投影映射到统一的低维空间,使用组合权重矩阵来保留全局结构,很大程度上消除了噪声及不相关因素的影响。实验结果表明,所提方法的聚类准确率平均提高了约9%。该方法较好地保留了多视角间特征的相关性,捕获了更多的具有判别信息的特征。  相似文献   

5.
现有基于图的多视图降维方法大多将构图和降维两个过程独立执行,因此构图的质量直接决定着降维的效果,然而构图是一个开放性的问题.为了缓解上述困难,提出了一种稀疏表示一致性引导的多视图降维算法(MDR_SRC).首先,通过使不同视图下的样本保持公共的稀疏表示,挖掘了视图之间的一致性关系;其次,根据样本对稀疏表示系数的差异性指导构图,利用构建的图指导降维;然后将基于稀疏表示的构图与基于图的降维整合为一个优化问题,使构图与降维过程相互指导,从而实现图质量的动态提升;最后,设计了一种迭代地交替策略求解该优化问题.在4个公开数据集上的实验结果表明文中所提的方法优于现有的代表性多视图降维方法.  相似文献   

6.
基于字典学习的非线性降维方法   总被引:1,自引:0,他引:1  
目前,众多的数据降维(Dimensionality reduction, DR)方法(如经典的PCA(Principle component analysis), ISOMAP(Isometric mapping))能够使降维后的数据保留原始信号的重要特征,但是从降维后的数据中很好地恢复出原始信号仍旧是一个挑战.近年来,稀疏表示(Sparse representation, SR)在信号重构研究中受到广泛关注,信号可以利用过完备字典中少数原子的线性组合来描述.本文提出一种基于字典学习的非线性降维方法.从高维输入信号到低维特征的降维过程中,期望一些重要的几何特征(内积、距离和夹角)得以保留,同时又能够从低维数据中恢复出原始信号.为达此目的,本文采用CDL(Concentrated dictionary learning)算法训练一个字典对(高维字典D和低维字典P),使高维原始信号的能量能够聚集于低维子空间中.字典D用来获取稀疏表示系数,字典P是D的直接降维采样,CDL算法能够保证P聚集D中的大部分能量.这样,信号的降维与恢复问题就转变为字典对的训练问题,信号的降维即为从D到P的能量保留过程.实验表明:CDL可在RIP(Restricted isomery property)条件的限制之外具有一定的信号重建能力,能在更低的维度条件下恢复图像,优于传统的压缩感知方法.此外,在噪声较大的情况下,CDL图像压缩效果优于JPEG2000.  相似文献   

7.
半监督图核降维方法   总被引:1,自引:0,他引:1       下载免费PDF全文
基于图结构的数据表示和分析,在机器学习领域正得到越来越广泛的关注。以往研究主要集中在为图数据定义一个度量其相似性关系的核函数即图核,一旦定义出图核,就可以用标准的支持向量机(SVM)来对图数据进行分类。将图核方法进行扩充,先利用核主成分分析(kPCA)对图核诱导的高维特征空间中的数据进行降维,得到与原始图数据相对应的低维向量表示的数据,然后对这些新得到的数据用传统机器学习方法进行分析;通过在kPCA中利用图数据中的成对约束形式的监督信息,得到基于图核的半监督降维方法。在MUTAG和PTC等标准图数据集上的实验结果验证了所提方法的有效性。  相似文献   

8.
针对局部线性嵌入(LLE)算法和最大间距准则(MMC)算法在特征提取问题中存在不足,提出一种有效的数据降维和分类方法--基于最大间距准则的局部图嵌入特征提取算法,并将其应用在人脸识别上.该算法在保持近邻的前提下,分别构造类内紧致图和类间惩罚图.首先在类内紧致图中利用线性重构的局部对称性找出高维数据空间中的非线性结构,使同类样本尽可能地聚集在一起;然后在类间惩罚图中使不同类别的样本尽可能分离;为了避免"小样本"问题,采用MMC的形式构造目标函数.在ORL,Yale和AR人脸图像库进行实验的结果表明,文中算法相对于DLA和LLE+LDA算法有较好的识别性能.  相似文献   

9.
一种基于稀疏嵌入分析的降维方法   总被引:3,自引:1,他引:2  
闫德勤  刘胜蓝  李燕燕 《自动化学报》2011,37(11):1306-1312
近几年局部流形学习算法研究得到了广泛的关注, 如局部线性嵌入以及局部切空间排列算法等.这些算法都是基于局部可线性化的假设而提出的, 但局部是否可线性化的问题没有得到很好有效的解决, 使得目前的降维算法对自然数据效果不佳. 自然数据中有很多是稀疏的,对稀疏数据的降维是局部线性嵌入算法所面临的一个问题. 基于对数据自然属性的考虑,利用数据的统计信息动态确定局部线性化范围, 依据数据的分布提出一种排列的稀疏局部线性嵌入算法(Sparse local linear embedding algorithm, SLLEA). 在数据集稀疏的情况下,该算法能够很好地把握数据的局部和整体信息. 将该算法应用于手工流形及图像检索等试验中,验证了该算法的有效性.  相似文献   

10.
针对基于功能核磁共振(fMRI)重构的脑网络状态观测矩阵维数过高且无特征表现的问题,提出一种基于谱特征嵌入(Spectral Embedding)的降维方法。该方法首先计算样本间相似性度量并构造拉普拉斯矩阵;然后对拉普拉斯矩阵进行特征分解,选取前两个主要的特征向量构建2维特征向量空间以达到数据集由高维向低维映射(降维)的目的。应用该方法对脑网络状态观测矩阵进行降维并可视化在二维空间平面,通过量化类别有效性指标对可视化结果进行评价。实验结果表明,与主成分分析(PCA)、局部线性嵌入(LLE)、等距映射(Isomap)等降维算法相比,使用该方法得到的脑网络状态观测矩阵低维空间的映射点有明显的类别意义表现,且在类别有效性指标上与多维尺度分析(MDS)和t分布随机邻域嵌入(t-SNE)降维算法相比,同一类样本间平均距离Di指数分别降低了87.1%和65.2%,不同类样本间平均距离Do指数分别提高了351.3%和25.5%;在多个样本上的降维可视化结果均有一定的规律性体现,该方法的有效性和普适性得以验证。  相似文献   

11.
知识图谱的嵌入式表示方法以基于翻译的TransE最为经典,但在处理复杂关系时存在局限;使用欧氏距离作为得分函数中的度量,每个特征维度以相同的权重参与计算,准确性会受到无关维度的影响,灵活性不高。因此,针对这两个缺陷,提出一种自适应的知识图谱嵌入式表示方法TransAD。利用自适应度量方法更换度量函数,在得分函数中引入对角权重矩阵,为每一个特征维分别赋予权重,增加模型的表示能力。同时受TransD方法的启发,将实体与关系通过动态映射矩阵建立空间投影模型,来增强模型对复杂关系的处理能力,最后将两种优化集成在一个模型中。实验结果表明,新方法TransAD优于Trans(E,H,R,D),在链路预测和三元组分类任务的各项指标上均有提升,有一定的先进性。  相似文献   

12.
为了有效地在半监督多视图情景下进行维数约简,提出了使用非负低秩图进行标签传播的半监督典型相关分析方法。非负低秩图捕获的全局线性近邻可以利用直接邻居和间接可达邻居的信息维持全局簇结构,同时,低秩的性质可以保持图的压缩表示。当无标签样本通过标签传播算法获得估计的标签信息后,在每个视图上构建软标签矩阵和概率类内散度矩阵。然后,通过最大化不同视图同类样本间相关性的同时最小化每个视图低维特征空间类内变化来提升特征鉴别能力。实验表明所提方法比已有相关方法能够取得更好的识别性能且更鲁棒。  相似文献   

13.
李冬睿  许统德 《计算机应用》2012,32(8):2253-2257
针对现有基于流形学习的降维方法对局部邻域大小选择的敏感性,且降至低维后的数据不具有很好的可分性,提出一种自适应邻域选择的数据可分性降维方法。该方法通过估计数据的本征维度和局部切方向来自适应地选择每一样本点的邻域大小;同时,使用映射数据时的聚类信息来汇聚相似的样本点,保证降维后的数据具有良好的可分性,使之实现更好的降维效果。实验结果表明,在人工生成的数据集上,新方法获得了较好的嵌入结果;并且在人脸的可视化分类和图像检索中得到了期望的结果。  相似文献   

14.
现有的主要非线性维数约减算法,如SIE和Isomap等,其邻域参数的设定是全局性的。仿真表明,对于局域流形结构差异较大的数据集,全局一致的邻域参数可能无法获得合理的嵌入结果。为此给出基于局域主方向重构的适应性邻域选择算法。算法首先为每个参考点选择一个邻域集,使各邻域集近似处于局域主线性子空间,并计算各邻域集的基向量集;再由基向量集对各邻域点的线性拟合误差判定该邻域点与主线性子空间的偏离程度,删除偏离较大的点。仿真表明,基于局域主方向重构的适应性邻域选择可有效处理局域流形结构差异较大的数据集;且相对于已有的适应性邻域选择算法,可以更好屏蔽靠近参考点的孤立噪声点及较大的空间曲率导致的虚假连通性。  相似文献   

15.
属性图嵌入旨在将属性图中的节点表示为低维向量,并同时保留节点的拓扑信息和属性信息.属性图嵌入已经有一系列相关工作,然而它们大多数提出的是有监督或半监督的算法.在实际应用中,需要标记的节点数量多,导致这些属性图嵌入算法的难度大,且需要消耗巨大的人力物力.针对上述问题以无监督的视角重新分析,提出了一种无监督的属性图嵌入算法...  相似文献   

16.
针对现存的基于自适应邻域的多视图聚类算法没有考虑噪声和共识图信息损失的问题,提出一种基于自适应邻域的鲁棒多视图聚类(RMVGC)算法.首先,为了避免噪声和异常值对数据的影响,通过鲁棒主成分分析模型(RPCA)从原始数据中学习多个干净的低秩数据;其次,用自适应邻域学习直接融合多个干净的低秩数据来得到一个干净的共识关系图,...  相似文献   

17.
知识表示学习旨在将知识图谱中的实体和关系表示成低维稠密实值向量,能有效缓解知识图谱的数据稀疏性和显著提升计算效率。然而,现有大多数知识表示学习方法仅将实体视为三元组的一个组成部分,没有考虑实体自身具有的特质,如实体相似性。为了加强嵌入向量的语义表达,提出基于实体相似性的表示学习方法SimE。该方法首先利用实体的结构邻域度量实体的相似性,再将实体的相似性和拉普拉斯特征映射结合作为基于三元组事实的表示学习方法的约束,形成联合表示。实验结果表明,该方法在链接预测和三元组分类等任务上与目前最好的方法性能接近。  相似文献   

18.
局部线性嵌入算法(Locally Linear Embedding,LLE)是基于流形学习的非线性降维方法之一。LLE利用样本点的近邻点的线性组合对每个样本点进行局部重构,而不同近邻个数的选取会产生不同的重构误差,从而影响整体算法的实施。提出了一种LLE的改进算法,算法有效地降低了近邻点个数对算法的影响,并很好地学习了高维数据的流形结构。所提方法的有效性在人造和真实数据的对比实验中得到了证实。  相似文献   

19.
局部线性嵌入算法以及局部切空间排列算法是目前对降维研究有着重要影响的算法, 但对于稀疏数据及噪声数据, 在使用这些经典算法降维时效果欠佳。一个重要问题就是这些算法在处理局部邻域时存在信息涵盖量不足。对经典算法中全局信息和局部信息的提取机制进行分析后, 提出一种邻域线性竞争的排列方法(neighborhood linear rival alignment algorithm, NLRA)。通过对数据点的近邻作局部结构提取, 有效挖掘稀疏数据内部信息, 使得数据整体降维效果更加稳定。通过手工流形和真实数据集的实验, 验证了算法的有效性和稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号