首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
随着数据来源方式的多样化发展,多视图聚类成为研究热点。大多数算法过于专注利用图结构寻求一致表示,却忽视了如何学习图结构本身;此外,一些方法通常基于固定视图进行算法优化。为了解决这些问题,提出了一种基于相似图投影学习的多视图聚类算法(multi-view clustering based on similarity graph projection learning, MCSGP),通过利用投影图有效地融合了全局结构信息和局部潜在信息到一个共识图中,而不仅是追求每个视图与共识图的一致性。通过在共识图矩阵的图拉普拉斯矩阵上施加秩约束,该算法能够自然地将数据点划分到所需数量的簇中。在两个人工数据集和七个真实数据集的实验中,MCSGP算法在人工数据集上的聚类效果表现出色,同时在涉及21个指标的真实数据集中,有17个指标达到了最优水平,从而充分证明了该算法的优越性能。  相似文献   

2.
多视图子空间聚类方法因其可以揭示数据内在的低维结构而被广泛关注,但大多数现有的多视图子空间聚类算法直接将多个来自原始数据的充满噪声的相似度矩阵进行融合,并且通常是在得到一致的多视图表示之后再使用K均值算法聚类得到最终的结果,这种将表示的学习过程和后续的聚类过程分离的两阶段算法会导致无法得到最优的聚类结果.为了解决这些问题,提出一种单步划分融合多视图子空间聚类算法.该算法不是直接融合具有噪声和冗余信息的相似度矩阵,而是从相似度矩阵中提取出更具有判别性信息的划分级信息进行融合.提出一个新的框架,将表示学习、多视图信息融合以及最后的聚类过程整合在同一框架中.这三个过程彼此促进,好的聚类结果可以引导生成更好的多视图表示,从而得到更好的聚类效果.提出一种有效的轮替优化算法来解决由此得到的优化问题.最后,在四个真实的基准数据集上得到的实验结果可以证明提出方法的有效性以及先进性.  相似文献   

3.
潘振君  梁成  张化祥 《计算机应用》2021,41(12):3438-3446
针对多视图数据分析易受原始数据集噪声干扰,以及需要额外的步骤计算聚类结果的问题,提出一种基于一致图学习的鲁棒多视图子空间聚类(RMCGL)算法。首先,在各个视图下学习数据在子空间中的潜在鲁棒表示,并基于该表示得到各视图的相似度矩阵。随后,基于得到的多个相似度矩阵学习一个统一的相似度图。最后,通过对相似度图对应的拉普拉斯矩阵添加秩约束,确保得到的相似度图具有最优的聚类结构,并可直接得到最终的聚类结果。该过程在一个统一的优化框架中完成,能同时学习潜在鲁棒表示、相似度矩阵和一致图。RMCGL算法的聚类精度(ACC)在BBC、100leaves和MSRC数据集上比基于图的多视图聚类(GMC)算法分别提升了3.36个百分点、5.82个百分点和5.71个百分点。实验结果表明,该算法具有良好的聚类效果。  相似文献   

4.
针对现有的单视图数据竞争聚类算法无法高效处理多视图数据的问题,提出了基于视图相关因子的多视图数据竞争聚类算法。首先,为了描述不同视图之间的相关性定义了一种视图相关性因子;然后,将视图相关因子与谱方法关于拉普拉斯矩阵的目标函数最大化问题结合,建立一个联合目标函数,使得不同视图之间的信息相互影响,以充分利用多视图的信息。通过解决联合目标函数的优化问题,得到每个视图的优化嵌入矩阵;最后,将得到的优化嵌入矩阵用于数据竞争聚类算法中。在人工和真实数据集上的仿真实验结果表明,新算法比现有的数据竞争聚类算法具有更高的聚类性能。  相似文献   

5.
随着数据采集技术的发展,多视图数据变得越来越常见。与单视图数据相比,多视图数据包含更丰富的信息,通常用一致性与多样性来刻画。现有基于图的多视图聚类方法大多只关注视图间的一致性信息,忽视了视图间的多样性信息,并且图的构建与聚类过程分离,从而影响聚类算法的效果。提出基于多样性与一致性的单步多视图聚类算法(OMCDC)。基于“距离较近的数据点成为邻居的可能性较大”这一先验知识构建各个视图的相似性图。不同于以往算法直接融合相似性图获得公共图,OMCDC将每个视图的相似性图分解为一致性图和多样性图,通过融合一致性图获得更具一致性的公共图。在此基础上,引入谱旋转,联合优化低维谱嵌入和聚类概率矩阵,将图学习和聚类融为一体,直接获得聚类结果。OMCDC充分利用了多视图数据的一致性信息与多样性信息,结合谱旋转实现了单步多视图聚类。实验结果表明,该算法在100L和HW2数据集上的聚类准确率分别为94.62%和99.30%,相比MVGL、AWP、MCGC等方法具有较优的聚类性能。  相似文献   

6.
针对现存的基于自适应邻域的多视图聚类算法没有考虑噪声和共识图信息损失的问题,提出一种基于自适应邻域的鲁棒多视图聚类(RMVGC)算法。首先,为了避免噪声和异常值对数据的影响,通过鲁棒主成分分析模型(RPCA)从原始数据中学习多个干净的低秩数据;其次,用自适应邻域学习直接融合多个干净的低秩数据来得到一个干净的共识关系图,从而减少图融合过程中的信息丢失。实验结果表明,所提RMVGC算法的标准化互信息(NMI)在MRSCV1、BBCSport、COIL20、ORL和UCI digits数据集上比目前流行的多视图聚类算法分别提升了5.2、1.36、27.2、4.66和5.85个百分点。同时,该算法保持了数据局部结构,增强了对原始数据的鲁棒性,提高了关系图质量,在多视图数据集上具有较好的聚类性能。  相似文献   

7.
针对多视图深度子空间聚类网络(Multi-view Deep Subspace Clustering Networks, MvDSCN)算法具有的没有充分利用多视图互补信息、进行一次聚类直接得到聚类结果,以及只考虑数据级信息融合而降低了聚类性能等缺点,提出两级联合融合的多视图子空间聚类改进算法(TJ-MvDSCN)。不仅关注多视图共性信息,还关注多视图互补信息;增加分配级别的多视图信息融合,与已有的数据级信息融合形成两级融合结构;增加聚类损失,基于迭代优化策略构建一个可以联合学习特征表示和聚类分配的多视图聚类框架。经实验验证,该算法性能优于现有算法。  相似文献   

8.
现有的多视图聚类方法大多直接在原始数据样本上构建各视图的相似图,而原始数据中的冗余特征和噪声会导致聚类精度下降。针对该问题,基于特征选择和鲁棒图学习提出多视图聚类算法FRMC。在自适应选择不同视图特征时降低数据维度,减少冗余特征,同时利用自表示学习获取数据的表示系数,滤除噪声影响并得到数据样本的全局结构,从而去除样本中的噪声和离群点。在此基础上,通过自适应近邻学习构造样本鲁棒图,利用鲁棒图矩阵的加权和构建最终的亲和图矩阵,提出一种基于增广拉格朗日乘子的交替迭代算法对目标函数进行优化。在6个不同类型的标准数据集上进行实验,与SC、RGC、AWP等算法的对比结果表明,FRMC算法能够有效提升聚类精度且具有较好的收敛性与鲁棒性。  相似文献   

9.
现有的多视图聚类算法大多假设多视图数据点之间为线性关系,且在学习过程中无法保留原始特征空间的局部性;而在欧氏空间中进行子空间融合又过于单调,无法将学习到的子空间表示对齐。针对以上问题,提出了基于格拉斯曼流形融合子空间的多视图聚类算法。首先,将核技巧和局部流形结构学习结合以得到不同视图的子空间表示;然后,在格拉斯曼流形上融合这些子空间表示以得到一致性亲和矩阵;最后,对一致性亲和矩阵执行谱聚类来得到最终的聚类结果,并利用交替方向乘子法(ADMM)来优化所提模型。与核多视图低秩稀疏子空间聚类(KMLRSSC)算法相比,所提算法的聚类精度在MSRCV1、Prokaryotic、Not-Hill数据集上分别提高了20.83个百分点、9.47个百分点和7.33个百分点。实验结果验证了基于格拉斯曼流形融合子空间的多视图聚类算法的有效性和良好性能。  相似文献   

10.
多视图聚类能充分利用不同视图间数据的一致性和差异性,引起越来越多的关注。传统多视图聚类方法假设每个视图的数据都是完整的,然而在实际应用中,收集到的多视图数据常存在部分视图缺失的样本。为了对缺失多视图数据进行聚类分析,提出自适应图融合的缺失多视图聚类算法(IMC_AGF)。算法以两两视图间共有样本为瞄点构建样本-样本的相似度矩阵,学习其一致性知识,再利用两两视图间的互补性,用自适应图融合算法整合所有的相似度图,获取缺失多视图数据完整的相似度矩阵,然后进行谱聚类得到分类结果。实验结果表明,提出的算法优于与之比较的经典缺失多视图聚类方法。  相似文献   

11.
针对现有鲁棒图学习忽略多视图间的互补信息和高阶相关性问题,提出一种面向多视图聚类的低秩张量表示学习(LRTRL-MVC)算法。利用鲁棒主成分分析的思想,在去除噪声的干净数据上计算各视图的鲁棒图和转移概率矩阵,然后构建一个包含各视图马尔可夫转移概率矩阵的张量,采用基于张量奇异值分解的核范数来确保目标张量的低秩性质。利用迭代最优化算法求解,将求得的低秩张量作为马尔可夫谱聚类算法的输入得到最终聚类结果。在4个不同类型的公开标准数据集BBCSport、NGs、Yale和MSRCv1上进行实验并与相关的最好多视图聚类算法进行对比,结果表明在3个聚类度量标准下,所提算法的聚类结果均高于其他对比算法。  相似文献   

12.
现有的多视图聚类算法往往缺乏对各视图可靠度的评估和对视图进行加权的能力,而一些具备视图加权的多视图聚类算法则通常依赖于特定目标函数的迭代优化,其目标函数的适用性及部分敏感超参数调优的合理性均对实际应用有显著影响。针对这些问题,提出一种基于视图互信息加权的多视图集成聚类(MEC-VMIW)算法,主要过程可分为两个阶段,即视图互加权阶段与多视图集成聚类阶段。在视图互信息加权阶段,对数据集进行多次随机降采样,以降低评估加权过程的问题规模,进而构建多视图降采样聚类集合,根据不同视图的聚类结果之间的多轮互评得到视图可靠度评估,并据此对视图进行加权;在多视图集成聚类阶段,对各个视图数据构建基聚类集合,并将多个基聚类集合加权建模至二部图结构,利用高效二部图分割算法得到最终多视图聚类结果。在若干个多视图数据集上的实验结果验证了所提出的多视图集成聚类算法的鲁棒聚类性能。  相似文献   

13.
多视图聚类旨在综合利用视图数据中的一致信息和互补信息实现对数据的划分, 但各视图表征数据的能力参差不齐, 甚至有的视图可能含有大量的冗余和噪声信息, 不仅不能带来多样的信息, 反而影响聚类性能. 本文提出了自适应加权的低秩约束的多视图子空间聚类算法, 通过自适应学习的方式给各视图赋予不同权重来构造各视图共享的潜在一致低秩矩阵. 并且提出了有效的可迭代优化算法对模型进行优化. 在5个公开数据集上的实验结果表明所提算法的有效性.  相似文献   

14.
子空间聚类是机器学习领域的热门研究课题。它根据数据的潜在子空间对数据进行聚类。受多视图学习中协同训练算法的启发,提出一个自适应图学习诱导的子空间聚类算法,该算法首先将单视图数据多视图化,再利用不同视图的信息迭代更新图正则化项,得到更能反映聚类性能的块对角关联矩阵,从而更准确地描述数据聚类结果。在四个标准数据集上与其他聚类算法进行对比实验,实验结果显示该方法具有更好的聚类性能。  相似文献   

15.
现实世界中高维数据无处不在,然而在高维数据中往往存在大量的冗余和噪声信息,这导致很多传统聚类算法在对高维数据聚类时不能获得很好的性能.实践中发现高维数据的类簇结构往往嵌入在较低维的子空间中.因而,降维成为挖掘高维数据类簇结构的关键技术.在众多降维方法中,基于图的降维方法是研究的热点.然而,大部分基于图的降维算法存在以下两个问题:(1)需要计算或者学习邻接图,计算复杂度高;(2)降维的过程中没有考虑降维后的用途.针对这两个问题,提出一种基于极大熵的快速无监督降维算法MEDR. MEDR算法融合线性投影和极大熵聚类模型,通过一种有效的迭代优化算法寻找高维数据嵌入在低维子空间的潜在最优类簇结构. MEDR算法不需事先输入邻接图,具有样本个数的线性时间复杂度.在真实数据集上的实验结果表明,与传统的降维方法相比, MEDR算法能够找到更好地将高维数据投影到低维子空间的投影矩阵,使投影后的数据有利于聚类.  相似文献   

16.
挖掘多视图一致性是提升多视图聚类性能的关键,为更好地从多视图数据中学习一致性表示,提出一种新的多视图聚类算法OMTSC。OMTSC算法同时学习每个视图的聚类分配矩阵和特征嵌入,并将聚类分配矩阵分解为共享正交基矩阵和聚类编码矩阵。正交基矩阵可捕获并储存多视图一致性信息形成潜在聚类中心,经过加权融合的多视图聚类编码矩阵可更好地平衡不同视图的质量差异。引入基于二部图的协同聚类,实现正交基、聚类编码和特征嵌入3个矩阵的知识相互迁移,以提升多视图数据一致性和多样性,并利用特征嵌入的多样性最大化多视图一致性学习最优的潜在聚类中心,从而提高多视图聚类的性能。此外,基于群稀疏约束的特征嵌入可有效消除多视图数据中的噪声,提升算法的鲁棒性。在WikipediaArticles、COIL20和ORL数据集上的实验结果表明,与SC-Best、Co-Reg等先进的多视图聚类算法相比,OMTSC算法在ACC、NMI、ARI 3个评价指标上整体取得最优值,其中在COIL20和ORL数据集中的NMI评价指标均高于0.9。  相似文献   

17.
多视图聚类旨在从不同视图的多样性信息中, 学习到更加全面和准确的共识表示, 以提高模型的聚类性能. 目前大部分多视图聚类算法采用希尔伯特-施密特独立性准则(HSIC)或自适应加权方法从全局考虑各视图的多样性, 忽略了各视图样本之间的局部多样性信息学习. 针对上述问题, 提出了多样性引导的深度多视图聚类算法. 首先, 提出了融合多头自注意力机制的软聚类模块, 多头自注意力机制用来学习全局多样性, 软聚类模糊C均值算法用来学习局部多样性; 其次, 在深度图自编码器网络结构中引入软聚类模块, 以达到多样性信息引导潜在表示生成的目的; 然后, 将得到的各视图潜在表示进行加权融合得到共识表示, 并采用谱聚类算法对共识表示进行聚类; 最后, 在3个常用数据集上进行了对比实验和消融实验. 实验结果表明, 提出的聚类算法具有良好的聚类效果, 以及提出的多样性信息学习模块可以有效提高算法聚类性能.  相似文献   

18.
在如今的大数据时代,多视图数据引起了越来越多的关注,对多视图聚类的假设是所有视图都是完整的,然而,这种假设在实际应用中很难得到满足。因此不完备多视图聚类是一个重要挑战。针对大规模的不完备多视图数据,考虑到其数据的特征,利用互补性和一致性,论文提出了一种基于非负矩阵分解的在线反向图正则化聚类方法,首先利用加权非负矩阵分解作为基础模型,考虑到缺失实例的影响,引入一个动态权重矩阵;其次,学习所有视图的潜在特征矩阵并得到一个共识矩阵;同时,考虑到挖掘数据的局部结构,在基础模型上增加反向图正则化项;最后,对于大规模的数据,分块处理多视图数据以减少内存需求。在四个真实的数据集上进行了大量实验证明了所提出的方法的有效性。  相似文献   

19.
贺娜  马盈仓 《计算机工程》2022,48(7):114-121+150
现有多视图模糊C均值聚类(FCM)算法通常将一个多视图分解为多个单视图进行数据处理,导致视图数据聚类精度降低,从而影响全局数据划分结果。为实现高维数据和多视图数据的高效聚类,提出一种基于KL信息的多视图自加权模糊聚类算法。将多个视图信息及其权重进行拟合融入标准FCM算法,求解多个隶属度矩阵和质心矩阵。在此基础上,通过附加KL信息作为模糊正则项进一步修正共识隶属度矩阵并保持权重分布的平滑性,其中KL信息是视图隶属度与其共识隶属度的比值,最小化KL信息会使每个视图的隶属度偏向于共识隶属度以得到更好的聚类结果。实验结果表明,该算法相比于传统聚类算法具有更好的聚类效果和更快的收敛速度,尤其在3-Sources数据集上相比于MVASM算法的聚类精度、标准化互信息和纯度分别提升了7.46、15.34和5.48个百分点。  相似文献   

20.
曹卫东  蔡浩天 《计算机应用研究》2020,37(10):2937-2940,2975
为了提升传统多视图K-means算法在高维数据中的聚类性能,提出了一种鲁棒性大规模多视图数据的自降维K-means算法RMSKMC(robust multi-view subKmeans clustering),通过寻找单个视图上的最优子空间实现高维数据的自降维,利用非负矩阵分解(NMF)对损失函数进行重构,使不同视图共享相同的聚类指示矩阵从而实现多视图信息互补,完成大规模多视图数据的聚类。实验结果表明,在大规模多视图数据集上,该算法比其他多视图聚类算法资源消耗更小,并且能够进行更为准确的聚类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号