首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
传统聚类算法在目标数据集被噪声或异常数据大量污染的场景下聚类效果不佳。针对此问题,在经典谱聚类算法(spectral clustering,SC)基础上加入迁移学习知识,提出了新的域间F-范数正则化迁移谱聚类算法(transfer spectral clustering based on inter-domain F-norm regularization,TSC-IDFR)。该算法通过第K最近邻原则为目标域数据从源域(历史数据)获取等量的可参照数据样本,然后基于域间F范数正则化机制,迁移这些源域可参照数据样本的谱聚类特征矩阵,以辅助目标域数据集上的谱聚类过程,从而解决实际问题中由于目标域数据污染带来的聚类难题,最终提高谱聚类效果。通过在模拟数据集和真实数据集上的仿真实验,证明了该算法的有效性。  相似文献   

2.
随着数据采集技术的发展,多视图数据变得越来越常见。与单视图数据相比,多视图数据包含更丰富的信息,通常用一致性与多样性来刻画。现有基于图的多视图聚类方法大多只关注视图间的一致性信息,忽视了视图间的多样性信息,并且图的构建与聚类过程分离,从而影响聚类算法的效果。提出基于多样性与一致性的单步多视图聚类算法(OMCDC)。基于“距离较近的数据点成为邻居的可能性较大”这一先验知识构建各个视图的相似性图。不同于以往算法直接融合相似性图获得公共图,OMCDC将每个视图的相似性图分解为一致性图和多样性图,通过融合一致性图获得更具一致性的公共图。在此基础上,引入谱旋转,联合优化低维谱嵌入和聚类概率矩阵,将图学习和聚类融为一体,直接获得聚类结果。OMCDC充分利用了多视图数据的一致性信息与多样性信息,结合谱旋转实现了单步多视图聚类。实验结果表明,该算法在100L和HW2数据集上的聚类准确率分别为94.62%和99.30%,相比MVGL、AWP、MCGC等方法具有较优的聚类性能。  相似文献   

3.
为了获得结构更加合理的相似矩阵,提出了基于谱聚类和L2,1范数的多视图聚类算法.该算法首先将改进的多视图亲和矩阵利用L2,1范数正则项合理地构造出相似矩阵S,使S在整体稀疏的情况下保证局部的强线性关系;然后同时进行相似矩阵的学习和谱聚类过程,将相似矩阵S和标签矩阵F交替迭代,加强数据集与降维后的F的几何结构的紧密联系;最后对所提出的算法进行了实验,结果表明该算法是有效的.  相似文献   

4.
多视图聚类通过整合不同视图的特征以提升聚类性能.现有的多视图聚类更多地关注数据不同的低维表示方式和其在隐式空间的几何结构,而忽略数据样本在不同空间的结构关系,未同时考虑不同空间的聚类.为此,文中提出基于概念分解的显隐空间协同多视图聚类算法.首先,通过概念分解获取不同视图在隐式空间中的一个共同的低维特征表示,并利用图拉普拉斯正则化约束保持原始数据的局部结构不变.然后,将数据在显式空间中的聚类和隐式空间中的聚类整合到一个共同的框架中,进行协同学习和优化,得到最终的聚类结果.在8个真实数据集上的实验表明文中算法性能较优.  相似文献   

5.
多视图聚类需要将多个视图的数据信息进行融合表示,是一项重要且具有挑战的任务.至今仍存在2个难解的问题:1)如何将多视图信息有效融合,减少信息丢失;2)如何将图学习和谱聚类同时进行,避免2步策略带来次优化结果.由于数据本身存在噪声并且各视图数据差异较大,在数据空间进行融合可能会造成重要信息的损失;另外,考虑到不同视图的数据应具有相同的聚类结构.为此提出基于谱结构融合的多视图聚类模型,将各视图信息在谱嵌入阶段实施融合,一方面避免了噪声和各视图数据差异的影响,另一方面融合的部位和方式更自然,减少了融合阶段信息的丢失.另外,该模型利用子空间自表示进行图学习,有效地将图学习和谱聚类整合到统一框架中进行联合优化学习.在5个真实数据集上的实验表明了模型的有效性和优越性.  相似文献   

6.
为了解决具有多种特征属性的多媒体数据(多视图数据)挖掘问题,在非负矩阵分解(NMF)算法的基础上,提出了一种多视图正则化矩阵分解算法(MRMF),该算法使用了多元非负矩阵分解技术,同时使用[L2,1]范数描述矩阵分解的损失函数,并采用多视图流形正则化对矩阵分解进行正则化约束。与现有的一些数据聚类或多视图聚类算法相比,提出的MRMF算法不易受到原始数据中噪声的影响,而且能够充分考虑到不同视图在聚类中所具有不同权重的问题,能够对多视图数据进行较为准确的聚类。MRMF算法的有效性在一些经典的公开数据集上进行了验证,并取得了较好的聚类精度。  相似文献   

7.
现有的多视图聚类算法往往缺乏对各视图可靠度的评估和对视图进行加权的能力,而一些具备视图加权的多视图聚类算法则通常依赖于特定目标函数的迭代优化,其目标函数的适用性及部分敏感超参数调优的合理性均对实际应用有显著影响。针对这些问题,提出一种基于视图互信息加权的多视图集成聚类(MEC-VMIW)算法,主要过程可分为两个阶段,即视图互加权阶段与多视图集成聚类阶段。在视图互信息加权阶段,对数据集进行多次随机降采样,以降低评估加权过程的问题规模,进而构建多视图降采样聚类集合,根据不同视图的聚类结果之间的多轮互评得到视图可靠度评估,并据此对视图进行加权;在多视图集成聚类阶段,对各个视图数据构建基聚类集合,并将多个基聚类集合加权建模至二部图结构,利用高效二部图分割算法得到最终多视图聚类结果。在若干个多视图数据集上的实验结果验证了所提出的多视图集成聚类算法的鲁棒聚类性能。  相似文献   

8.
针对现实社会中由多种表示或视图组成的多视图数据广泛存在的问题,深度矩阵分解模型因其能够挖掘数据的层次信息而备受关注,但该模型忽略了数据的几何结构信息.为解决以上问题,本文提出基于深度图正则化矩阵分解的多视图聚类算法,通过获取每个视图的局部结构信息和全局结构信息在逐层分解中加入两个图正则化限制,保护多视图数据的几何结构信...  相似文献   

9.
张祎  孔祥维  王振帆  付海燕  李明 《自动化学报》2018,44(12):2160-2169
在计算机视觉和模式识别领域,随着多源信息越来越多,图像的描述方法也越来越丰富,多视图学习方法能更充分利用这种多源信息,进而提高聚类的准确率.因此,本文提出了两种基于多视图学习的方法:MultiGNMF和MultiGSemiNMF方法.该方法是在矩阵分解的基础之上,结合以往多视图学习的框架准则,并利用了样本的局部结构形成的.MultiGNMF和MultiGSemiNMF算法不仅能学习视图间的互补信息,同时能保持样本的空间结构.但是,MultiGNMF算法只适用于非负的特征矩阵.因此,考虑到SemiNMF算法相对于NMF算法具有更大的扩展性,结合多视图学习的框架,本文又提出了多视图学习的MultiGSemiNMF算法.实验结果证实了这两种方法有较好的性能.  相似文献   

10.
随着获取多模态或多视图数据的日益容易,多视图聚类研究受到广泛关注.然而,很多方法直接从原始数据中学习邻接矩阵,忽视了数据中噪声的影响.此外,还有一些方法将各个视图同等对待,而实际上各视图在聚类过程中所发挥的作用是不同的.为解决上述问题,提出了一种基于Markov链的聚类算法,名为一致性引导的自适应加权多视图聚类(consensus guided auto-weighted multi-view clustering, CAMC).首先为每个视图构造转移概率矩阵;然后,以自适应加权的方式获得一致性转移概率矩阵,并对一致性转移概率矩阵的拉普拉斯矩阵进行了秩约束,确保拉普拉斯图中连通分量的数目正好等于簇的数目.此外,基于交替方向乘子法(alternating direction method of multipliers, ADMM)优化策略对问题进行求解.在1个人造数据集和7个真实数据集上的实验结果证明了该算法的有效性,其聚类性能优于现有的8种基准算法.  相似文献   

11.
密度敏感的半监督谱聚类   总被引:27,自引:0,他引:27  
王玲  薄列峰  焦李成 《软件学报》2007,18(10):2412-2422
聚类通常被认为是一种无监督的数据分析方法,然而在实际问题中可以很容易地获得有限的样本先验信息,如样本的成对限制信息.大量研究表明,在聚类搜索过程中充分利用先验信息会显著提高聚类算法的性能.首先分析了在聚类过程中仅利用成对限制信息存在的不足,尝试探索数据集本身固有的先验信息--空间一致性先验信息,并提出利用这类先验信息的具体方法.接着,将两类先验信息同时引入经典的谱聚类算法中,提出一种密度敏感的半监督谱聚类算法(density-sensitive semi-supervised spectral clustering algorithm,简称DS-SSC).两类先验信息在指导聚类搜索的过程中能够起到相辅相成的作用,这使得DS-SSC算法相对于仅利用成对限制信息的聚类算法在聚类性能上有了显著的提高.在UCI基准数据集、USPS手写体数字集以及TREC的文本数据集上的实验结果验证了这一点.  相似文献   

12.
王丽娟    丁世飞  夏菁 《智能系统学报》2023,18(2):399-408
本文主要研究如何通过挖掘多视图特征的多样性信息来促进多视图聚类,提出了基于多样性的多视图低秩稀疏子空间聚类算法。该方法直接将视图多样性概念应用于多视图低秩稀疏子空间聚类算法框架中,确保不同视图的子空间表示矩阵的多样性;为了实现多个视图聚类一致性同时达到提高聚类性能的目标,在该框架中引入谱聚类算法共同优化求解。通过对3个图像数据集的实验验证了该算法的有效性,同时其聚类的性能优于已有的单视图及多视图算法。  相似文献   

13.
张熠玲  杨燕  周威  欧阳小草  胡节 《软件学报》2022,33(4):1373-1389
谱聚类是聚类分析中极具代表性的方法之一,由于其对数据结构没有太多假设要求,受到了研究者们的广泛关注.但传统的谱聚类算法通常受到谱嵌入的可扩展性和泛化性的限制,即:无法应对大规模设置和复杂数据分布.为克服以上缺陷,旨在引入深度学习框架提升谱聚类的泛化能力与可扩展能力,同时,结合多视图学习挖掘数据样本的多样性特征,从而提出...  相似文献   

14.
聚类分析是一种常见的分析方法,谱聚类作为聚类分析的一支,因其不受样本形状约束等特点备受瞩目.为及时掌握当前谱聚类算法研究动态,通过对比分析众多谱聚类优化算法,从半监督学习、二阶段聚类算法选择、算法执行效率优化等三个角度,将谱聚类优化算法分为三类,并对每类算法的优化思想进行综述.介绍经典多路谱聚类与基本理论,并分析相似矩...  相似文献   

15.
基于免疫谱聚类的图像分割   总被引:4,自引:0,他引:4  
张向荣  骞晓雪  焦李成 《软件学报》2010,21(9):2196-2205
提出了一种基于免疫谱聚类的图像分割方法.利用谱聚类的维数缩减特性获得数据在映射空间的分布,在此基础上构造一种新的免疫克隆聚类,用于在映射空间中对样本进行聚类.该方法通过谱映射为后续的免疫克隆聚类提供低维而紧致的输入.而免疫克隆聚类算法具有快速收敛到全局最优并且对初始化不敏感的特性,从而可以获得良好的聚类结果.在将其用于图像分割时,采用了Nystr?m逼近策略来降低算法复杂度.合成纹理图像和SAR图像的分割结果验证了免疫谱聚类算法用于图像分割的有效性.  相似文献   

16.
谱聚类将数据聚类问题转化成图划分问题,通过寻找最优的子图,对数据点进行聚类。谱聚类的关键是构造合适的相似矩阵,将数据集的内在结构真实地描述出来。针对传统的谱聚类算法采用高斯核函数来构造相似矩阵时对尺度参数的选择很敏感,而且在聚类阶段需要随机确定初始的聚类中心,聚类性能也不稳定等问题,本文提出了基于消息传递的谱聚类算法。该算法采用密度自适应的相似性度量方法,可以更好地描述数据点之间的关系,然后利用近邻传播(Affinity propagation,AP)聚类中“消息传递”机制获得高质量的聚类中心,提高了谱聚类算法的性能。实验表明,新算法可以有效地处理多尺度数据集的聚类问题,其聚类性能非常稳定,聚类质量也优于传统的谱聚类算法和k-means算法。  相似文献   

17.
针对高维数据在聚类过程中存在迭代次数多、运算耗时长等问题,提出一种改进的聚类算法,首先采用谱聚类对样本降维,再选取k个首尾相连且距离乘积最大的数据对象作为初始聚类中心,在簇中心更新过程中,选取与簇均值距离最近的数据对象作为簇中心,并将其他数据对象按最小距离划分至相应簇中,反复迭代,直至收敛。实验结果表明,新算法的Rand指数、Jaccard系数和Adjusted Rand Index等聚类指标全部优于K-means算法及其他3种改进聚类算法,在运行效率方面,新算法的聚类耗时更短、迭代次数更少。  相似文献   

18.
谱聚类算法利用特征向量构造简化的数据空间,在降低数据维数的同时,使得数据在子空间中的分布结构更加明显。该文提出了一种粗糙谱聚类算法,并将其应用于文本数据挖掘。实验表明,该算法与现有的文本聚类算法相比,准确率有一定的提高。  相似文献   

19.
在现有多种距离度量和传统谱聚类算法的基础上,提出了一种新的基于有效距离的谱聚类算法(spectral clustering based on effective distance,SCED)。SCED算法通过稀疏重构系数来构建样本与样本之间的有效距离,从而代替传统谱聚类算法中的欧氏距离,进行样本之间的相似度评估。与传统距离度量相比,有效距离不仅利用了样本对之间的距离信息,同时考虑了目标样本与其他所有相关样本之间的距离信息,因而该距离度量具有全局特性。在UCI标准数据集上的实验结果表明,SCED算法能有效提高聚类效果。  相似文献   

20.
谱聚类算法利用特征向量构造简化的数据空间,在降低数据维数的同时,使得数据在子空间中的分布结构更加明显。该文提出了一种粗糙谱聚类算法,并将其应用于文本数据挖掘。实验表明,该算法与现有的文本聚类算法相比,准确率有一定的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号