首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
自适应谱聚类算法研究   总被引:4,自引:0,他引:4  
谱聚类能识别出在原空间中线性不可分的聚类, 且其效果优于传统聚类算法.谱聚类要想获得好的效果必须选择一个合适的尺度参数,本文在传统谱聚类算法的基础上引入类似核选取的技巧,提出了一个能自动选取该尺度参数的自适应谱聚类算法.将该算法和现有的谱聚类参数选择算法作了比较,在人工数据集和UCI数据集上的实验表明,自适应谱聚类算法在很多情况下优于其它参数选择算法.  相似文献   

2.
随着Internet遍布到世界的各个角落,计算机暴露在互联网的各种恶意攻击前。我们需要行之有效的入侵检测系统来保护计算机免受这些恶意攻击的侵扰。现有基于信号的检测方法十分依赖加标识的训练数据,而对于新型的攻击束手无策。尽管基于聚类的检测方法可以克服这个缺陷,但是聚类方法的时间开销太大,从而导致网络管理员的反应延迟。本文介绍了一种新型的快速自适应聚类算法(FACA,FastAdaptive C lusterA lgorithm)该算法的时间复杂度为O(mn),n为数据点的数量,m为采样的次数,m的值远小于n,然而传统聚类方法的时间复杂度为O(n2),采用KDD CUP99的实验数据对该方法进行了评估,结果表明,相对于传统聚类方法,FACA显著的提高了检测效率。  相似文献   

3.
为了充分利用监督信息指导聚类过程,提出自适应半监督邻域聚类算法(adaptive semi-supervised neighborhood clustering algorithm,SSCAN).引入监督矩阵与距离度量结合,构造合理的相似矩阵;充分利用监督信息,通过标签信息矩阵与流形正则项结合调整模型,改善聚类效果.在...  相似文献   

4.
针对谱聚类算法对图像分割效果差强人意的特点,研究了一种改进的Nystrm算法进行谱聚类图像分割,使谱聚类算法应用于图像分割的效果有所改善。该算法首先对图像进行预处理,变换图像的分布数据空间,再分别计算对选定样本空间的数据间以及样本与其他空间的数据间的距离矩阵,并转化为相似矩阵;然后对相似矩阵正交化并且特征分解,进行K-Means聚类;最后将聚类结果进行后期处理。通过实验验证了该算法的有效性。  相似文献   

5.
将自适应蚁群优化算法与FCM(Fuzzy C-Means)算法相结合,提出了一种模糊聚类分析的新算法.该算法通过把FCM算法中的目标函数降维,将其转化为自适应蚁群优化算法中的优化函数,通过对各个节点的路径连接数的衡量,根据蚂蚁在搜索过程中所得解的分布状况,动态调节蚂蚁的路径选择和信息量更新,从而得到目标函数的最优解.结果表明,该方法比FCM算法具有更好的收敛效果和更高的聚类准确率.  相似文献   

6.
针对当前海上AIS数据量持续增加并且存在较多异常点,导致基于AIS数据的船舶轨迹构建困难,提出一种基于单船自身AIS数据进行轨迹异常点识别与修复方法.此方法充分利用AIS数据中的经纬度、速度、加速度以及航向等参数,进行轨迹异常点判定与修复,与基于单一位置数据的异常点判定与修复方法相比,能有效减少异常点的漏判,提高AIS...  相似文献   

7.
为了解决高维数据维数灾难影响数据相似性度量的问题,提出一种流形自适应结构化子空间聚类方法,通过构造相似矩阵获取数据的全局和局部流形结构信息,将亲和矩阵的构造和聚类分割统一到一个优化框架中,得到相似图和最终的聚类结果.在YALE、JAFFE、COIL20等10个真实数据集上与多个经典聚类算法进行对比试验,提出的算法在Ac...  相似文献   

8.
自适应的模糊C均值聚类算法   总被引:1,自引:0,他引:1  
针对模糊C均值聚类算法对聚类数预先不可知的缺陷,提出了自适应的模糊C均值聚类算法,该算法利用已有的有效性函数自动确定聚类数目,继而进行模糊聚类,实验表明,该方法无须人工的干预,并且具有良好的有效性和可行性.  相似文献   

9.
针对多维数据属性对聚类分析结果有不同重要程度影响的问题,提出一种基于自适应属性加权的近邻传播聚类算法。该方法通过考虑多维数据属性权值的重要度,在近邻传播聚类过程中引入属性加权相似性矩阵计算,并根据当前数据聚类划分的结果来分析目标评价函数,计算各个属性对当前聚类的贡献程度。随后根据贡献程度的计算结果自适应地更新属性权值,并通过属性加权相似性矩阵来重新计算近邻传播算法中的两种竞争信息,进而提高聚类结果的质量。数值实验结果表明,新方法能够有效实现属性权值的自适应调整,提高近邻传播算法的聚类效果,与其他传统聚类算法相比新方法具有更好的聚类质量。  相似文献   

10.
针对原始谱聚类算法初始化敏感的缺点,提出了一种基于联合模型的初始化独立谱聚类算法并将其用于图像分割.通过引入联合模型可以充分利用待聚类数据所包含的空间邻近信息和特征相似性信息,得到更精确的聚类结果;通过引入K-调和平均算法克服了原始谱聚类算法对初始化的敏感性,从而得到更稳定的聚类性能.最后,通过对纹理图像和合成孔径雷达图像分割验证了新算法的有效性.  相似文献   

11.
为了提高对高速公路出入口车辆运动行为的理解和分析水平,根据出入口车辆运动轨迹的时空特征,提出了一种运动轨迹层次聚类算法。结合出入口轨迹方向一致、长短不一的特点,提出采用改进Hausdorff距离来衡量轨迹间的相似性。建立了改进模糊C均值轨迹分层聚类算法,首先根据轨迹的空间几何位置进行路径聚类,然后根据车辆的速度信息对已有路径聚类进一步聚类获得具有时空区分度的最终结果。真实高速公路出入口的试验结果表明:本文提出的轨迹聚类算法对于场景固定运动行为模式不仅具有较强的适用性,而且能够保障聚类结果的准确性和可靠性。  相似文献   

12.
通常大规模复杂网络中社团数量是未知的,针对K-means谱聚类社团发现算法无法自动确定社团数量和聚类精度不高的缺点,提出了基于本征间隙和模糊c均值算法的自动谱聚类算法发现算法(FCMASC).该算法利用特征值的最大本征间隙来确定社团划分数量k,以特征向量矩阵线性相关性来确定FCM算法的初始聚类中心,运用FCM算法来对特征矩阵向量矩阵进行聚类.实验结果显示FCMASC算法能够有效提高聚类精度.  相似文献   

13.
针对模糊聚类算法中的噪声敏感性以及点对类的隶属度缺乏典型性的问题,提出一个自适应模糊聚类方法.该方法可以自动地标识那些有影响力的或者说重要的原型样本,反映出这些原型样本对其他样本的影响.又可以自动地标识那些有影响力的或者说重要的类,反映出那些重要的类对其他类的影响.该方法能够有效地降低噪声对有用信息的干扰,为传统的聚类方法提供了一个具有可操作性又有效率的替代方案.该方法的收敛性被理论证明,两个试验检验了它的计算花费和准确性.  相似文献   

14.
自动确定聚类数和海量数据的处理是谱聚类的关键问题。该文提出了一种能自动确定类个数的谱聚类算法,该算法通过数据亲合矩阵的谱分解得到一系列特征值,再利用特征值差值分析来自动确定类个数。并通过对复杂分布数据和UCI数据库中的数据集进行实验,结果表明该算法不仅能找到合适的类个数,并且有较好的分类准确性。  相似文献   

15.
一种快速A P聚类算法   总被引:3,自引:0,他引:3  
Affinity propagation(AP)聚类算法中的一个重要参数-收敛系数(damping factor)对算法的运行效率有较大影响,而传统的AP算法中收敛系数常作为固定参数在算法运行中保持不变,因此AP算法的收敛性能对收敛系数初始值的选择比较敏感,针对这一问题提出了一种新的AP聚类算法:F-AP,该算法在传统AP聚类算法基础上引入收缩因子调节收敛系数,使其值能够随算法进程动态调整,以加速AP算法的收敛过程。在3个不同容量模拟数据集上进行了实验,结果表明,新算法能够有效加速收敛过程,并且能够保证与原算法相同的聚类结果;在标准数据集Iris上的聚类结果也表明了新算法具有较好的收敛性能。  相似文献   

16.
给出一种具有鲁棒性的彩色图像聚类分割快速算法,以改善基于马氏距离聚类分割算法(MFCM)的实时性和抗噪性。利用彩色图像红、绿、蓝3通道分量构造三维直方图,统计出现频次不为零的灰度级组数目,用于取代像素值进行聚类。将图像像素邻域均值嵌入MFCM算法的目标函数,采用拉格朗日乘子法获取其迭代求解表达式,可得相应图像分割聚类算法。随机选取伯克利标准图像库中3幅彩色图像,添加不同强度的高斯噪声,进行分割测试。实验结果表明,改进算法对噪声图像的分割具有一定鲁棒性,对无噪声彩色图像分割相比MFCM算法具有更高执行效率。  相似文献   

17.
为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少K-means的欧氏距离计算次数.该算法基于Spark平台实现并行计算,进一步地提高了算法的运行效率.SPGK不但能够获得良好的聚类效果,而且缩减了欧氏距离计算次数,适用于海量数据的快速聚类.在千万级数据集上的实验结果表明,SPGK的性能明显优于现有的K-means++和基于K均值聚类的递归划分方法.  相似文献   

18.
为减少社区发现算法中参数的选择对社区划分的影响,同时使算法能够自适应地进行社区划分,本文提出一种基于核密度估计的密度峰值聚类的社区发现算法KDED.首先,定义一种基于信任度的距离度量,将社交网络中的用户关系量化为距离矩阵,使用矩阵元素的大小度量用户关系的紧密程度;然后对距离矩阵进行核密度估计,统计各个节点在网络中的影响大小,结合热扩散模型改进计算流程,使其自适应不同规模的数据集以提高计算精度;结合密度峰值聚类原理和社区属性确定社区中心节点后,可根据节点间的距离得到社区内部层次结构和社区外部的自然结构;最后将剩余节点按距离分配到相应的社区当中以完成社区划分.仿真结果表明:通过可视化软件可观察到,通过KDED算法得到的社区划分结果具有清晰的自然结构和内部层次结构;随着社区规模的提升以及划分难度增加,KDED算法具有出色的稳定性;在真实数据集以及LFR基准网络上均得到较为接近真实划分结果的社区划分,自适应性良好,验证算法的可行性与有效性.  相似文献   

19.
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.  相似文献   

20.
针对谱聚类算法相似度函数设置困难问题,提出了一种使用证据累积的文本聚类谱算法.该算法使用超球K均值算法对文本集进行多次聚类,并将每次得到的划分结果作为判断2个文本是否应该放在一个簇中的证据,由此构建文本的相似度矩阵和正则化拉普拉斯矩阵.在TREC和Reuters文本集上进行了实验,验证了本文算法的有效性,它比层次聚类算法和CLUTO提供的K均值算法更加优越.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号