首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
改进了传统的谱聚类算法,并优化了初始聚类中心的选择方法。传统的谱聚类算法虽然具有算法复杂度较低、适用范围广等特点,但受高斯核函数尺度参数影响较大。设计的算法通过引入万有引力模型进行相似性度量,设计了基于引力的相似性度量方法,以此消除尺度参数的影响;另外,提出基于密度与距离乘积的初始聚类中心选取方法,优化了初始聚类中心的选择。在UCI基准数据集上的实验表明,改进的算法消除了尺度参数σ影响的同时,也达到了比较好的NMI指标和Accuracy指标。最后,使用改进的算法设计了基于微博用户的群组探测方法,取得了较为理想的用户群组划分结果。  相似文献   

2.
大规模数据集的多层聚类算法   总被引:1,自引:0,他引:1  
针对大多谱聚类算法由于计算复杂度高而不适于大规模数据的问题,提出了一种能处理大规模数据集的多层算法。该算法把海量数据根据一定的相关性逐级分组成小数据集,再对分组后的小数据集用谱聚类算法进行聚类,最后利用权核K均值聚类逐级微调,完成全部数据的聚类。通过对UCI数据库中的数据集和图像分割的仿真实验,结果表明该算法的聚类效果很好。  相似文献   

3.
为了对船舶AIS轨迹数据进行快速聚类,本文提出了一种基于Hausdorff距离的船舶轨迹快速自适应谱聚类算法(fast self-tune spectral clustering,FSSC)。在保留轨迹特征的情况下,利用Douglas-Peucker(DP)算法对船舶轨迹数据进行预处理;基于Hausdorff距离,设计自动选取尺度参数的相似度度量函数,构造相似度矩阵并采用谱聚类算法对船舶轨迹进行聚类。以长江口水域船舶实际AIS数据为样本对算法进行了验证,结果表明:聚类结果能够准确提取水域船舶主要航路,算法消耗系统资源少,计算速度快。该方法对水域船舶主要航路识别,提高海事监管效率等方面具有参考意义。  相似文献   

4.
随着信息技术的快速发展,能够获取人们大量的轨迹数据。通过轨迹数据挖掘出城市热点区域,对城市规划、交通管理和一些基于位置的服务都具有重要意义。针对已有的数据挖掘方法,如k均值聚类算法、基于密度的聚类(Density Based Spatia Clustering of Applications with Noise,DBSCAN)算法、谱聚类(Spectral Clustering,SC)算法、密度峰值聚类(Density Peak Clustering,DPC)算法等,存在非凸数据集上聚类效果较差,对初始中心敏感,参数选择困难,时间复杂度较高等问题,提出基于网格划分和DPC改进谱聚类算法用于城市热点区域分析。在合成数据集上的实验结果表明,其聚类精度和时间与经典聚类算法相比具有一定的提升。在西安市出租车数据集上的实验结果表明,提出的算法能有效挖掘出城市热点区域。  相似文献   

5.
针对流形学习算法Isomap对于稀疏数据局部邻域大小选择的敏感性,提出一种自适应邻域选择的降维方法 A-Isomap(Adaptive-Isomap).在数据稀疏的情况下,通过邻域选取算法自适应的动态选择每一个样本点的邻域大小,很大程度上避免了对短路点的选择;同时,使用聚类信息来汇聚相似的样本点,保证了降维后的数据具有很好的可分性.为了验证算法的有效性,将该算法应用于手工流形的降维,结果表明该算法能较好的展现降维效果.  相似文献   

6.
为使多路谱聚类方法对复杂结构数据集有效地聚类,根据矩阵扰动理论,利用局部近邻关系更新谱聚类算法(NJW)中的初始相似度矩阵,得到最终的亲和矩阵.理论分析表明,数据集可划分时,该矩阵是理想块矩阵或接近理想块矩阵,保证了本文算法聚类划分的正确性.将本文算法和基于路径的谱聚类、密度敏感的谱聚类以及基于流平面排序的谱聚类进行了比较,结果表明,本文算法在数据集具有复杂分布结构时可以确定聚类个数,得到正确的聚类结果.进一步将本文算法用于真实数据集上的聚类分析,表明本文算法是有效的.  相似文献   

7.
聚类分析的一个重要应用就是图像识别,谱聚类因为比传统的聚类方法更高效而迅速被广泛运用到图像处理中。谱聚类算法其中一个重要的步骤是构造一个合适的相似矩阵,本文提出一种基于共享近邻重要性的自适应谱聚类算法且应用到数字手写图像识别中,与自适应谱聚类算法做比较试验,表明谱聚类算法能取得较好的识别结果。  相似文献   

8.
针对子空间聚类算法中相似性学习和谱聚类相互分离的问题,提出自适应图正则的单步子空间聚类(one-step subspace clustering with adaptive graph regularization, OSCAGR)算法。利用Frobenius范数鼓励分组效应,根据局部连通性为每个数据点分配自适应的最优邻域学习系数矩阵;考虑全局结构和局部结构,保证数据空间中相近的点拥有较大的表示系数;通过量化范数将子空间聚类两个独立的阶段整合到一个统一的优化框架中。试验结果表明,OSCAGR算法在UCI数据集和3个图像数据集上比其他对比方法的精度高1%~7%,OSCAGR算法的聚类正确率和归一化互信息优于其他对比方法。  相似文献   

9.
基于主成分分析的密度聚类算法   总被引:1,自引:0,他引:1  
密度聚类算法可以描述任意形状的聚类,可以有效地处理异常数据,适合处理大数据集,但不适用于高维数据集的聚类,因此提出了基于主成分分析的密度聚类算法,将DBSCAN算法应用于PCA的k个主成分张成的子空间,解决了DBSCAN算法用于高维数据集的问题.运用气象数据进行实验,结果表明:主成分个数k值的选择严重影响聚类效果,故提出k的基本选择方法,正确选择k值情况下,该算法具有较好的聚类效果.  相似文献   

10.
为了简单有效地对数据集进行结构分析,提出了一种基于最小树进行聚类的算法(MSTCA).其基本思想是在最小树中切割所有大于一定阈值的边,对数据集进行子类划分,同时对较小的子类进行合并.MSTCA产生的聚类结果在不考虑子类次序时是唯一的。对它的递归调用还可在若干不同粒度层次上形成数据集的聚类结构.计算实验表明,MSTCA不仅能为具有各种不同聚类形状的数据集自适应地选择较好的聚类个数,而且只需简单的参数选择就能准确地分析出数据中存在的合理聚类和例外样本.  相似文献   

11.
为了克服传统语音端点检测算法在低信噪比环境下准确率低的问题,提出一种基于谱熵梅尔积(MFPH)的语音端点检测算法.首先,提取带噪语音信号的梅尔频率倒谱系数中的第一维参数MFCC0,将其与谱熵的乘积作为最终区分语音段和背景噪声段的融合特征参数;然后,结合模糊C均值聚类算法和贝叶斯信息准则(BIC)算法对MFPH特征参数门限值进行自适应估计;最后,采用双门限法进行语音端点检测.实验结果证明,与传统方法比较,该方法在-5~15 dB低信噪比环境下的语音端点检测准确率有较大提高.  相似文献   

12.
为了降低谱聚类算法尺度参数对分类结果的影响,避免Nystrm逼近导致的分类结果不稳定,提出了一种基于谱聚类集成的极化合成孔径雷达(SAR)地物分类方法.首先,利用像素间的空间关系和极化信息,将基于相干矩阵Wishart距离的相似性测度和基于极化特征矢量欧氏距离的相似性测度相结合,引入马尔可夫随机场势函数,构造谱聚类的相似性矩阵;然后,采用基于Nystrm逼近的谱聚类实现极化SAR数据的单次谱分类;最后,采用集成策略完成对极化SAR图像的地物分类.实验结果表明,该算法提高了分类精度,区域一致性保持较好,且分类结果稳定.  相似文献   

13.
谱聚类是近年来一类具有较好应用前景的聚类方法。本文将独立成分分析引入到传统的谱聚类方法中,提出了一种基于独立成分分析的谱聚类算法。利用独立成分析作为预处理,消除了数据内的冗余信息,使得待聚类数据点在高阶统计量的意义下相互独立。文中对比实验证明了该方法的有效性。  相似文献   

14.
针对谱聚类算法计算复杂度高,不适用于合成孔径雷达图像分割的问题,利用谱聚类算法与权核k均值之间的等价性,提出一种基于局部相似性测度的SAR图像多层分割算法.首先提取图像中每个像素的小波纹理特征,利用每个像素点的纹理特征计算各自的局部尺度参数,进而构造像素点之间的邻接关系,然后利用最近邻规则对此邻接关系进行逐层合并,进行基础聚类和逐层细化实现像素点聚类,最终得到图像的分割结果.对人工纹理图像和SAR图像的分割结果表明了新算法避免了传统谱聚类算法对尺度参数的敏感性,获得了更优的分割性能.  相似文献   

15.
基于网格的参数自动化聚类算法   总被引:9,自引:1,他引:9  
提出了一种基于网格的参数自动化聚类算法PAG,主要目的是解决传统的网格聚类算法对参数敏感的问题.算法采用参数自动化技术来处理参数,即算法开始运行时所需的参数直接由参数自动化技术中的公式计算得出,不需要用户输入任何参数.通过对大量数据集的实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好地识别出孤立点或噪声,并且有很好的精度.  相似文献   

16.
基于算法改进的ART2数据聚类方法研究   总被引:1,自引:0,他引:1  
为提高聚类精度和产生更多类别相关信息,在分析了传统聚类方法对最初样本集过分依赖,不能动态适应样本空间变化,不能动态决定聚类数目等不足后,通过介绍其特性和优点提出应用自适应谐振神经网络(ART2)作为聚类算法;针对经典ART2模型的主观设置警戒参数、输出无组织等不足,提出基于改进算法的ART2模型用于聚类分析;通过自组织、迭代、加权等过程推导合理类别的聚类所需要的警戒参数,仿真实验证明了本算法的有效性.  相似文献   

17.
针对原始谱聚类算法初始化敏感的缺点,提出了一种基于联合模型的初始化独立谱聚类算法并将其用于图像分割.通过引入联合模型可以充分利用待聚类数据所包含的空间邻近信息和特征相似性信息,得到更精确的聚类结果;通过引入K-调和平均算法克服了原始谱聚类算法对初始化的敏感性,从而得到更稳定的聚类性能.最后,通过对纹理图像和合成孔径雷达图像分割验证了新算法的有效性.  相似文献   

18.
In order to combine feature extraction operations with specific hyperspectrai remote sensing information processing objectives, two aspects of feature extraction were explored. Based on clustering and decision tree algorithm, spectral absorption index (SAI), continuum-removal and derivative spectral analysis were employed to discover characterized spectral features of dif-ferent targets, and decision trees for identifying a specific class and discriminating different classes were generated. By combining support vector machine (SVM) classifier with different feature extraction strategies including principal component analysis (PCA), minimum noise fraction (MNF), grouping PCA, and derivate spectral analysis, the performance of feature extraction approaches in classification was evaluated. The results show that feature extraction by PCA and derivate spectral analysis are effective to OMIS (operational modular imaging spectrometer) image classification using SVM, and SVM outperforms traditional SAM and MLC classifiers for OMIS data.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号