首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
针对谱聚类算法相似度函数设置困难问题,提出了一种使用证据累积的文本聚类谱算法.该算法使用超球K均值算法对文本集进行多次聚类,并将每次得到的划分结果作为判断2个文本是否应该放在一个簇中的证据,由此构建文本的相似度矩阵和正则化拉普拉斯矩阵.在TREC和Reuters文本集上进行了实验,验证了本文算法的有效性,它比层次聚类算法和CLUTO提供的K均值算法更加优越.  相似文献   

2.
针对模糊c-harmonic均值算法(FCHM)在不平衡数据集上的聚类效果不理想的问题,提出了一种基于聚类体量约束的模糊c-harmonic均值算法。首先,利用隶属度矩阵定义各个类的体量,用于约束FCHM算法的代价函数,从而构建一个新的代价函数;然后,将该代价函数最小化,得到新的隶属度矩阵和聚类中心的计算公式;最后,在UCI数据集、模拟不平衡数据集及真实机床振动检测不平衡数据集上分别进行实验。实验结果表明,与同类算法相比,本文算法在保持传统算法全局最优性能的同时,在不平衡数据集上也能得到理想的聚类效果。  相似文献   

3.
自动确定聚类数和海量数据的处理是谱聚类的关键问题。该文提出了一种能自动确定类个数的谱聚类算法,该算法通过数据亲合矩阵的谱分解得到一系列特征值,再利用特征值差值分析来自动确定类个数。并通过对复杂分布数据和UCI数据库中的数据集进行实验,结果表明该算法不仅能找到合适的类个数,并且有较好的分类准确性。  相似文献   

4.
通常大规模复杂网络中社团数量是未知的,针对K-means谱聚类社团发现算法无法自动确定社团数量和聚类精度不高的缺点,提出了基于本征间隙和模糊c均值算法的自动谱聚类算法发现算法(FCMASC).该算法利用特征值的最大本征间隙来确定社团划分数量k,以特征向量矩阵线性相关性来确定FCM算法的初始聚类中心,运用FCM算法来对特征矩阵向量矩阵进行聚类.实验结果显示FCMASC算法能够有效提高聚类精度.  相似文献   

5.
为了解决单核子空间聚类算法在图像分割任务中无法较好地处理数据非线性结构和噪声等问题,提出了一种基于非凸低秩子空间聚类的图像分割方法。首先,采用自适应形态学重构种子分割方法对梯度图像进行逐点最大值运算,将图像预分割为不同区域大小的超像素图像,弥补了超像素分割算法过度分割的缺陷;其次,对超像素块进行颜色特征提取,并堆叠成数据矩阵输入到多核子空间聚类算法中;再根据子空间表示求解系数矩阵,进而构造出亲和矩阵;最后,输入谱聚类中得到最终的分割结果。在公共数据集上的对比实验结果表明,所提方法取得了最佳的聚类性能和分割效果。  相似文献   

6.
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.  相似文献   

7.
针对基于核的多视图聚类算法(kernel based multi-view clustering method, MVKKM)在处理大规模数据集时运行时间长的缺点,引入增量聚类模型的概念,将MVKKM算法与增量聚类模型相结合,提出基于核K-means的多视图增量聚类算法(incremental multi-view clustering algorithm based on kernel K-means, IMVCKM)。通过将数据集分块,在每个数据块中使用MVKKM算法聚类,并将每个数据块的聚类中心作为下个数据块的初始聚类中心。将所有块的聚类中心进行整合后再次进行多视图聚类,得到最终的聚类结果。试验结果表明,在3个大规模数据集上,IMVCKM算法相较于MVKKM算法在3个评价指标上具有更好的聚类结果,且运行时间更短。该算法在保证聚类性能的基础上大大降低算法的运行时间。  相似文献   

8.
为减少社区发现算法中参数的选择对社区划分的影响,同时使算法能够自适应地进行社区划分,本文提出一种基于核密度估计的密度峰值聚类的社区发现算法KDED.首先,定义一种基于信任度的距离度量,将社交网络中的用户关系量化为距离矩阵,使用矩阵元素的大小度量用户关系的紧密程度;然后对距离矩阵进行核密度估计,统计各个节点在网络中的影响大小,结合热扩散模型改进计算流程,使其自适应不同规模的数据集以提高计算精度;结合密度峰值聚类原理和社区属性确定社区中心节点后,可根据节点间的距离得到社区内部层次结构和社区外部的自然结构;最后将剩余节点按距离分配到相应的社区当中以完成社区划分.仿真结果表明:通过可视化软件可观察到,通过KDED算法得到的社区划分结果具有清晰的自然结构和内部层次结构;随着社区规模的提升以及划分难度增加,KDED算法具有出色的稳定性;在真实数据集以及LFR基准网络上均得到较为接近真实划分结果的社区划分,自适应性良好,验证算法的可行性与有效性.  相似文献   

9.
结合基于视觉原理的密度聚类算法对初始化参数不敏感、能发现任意形状的聚类、能够找出最优聚类及一趟聚类算法快速高效的特点,研究可以处理混合属性的高效聚类算法.首先简单改进基于视觉原理的密度聚类算法,使之可以处理含分类属性的数据,进而提出一种两阶段聚类算法。第一阶段使用一趟聚类算法对数据集进行初始划分,第二阶段利用基于视觉原理的密度聚类算法归并初始划分而得到最终聚类。在真实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的。  相似文献   

10.
针对多数聚类集成方法忽视潜在信息或获取潜在信息方法复杂这一缺点,提出一种基于链接的模糊聚类集成方法。该算法首先利用模糊聚类算法建立集成信息矩阵,然后使用相应的链接方法将集成信息矩阵转化为反映数据相关性的权重图,最后运用图划分技术得到最终结果。实验结果表明,新提出的算法可以有效地获取潜在信息,同时提高聚类质量。  相似文献   

11.
谱聚类算法中用亲和矩阵特征值最大的k个特征向量并不总是能有效地发现数据集的结构。为了选取较好特征向量,提出了一种特征向量的Bagging选取算法。以成对约束计分方法为评价标准,对特征向量进行评价并选出较好的特征向量,将多次选择的特征向量进行Bagging集成(Bootstrap aggregating),得出k个特征向量的组合。该算法能够较好地选取出特征向量,根据UCI实验数据集的测试,证实该算法对测试数据集可以得出较好的预测结果。  相似文献   

12.
提出了运动目标的空间运动模式辨识与异常交通行为检测方法。利用改进Hausdor-ff距离的轨迹空间度量方法构建了轨迹集合的空间距离相似度矩阵。根据谱聚类算法学习轨迹的空间分布,提取了运动目标的典型运动模式。在此基础上,提出了基于Bayes分类器的轨迹空间运动模式匹配方法,进而检测异常交通行为。以实际交通场景中的车辆换道行为检测为例,验证了方法的有效性。该方法可以为运动目标交通行为特性以及交通管理控制等方面的研究提供技术支持。  相似文献   

13.
为了克服谱聚类图象分割方法性能容易受到图像大小和相似性测度的影响,提出一种基于灰度和空间特性的谱聚类图像分割算法。该算法不对图像中的像素之间建立相似性,而是利用各个像素的灰度在图像中的分布信息和像素点的空间邻接信息建立灰度之间的相似关系,通过对图像中灰度的分类进而获得原始图像的分割结果。因此,该算法不会受到图像大小的限制,无论对于多大的图像,相似性矩阵的大小都是小于等于256×256。Berke-ley基准图像数据集上的分割仿真实验验证了该方法的有效性。  相似文献   

14.
模糊逻辑和谱聚类的字符图像分割   总被引:1,自引:0,他引:1  
为了从复杂背景中有效分离出字符图像,提出了一种基于模糊逻辑的谱聚类字符图像分割方法.利用最大信息熵准则获得模糊函数的参数,将原始图像模糊化;在模糊后的图像上建立像素间的相似矩阵,文本图像的纹理、灰度及像素间的距离是定义相似函数的依据,计算相似矩阵最小特征值对应的特征向量,并对其聚类划分;利用分类后的特征向量对相似矩阵进行划分,进而实现原图像的分割.实验结果表明:本文方法优于一般的阈值化分割方法,能够有效处理背景复杂的自然场景文本图像.  相似文献   

15.
为了解决传统模糊C均值算法(FCM)依赖初值、易于陷入局部极值的问题,设计实现了一种遗传模糊C均值聚类算法(GFCM),该算法以模糊聚类中心矩阵为优化变量,将FCM算子引入遗传算法中以增强遗传算法的寻优能力,对聚类中心施加进化扰动以寻找最优聚类;描述了FCM和GFCM的基本流程,通过一个织物性能聚类评价例子对比了两种方法的性能,证明了GFCM的优越性.  相似文献   

16.
多视图子空间聚类是处理高维数据的一种聚类方法,通过分别在每个视图上构造邻接矩阵的方法解决聚类问题,但未考虑到低秩表示和稀疏约束的结合在构造邻接矩阵中的重要性. 针对此问题,提出一种联合低秩表示和稀疏约束的双层多视角子空间聚类方法,使其更全面地描述数据本身,从而实现更有效的聚类,并采用ADMM方法来解决每个视图相关的低秩表示和稀疏性约束优化问题. 在多个数据集上的实验表明,其聚类性能比现有的多视角子空间聚类算法好,低秩表示和稀疏约束的结合可以提高聚类的准确性.  相似文献   

17.
针对谱聚类算法计算复杂度高,不适用于合成孔径雷达图像分割的问题,利用谱聚类算法与权核k均值之间的等价性,提出一种基于局部相似性测度的SAR图像多层分割算法.首先提取图像中每个像素的小波纹理特征,利用每个像素点的纹理特征计算各自的局部尺度参数,进而构造像素点之间的邻接关系,然后利用最近邻规则对此邻接关系进行逐层合并,进行基础聚类和逐层细化实现像素点聚类,最终得到图像的分割结果.对人工纹理图像和SAR图像的分割结果表明了新算法避免了传统谱聚类算法对尺度参数的敏感性,获得了更优的分割性能.  相似文献   

18.
针对传统近邻传播聚类算法不能进行限定类簇数目的聚类缺陷,提出一种三阶段的改进聚类方法。该方法通过近邻传播聚类从数据集中获得中心代表点集合,利用K-means算法对中心代表点集合进行指定类簇数目的聚类进而获得初始训练集,结合改进的K最近邻算法实现数据的聚类分析。采用人工仿真数据及UCI数据集进行对比实验,实验结果分析表明,与近邻传播聚类算法和传统限定类簇数目的聚类算法相比,新聚类算法具有更好的聚类效果。  相似文献   

19.
聚类分析的一个重要应用就是图像识别,谱聚类因为比传统的聚类方法更高效而迅速被广泛运用到图像处理中。谱聚类算法其中一个重要的步骤是构造一个合适的相似矩阵,本文提出一种基于共享近邻重要性的自适应谱聚类算法且应用到数字手写图像识别中,与自适应谱聚类算法做比较试验,表明谱聚类算法能取得较好的识别结果。  相似文献   

20.
为解决核模糊相似性度量谱聚类算法的样本点降噪问题,优化聚类效果和稳定性,本文从分析异常点分布特性出发,引入局部异常因子(LOF)算法,提出聚类中心候选对象的概念,过滤数据集的噪声数据,从而优化初始聚类中心的计算,突出正常样本点在聚类中心调整中的影响力,使聚类算法更易于得出准确的聚类结果. 同时提出一种局部过滤因子以修正相似性度量的方法,该方法通过放大正常数据之间的权值、缩小正常数据与噪声数据间的权值,使优化后的核模糊谱聚类算法大大降低对异常点的敏感度. 算法有效性实验和算法稳定性实验表明:该方法对相似性度量修正的有效性使核模糊谱聚类算法更为稳定和鲁棒.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号