共查询到20条相似文献,搜索用时 62 毫秒
1.
IncSNN——一种基于密度的增量聚类算法 总被引:1,自引:0,他引:1
基于密度的聚类算法是一类重要的聚类算法,能发现任意形状的簇,但由于它的时间复杂度较高,因此设计有效的增量更新算法是一个重要研究方向.在SNN算法的基础上,提出一种基于密度的增量聚类算法-IncSNN.该算法将所更新对象的空间进行划分,定义了基于该划分的最近邻居的概念,进而确定了受影响对象的集合,当算法更新时,只需要对受影响的数据进行处理.由于受影响对象的集合远小于原数据集合,因此显著提高了算法的效率.实验结果验证了IncSNN的有效性. 相似文献
2.
3.
传统的划分聚类算法必须指定簇的数量且聚类结果受初始条件的影响较大.针对此缺点,提出了一种基于PSO和K-means的混合动态聚类算法--DKPSO,运行过程中能够自动确定聚类簇的最佳数量.此算法在初始时将聚类数据划分为较多数量的簇以减少初始条件的影响,然后使用离散PSO算法不断优化簇的数量并使用K-means算法进一步优化每个粒子代表的聚类中心.为了提高收敛速度,对算法进行了的改进,使每个粒子的惯性权重随迭代次数非线性自适应地调整.最后通过实验对算法的有效性进行了验证,并给出实验结果. 相似文献
4.
针对基于密度的空间聚类及其变种提出了拓扑的概念。给出了聚类拓扑结构的定义,把簇定义为多种拓扑连通集合。此外,运用全新的拓扑思想改进典型的算法,提出了一种拓扑聚类的新算法。实例证明此算法有效。 相似文献
5.
引入了一种新的基于网格的数据压缩方法,并应用该方法对处理大型空间数据集的聚类算法SGRIDS进行研究。该方法考虑输入参数对聚类算法质量有较大影响,对密度阈值的确定进行了改进,从而减小输入参数的影响。实验证明,该方法能够获得较好的聚类效果。 相似文献
6.
针对群聚类算法的速度问题,提出一种基于模板缩减法加速的新型粒子群广义遗传(PSO-GGA)聚类算法。为了充分地同模板缩减法相结合,该算法采用一种广义遗传算法与粒子群算法串行使用,既能增加种群多样性,又能对模板缩减操作中需要保护的模板进行储存。同时,对每个周期替换粒子数量采用一种递增策略来充分吸取粒子群快速寻优和遗传算法搜索空间大的特性。实验表明:对8个数据集进行测试,该算法能够在基本不降低聚类品质的基础上,显著地缩短聚类时间。 相似文献
7.
一种基于密度的快速聚类算法 总被引:52,自引:0,他引:52
聚类是数据挖掘领域中的一个重要研究方向,聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用,迄今为止人们提出了许多用于大规模数据库的聚类算法。基于密度的聚类算法DBSCAN就是一个典型代表。以DBSCAN为基础,提出了一种基于密度的快速聚类算法。新算法以核心对象领域中所有对象的代表对象为种子对象来扩展类,从而减少区域查询次数,降低I/O开销,实现快速聚类,对二维空间数据测试表明:快速算法能够有效地对大规模数据库进行聚类,速度上数倍于已有DBSCAN算法。 相似文献
8.
9.
一种特征加权的聚类算法框架 总被引:3,自引:0,他引:3
为了考虑数据各维特征对聚类的不同贡献,并把有监督特征评价方法应用到无监督分类问题中,提出一种特征加权的聚类算法框架.该框架首先通过某种聚类算法对数据聚类,然后,根据聚类结果,采用有监督特征评价方法学习各维特征的权值,再根据特征权值重新聚类,之后再次学习特征权值,该过程反复迭代,直至算法收敛或达到指定的迭代次数.欧几里德空间内基于距离、基于密度的聚类算法均适用于本框架.基于本框架,采用模糊C均值聚类算法(FCM)、密度聚类算法(DBSCAN),并通过信息增益特征评价、ReliefF特征评价方法,对多个UCI数据集进行了实验,验证了该框架的有效性. 相似文献
10.
一种改进的模糊聚类图像分割算法研究与仿真 总被引:3,自引:0,他引:3
针对相似图像分割过程中,输入像素数据在转换空间上存在的不连贯和幅度变化特征差异很小,像素的隶属关系很难准确界定,导致分割阀值设定过程出现较大衰减,分割误差较大的问题,提出一种改进的模糊聚类图像分割算法.分析了传统的模糊C-均值聚类图像分割算法的弊端,对像素模糊划分矩阵和聚类中心进行推导,将迭代过程中像素数据集对聚类隶属的可能性和不确定性关系融入分割目标函数中,依据可能隶属度和不确定隶属度建立改进分割准则函数,同时对像素聚类进行更新,实现图像分割.仿真结果验证了所提算法的有效性,结果表明,改进后的方法在分割检测过程中,图像误差明显减小. 相似文献
11.
12.
一种基于投票策略的聚类融合算法 总被引:1,自引:0,他引:1
在分类算法和回归模型中,融合方法正得到越来越广泛的应用,但在非监督机器学习领域,由于缺乏数据集的先验知识,则不能直接用于聚类算法.提出并实现了一种基于投票策略的聚类融合算法,该算法利用k-means算法每次随机选取聚类中心而得到不同样本划分的特性,将多次运行得到的聚类结果通过投票的方式合并,从而得到最终的结果.通过一系列真实数据和合成数据集的实验证明,这种方法比单一的聚类算法能更有效地提高聚类的准确率.在此基础上,为了降低高维数据运算的复杂性,将随机划分属性子空间的方法应用到上述聚类融合算法中,实验证明,该方法同时也能够在一个属性子空间上获得好的聚类结果. 相似文献
13.
对交易序列进行各种挖掘分析能为商家制定营销策略提供量化依据.文中从销售量及变化趋势角度研究交易序列数据集的内在结构,定义了一种反映价格变化趋势的增长模式及其错位组合距离和角度向量距离两种相似性度量,在此基础上设计一个考虑时限约束的目标函数进行聚类研究.实验数据采用真实的商品交易序列集,结果表明,在时限约束的条件下,增长模式这种特征提取方式及其模式间的两种距离函数能较好地产生聚类结果,且这些聚类结果能得到较好地解释. 相似文献
14.
一种基于遗传算法的聚类新方法 总被引:14,自引:1,他引:14
1 引言数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘更广义的说法是:数据挖掘意味着在一些事实或观察数据的集合中寻找模式的决策支持过程。人们把原始数据看作是形成知识的源泉,就像从矿石中采矿一样。原始数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现 相似文献
15.
16.
17.
短文本聚类一直是信息提取领域的热门话题,大规模的短文本数据中存在“长尾现象”,传统算法对其聚类时会面临特征纬度高,小类别信息丢失的问题,针对对上述问题的研究,本文提出一种频繁项协同剪枝迭代聚类算法(Frequent Itemsets collaborative Pruning iteration Clustering framework,FIPC).该算法将迭代聚类框架与K中心点算法相结合,运用协同剪枝策略,实现对小类别文本聚类,实验结果证明该聚类算法能够有效的提高小类别短文本信息聚类的精确度,并能避免聚类中类簇重叠的问题. 相似文献
18.
现有半自动跟踪系统将操作员等效为准线性环节,增大了训练的难度和成本,不适应复杂战场环境下多个快速机动目标的选取和跟踪.利用特征提取方法得到视场的“潜在目标”集,引入模糊聚类方法,通过对操作响应进行分类,建立操控意图与目标运动特征之间的关系模型.通过充分的仿真试验,对比研究了跟踪平稳性、快速性、准确性等指标,结果说明该方法能够有效提升整体跟踪性能. 相似文献
19.
针对确定聚类中心上对密度峰值和距离两个元素综合考虑上的不足,在确定聚类中心上对密度峰值和距离两个元素综合考虑并作出归一化的处理.在聚类中心的确定上与其他聚类算法有所不同.介绍了该算法的核心思想、实现及测试,得出了算法实现过程中体现出的结论.对实现的代码用4个数据集进行了实验和测试,并将该算法与经典的k-means算法进行了NMI对比分析.从而得出结论,文章的聚类算法拥有较好的聚类能力. 相似文献
20.
聚类是数据挖掘中重要的研究方向。本文针对现有的聚类算法中相似度量的缺陷,提出了一种新的相似性度量方法。在此基础上,将粗糙集理论中的区分能力引入到聚类算法中,用来度量属性的重要性,进而提出了一种能够处理符号型数据的新的加权粗糙聚类算法。通过对UCI数据的实验表明,本文算法对数据输入顺序不敏感,且不需要预先给定簇的数目,提高了聚类的质量。 相似文献