共查询到15条相似文献,搜索用时 203 毫秒
1.
提出了一种基于网格生长树的微粒群聚类算法。算法利用网格和密度阈值去除数据集中的孤立点,从网格集中随机地选取种子点,以基于密度距离作为判断生长方向及分类的依据,以网格生长树的大小作为聚类目标函数。引入微粒群算法确定最终的聚类结果。测试表明,基于网格生长树的微粒群聚类算法对于大规模形状复杂非重叠的数据是可行且有效的。 相似文献
2.
分析目前基于聚类思想的遗传算法的不足,提出一种基于生长树聚类的改进型遗传算法。采用最小生成树的聚类方法,能对形状复杂且非重叠样本的候选解进行聚类形成家族;新的族间交叉算子保持了种群的多样性;改进的族内交叉算子和改进的变异算子使得算法在后期仍能快速收敛;实验对经典算法测试函数进行优化,并与其他算法的优化结果对比,从而说明改进型遗传算法的性能。实验结果表明:基于生长树聚类的改进型遗传算法能有效提高求解精度,快速搜索到最优解。 相似文献
3.
4.
基于GIS的空间聚类算法研究 总被引:1,自引:1,他引:0
面对目前的聚类方法的局限性和空间聚类的特殊性,从基于目标函数聚类的概念出发,以GIS的空间数据管理和空间分析为技术支持,探讨了空间样本间直接可达距离、间接可达距离和可达成本的计算方法。随机选择k个样本作为聚类中心点,以空间样本到各聚类中心点的可达距离为样本划分依据,以空间样本到其聚类中心点的可达成本的总和为聚类目标函数,引入遗传算法,提出一种基于GIS的空间聚类算法。最后,通过实例进行了算法测试。 相似文献
5.
6.
空间聚类是空间数据挖掘和知识发现领域的主要研究方向之一,但点目标空间分布密度的不均匀、分布形状的多样化,以及"多桥"链接问题的存在,使得基于距离和密度的聚类算法不能高效且有效地识别聚集性高的点目标。提出了基于空间邻近的点目标聚类方法,通过Voronoi建模识别点目标间的空间邻近关系,并以Voronoi势力范围来定义相似度准则,最终构建树结构以实现点目标的聚集模式识别。实验将所提算法与K-means、具有噪声的基于密度的聚类(DBSCAN)算法进行比较分析,结果表明算法能够发现密度不均且任意形状分布的点目标集群,同时准确划分"桥"链接的簇,适用于空间点目标异质分布下的聚集模式识别。 相似文献
7.
Web信息抽取中需要对目标网站的网页进行聚类分析,以检测并生成信息抽取所需的模板。传统的基于DOM树编辑距离的网页聚类算法不适合文档对象模型(DOM)树结构复杂的动态模板网页,提出了一种基于局部标签树匹配的改进网页聚类算法,利用标签树中模板节点和非模板节点的层次差异性,根据节点对布局影响的大小赋予节点不同的匹配权值,使用局部树匹配完成对网页结构相似性的有效计算。实验结果表明,改进的算法较传统的基于DOM树编辑距离的网页聚类算法,在对采用模板生成的动态网页进行聚类分析时具有更高的准确率,且时间复杂度低。 相似文献
8.
9.
该文提出面向文本距离并独立于聚类过程的聚类重构策略。提出邻近域的概念并阐述了邻近域规则,设计了高斯加权邻近域算法。利用高斯函数根据样本与聚簇中心的距离为样本赋权,计算聚簇间距。基于邻近域权重对文本聚类的结果实施重构。使用拆分算子拆分稀疏聚簇并调整异常样本;使用合并算子合并相似聚簇。实验显示聚簇重构机制能够有效地提高聚类的准确率及召回率,增加聚簇密度,使得形成的聚类结果更加合理。 相似文献
10.
11.
提出了一种基于对偶树复小波变换的模糊纹理图像分割算法,该方法包括纹理特征提取和纹理分类两个阶段,其中,特征提取在对偶树复小波变换的基础上进行;纹理分类可以直接用模糊C均值算法进行聚类从而完成纹理的分割,但由于该算法中隶属度函数是基于样本到类中心的距离设计的,这对非球形分布数据很不合理,针对该问题,引入样本与样本的紧致度来度量类中各个样本之间的关系从而修正隶属度函数,并将其用于纹理分类。实验结果表明与模糊C均值算法在运行时间上相差不大的情况下,改进的方法在分割精度、边缘准确性和区域一致性上都得到了明显的改善。 相似文献
12.
Qing He Weizhong Zhao Zhongzhi Shi 《Soft Computing - A Fusion of Foundations, Methodologies and Applications》2011,15(6):1097-1103
As data mining having attracted a significant amount of research attention, many clustering algorithms have been proposed
in the past decades. However, most of existing clustering methods have high computational time or are not suitable for discovering
clusters with non-convex shape. In this paper, an efficient clustering algorithm CHSMST is proposed, which is based on clustering
based on hyper surface (CHS) and minimum spanning tree. In the first step, CHSMST applies CHS to obtain initial clusters immediately.
Thereafter, minimum spanning tree is introduced to handle locally dense data which is hard for CHS to deal with. The experiments
show that CHSMST can discover clusters with arbitrary shape. Moreover, CHSMST is insensitive to the order of input samples
and the run time of the algorithm increases moderately as the scale of dataset becomes large. 相似文献
13.
针对DBSCAN算法的聚类性能受全局阈值影响而降低的问题,提出一种阈值优化的文本密度聚类算法。该算法使用k-近邻距离对对象进行排序,通过分位数区分密度不同的各序列,找到与其对应的优化,根据优化阈值使用密度聚类方法对对象进行聚类。改进后的聚类算法克服了阈值选取对聚类结果影响的问题,提高了聚类精确度和时间效率。采用树形结构存储聚簇,增加了聚簇的可读性。实验结果证明了该算法的有效性。 相似文献
14.
15.
基于密度的方法和基于距离的方法是两类常用的对象聚类方式。本文提出了一种基于对象“形状”的聚类算法,外表面距离为零的对象将被自动聚为一类。文中给出了对象形状的定义,有形对象之间距离的计算方法,以及基于对象形状的聚类算法。最后给出一个具体实例,说明了理论和实际的相容性。 相似文献