共查询到19条相似文献,搜索用时 93 毫秒
1.
基于密度的最小生成树聚类算法,将最小生成树理论与基于密度的方法相结合,不仅体现了基于密度聚类方法的优点,而且聚类结果不依赖于用户参数的选择,聚类结果更合理,特别是对大数据集,算法非常有效。因此,本文在基于密度的MST聚类的基础上,通过减少数据集扫描次数以提高离群检测的效率。理论分析表明,检测算法可以有效地处理分布不均的数据集,适用于大规模数据集的挖掘。 相似文献
2.
最小生成树用于基因表示数据的聚类算法 总被引:6,自引:0,他引:6
在生物学研究中,需要对植物和动物分类,对基因进行分类,以获得对种群固有结构的认识.使用聚类分析方法,有效地鉴别基因表示数据的模式,将它们分组成为由类似对象组成的多个类,对研究基因的结构、功能以及不同种类基因之间的关系都具有重要意义.将图论的最小生成树理论引入分子生物学中基因表示数据的聚类分析方法,设计了生成树的表示和基于最小生成树的聚类算法,证明了该方法对于一些准则函数能够产生全局最优簇,并根据实验结果对算法进行了讨论和评价. 相似文献
3.
《计算机应用与软件》2018,(2)
传统的k-means方法和层次聚类算法,当数据集出现离群点或簇间存在交叠时会产生错误聚类结果。受小波多分辨率分析启发,提出一种基于图金字塔的聚类算法。首先输入数据集的类别数目K,并对数据点构建最小生成树;然后按节点的度数与最短邻边的长度计算优先级;接着,按优先级由高到低遍历最小生成树,进行节点间的合并;最后输出由合并节点构成的聚类结果。在人工合成和真实数据集上的实验结果表明,与k-means方法和层次聚类法相比,该方法的聚类结果不受离群点和簇间有交叠的影响,具有较高的稳定性。 相似文献
4.
5.
聚类分析的两个基本任务是分析数据集中簇的数量以及这些簇的位置。大多数的聚类方法通常只关注后一个问题。为了在聚类数不确定的情况下实现聚类分析,本文提出了一种新的结合人工免疫网络和Tabu搜索的动态聚类算法—DCBIT。新算法主要包含两个阶段:先使用人工免疫网络算法获得一个候选聚类中心集,然后使用Tabu搜索在候选聚类中心集上实现动态聚类。仿真实验结果表明与现有方法相比,新方法具有更好的收敛概率和收敛速度。 相似文献
6.
一种基于混合遗传算法的聚类方法 总被引:1,自引:0,他引:1
针对遗传算法在聚类时存在的搜索速度慢和早熟的问题,将禁忌搜索的自适应优点引入遗传操作来改良其全局搜索性能,并采用带有权重的相似性度量方法,提出了一种基于混合遗传算法的聚类算法.通过与常用的聚类方法的实验结果比较,表明这种方法具有良好的聚类效果. 相似文献
7.
基于混合遗传聚类的入侵检测算法 总被引:2,自引:0,他引:2
提出了基于混合遗传聚类的入侵检测算法——IDBHGC,它能自动完成初始聚类簇集合建立、组合优化和入侵行为标识的整个检测过程。实验证明,该算法在已有研究基础上进一步提高了检测性能。 相似文献
8.
针对传统密度聚类算法因使用全局变量导致对不平衡数据集的适应能力较差的问题,提出了一种基于最小生成树的密度聚类算法.首先进行数据集密度峰值计算,用于估计全局密度;然后通过密度聚类将数据集划分为高密度区域和低密度区域;接着构建和分割最小生成树对低密度区域内样本进行关联挖掘,用于将高密度区域与低密度区域互联;最后计算簇密度并以此作为特征进行簇合并,得到聚类结果.该算法结合图论知识,将数据按密度特征进行分块后合并处理,克服了传统密度聚类算法存在的局限性.通过选取多个不平衡人工数据集和UCI数据集对该算法进行测试,验证了该算法的有效性与鲁棒性. 相似文献
9.
为得到好的聚类效果,需要挑选适合数据集簇结构的聚类算法。文中提出基于网格最小生成树的聚类算法选择方法,为给定数据集自动选择适合的聚类算法。该方法首先在数据集上构建出网格最小生成树,由树的数目确定数据集的潜在簇结构,然后为数据集选择适合所发现簇结构的聚类算法。实验结果表明该方法较有效,能为给定数据集找出适合其潜在簇结构的聚类算法。 相似文献
10.
11.
为了满足高效率的自动化生产需要,支持流程控制的工作流管理系统 的应用越来越广泛。流程挖掘可以使用事件日志等历史数据生成抽象流程模型,为工作流系统的部署提供有利条件。首先总结归纳了一种较通用的基于启发式优化算法的流程挖掘框架;然后依照该流程挖掘框架将禁忌搜索算法用于流程挖掘领域,针对禁忌搜索中程序初始化、邻域构建方法和禁忌表构造等几个关键问题进行了详细阐述和论证;最后将算法实现为ProM的插件并进行了对比实验。实验验证了该流程挖掘框架的正确性,表明了禁忌搜索流程挖掘方法对不同流程结构具有良好支持,对数据噪声具有较强的鲁棒性和更少的时间消耗。 相似文献
12.
模糊学习矢量量化算法(FLVQ)虽然解决了硬的竞争学习对初始码本的依赖性问题,但收敛速度变慢,且仍无法克服陷入局部最小。为此在分析模糊学习矢量量化图象编码原理的基础上,探讨了FLVQ算法的几种优化途径,进而进出了一种基于Tabu搜索(TS)的模糊学习矢量量化的新算法(TS-FLVQ),并给出了该算法的具体实现方法及步骤。该算法首先利用TS技术产生一个面向全局搜索的寻优列表,然后再进行模糊学习以得到最优解,实验结果表明,该算法在收敛速度及编码效果上均较FLVQ有较大的提高。。 相似文献
13.
模糊学习矢量量化算法 (FL VQ)虽然解决了硬的竞争学习对初始码本的依赖性问题 ,但收敛速度变慢 ,且仍无法克服陷入局部最小 .为此在分析模糊学习矢量量化图象编码原理的基础上 ,探讨了 FL VQ算法的几种优化途径 ,进而提出了一种基于 Tabu搜索 (TS)的模糊学习矢量量化的新算法 (TS- FL VQ) ,并给出了该算法的具体实现方法及步骤 .该算法首先利用 TS技术产生一个面向全局搜索的寻优列表 ,然后再进行模糊学习以得到最优解 .实验结果表明 ,该算法在收敛速度及编码效果上均较 FL VQ有较大的提高 . 相似文献
14.
15.
16.
17.
18.
19.
Tabu搜索算法应用于多级路由问题 总被引:1,自引:0,他引:1
无级电话网中的路由迂回方案可以是多级的,多级路由方案问题是一个复杂度很高的问题,两级Tabu搜索算法的特征是宏观层控制和指导宏观区域的搜索,微观层搜索负责局部区域的集中搜索,该算法成功解决了多级路由问题,两级Tabu搜索算法是一个通用的算法,适用于具有巨大状态空间的组合优化问题。 相似文献