首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
传统的k均值算法对初始聚类中心敏感。在实际应用中,找到一组初始中心点,从而获得一个较好的聚类效果并消除聚类结果的波动性对k均值算法具有重要意义。本文对文献提出的基于Huffman树构造的思想选取初始聚类中心、基于均值-标准差选取初始聚类中心、基于密度选取初始聚类中心、采用最大距离积法选取初始聚类中心等4个算法从算法思想、关键技术等方面进行了比较研究。  相似文献   

2.
《Planning》2020,(1)
本文对K-means算法的缺点做出了一些改进,提出了一种基于遗传算法GA-K-means的算法。利用遗传算法初始化K-means的初始聚类中心点,改进后的算法解决了K-means算法容易因为初始聚类中心的选择不同而陷入局部最优解的问题。实验表明,改进后的算法聚类结果稳定且聚类效果较好。  相似文献   

3.
《Planning》2016,(14)
为解决传统K-means算法在处理海量数据时存在的不足,提出了1种适用于并行Canopy-Kmeans算法的迭代式MapReduce模型。通过Canopy算法对数据进行初始聚类,得到初始聚类中心,并按照初始聚类将数据存储于Mapper节点,减少Mapper和Reducer节点之间通信线路,减小运算量;在Mapper节点和Reducer节点之间建立互通信,将聚类中心作为迭代流通信息,减少信息流量;最终通过1次运算过程输出最终聚类结果。实验结果证明,改进的算法在时间、正确率和加速比性能方面,均优于传统的串行K-means算法,并在基于传统MapReduce模型的K-means算法基础上有所提高。  相似文献   

4.
《Planning》2015,(2)
针对利用距离差聚类分析算法分析学生学科成绩不够准确的问题,提出了利用标准差计算标准偏移量构建目标函数的K-means聚类分析算法,给出了初始聚类中心选取办法和算法的描述及处理流程;实验结果分析可得,利用标准偏移量构建的学生成绩K-means聚类分析算法,符合对学生成绩按学科类别聚类分析的特性要求;该算法能够较好的实现学科成绩高度关联属性的聚类分析结果。  相似文献   

5.
为了解决传统归一化割(Normalized cut,Ncut)算法需要人工干预因素过多,限制了算法的通用性,本文对传统Ncut算法进行了改进,提出了自适应的图像分割方法。首先采用基团势的理论替代了传统的Ncut算法中计算权值矩阵时两个控制参数对结果的影响;然后为了减少K-means算法对分类数目和类中心的敏感,本文采用基于最小生成树的聚类方法对Ncut计算出的特征向量进行分类,得到最终的分类数目和初始类中心,然后再采用K-means算法进行聚类得到最终的分割结果。实验结果显示,本文的算法不仅提高了算法的通用性,并且分割效果比较好。  相似文献   

6.
建立供热管网泄漏数据采集系统,以干管某管段出现泄漏为例,采集压力测点(设置5个压力测点,将干管分为4个管段,泄漏点设置在压力测点1与2之间)的压力随测试时间的变化。以测试时间内压力测点的压力作为样本,经数据预处理(数据采集与选取、缺失值处理、噪声清理)后,分别采用样本熵法、基于K-means均值聚类算法的数据挖掘算法对泄漏段进行诊断。样本熵法可提取压力测点信号变化(主要为压力测点的压力变化)的差异性,根据一定规模的样本熵均值,判定泄漏管段的位置。基于K-means均值聚类算法的数据挖掘算法,在小规模样本量的前提下,通过人为扩大样本规模,结合样本熵法与K-means均值聚类算法,经聚类处理、均值处理,确定簇心样本熵及位置,从而判定泄漏段位置。与样本熵法相比,基于K-means均值聚类算法的数据挖掘算法,以较小规模的样本量实现泄漏段的诊断,而且诊断结果更加直观。样本熵法很难由小规模样本量确定泄漏段位置。  相似文献   

7.
《Planning》2014,(3)
传统的K-means算法要求事先给出聚类数k值,从而导致聚类质量的下降。本文提出一种基于聚类有效性函数IG的K-means算法,该函数定义为数据特征轴总长度的平方与最小类间距的比值,当比值达到最小时对应的值为最佳聚类数k。而且,与其它有效性函数比较,IG能高效处理簇密度不同的数据集。实验证明,改进算法提高了聚类质量。  相似文献   

8.
《Planning》2016,(1)
在文本聚类中,基于向量空间模型(VSM)的文本特征空间存在高维度和稀疏空间、同义词与多义词干扰等问题;而K-means算法依赖于初始聚类中心,聚类结果随不同的初始输入而有所波动。针对这些问题,本文提出了一种基于潜在语义分析(LSA)与优化的模糊C均值(FCM)的文本聚类算法——LF。该算法首先采用一种新的词特征提取方法建立词-文本矩阵;然后对该词-文本矩阵进行奇异值分解在潜在语义空间进行降维;接着用优化的模糊C均值聚类算法实现对文本的聚类分析。最后通过实验,结果表明LF算法能更好地改善了文本聚类的结果,提高了文本的查全率和查准率。  相似文献   

9.
针对说话人确认识别率不高及实时性差的问题,在深入研究传统高斯混合模型以及K均值聚类算法的基础上提出两种基于说话人高斯混合模型的说话人聚类算法:KL散度聚类算法和巴氏距离聚类算法。根据不同的聚类算法,得到各个类的聚类中心模型,将其作为SVM的输入得出最终识别结果。仿真实验将两种聚类算法进行详细的分析比较,实验结果显示巴氏距离聚类算法具有较好的识别性能和抗噪性。  相似文献   

10.
《Planning》2019,(19)
本文研究了基于大数据下的多维数据分析处理方法:针对大数据的多维离散拘束高效分析处理方法。该方法采用空间重构方法对多维数据采取离散映射,找到最小嵌入维数和最合适的时延构造信息流模型,并采用模糊聚类算法求解初始聚类中心搜索目标函数,从而获取到多维数据的最优聚类中心,利用优化算法实现聚类优化完成多维数据的高效聚类,仿真实验结果证明了该方法的可行性,提高计算效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号