共查询到20条相似文献,搜索用时 15 毫秒
1.
基于划分的数据挖掘K-means聚类算法分析 总被引:1,自引:0,他引:1
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。 相似文献
2.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。 相似文献
3.
4.
潘梓阳 《信息技术与信息化》2023,(2):38-41
目前常见的车牌识别算法有神经网络算法,模板匹配算法等,无论何种车牌识别算法,在车牌发生污损情况时,其正确识别率均有较大程度的下降。为解决这一问题,提出了一种基于K-means聚类算法的车牌去污算法。采用人为控制车牌污损程度的方法定量研究本算法的去污有效性,最终发现采用该算法恢复的污损车牌图像相比于恢复前上升近一倍。在污损程度较小时,采取该算法去污后CNN网络识别正确率可以提升约50%;在污损程度较大时,采取该算法去污后CNN神经网络识别正确率可以上升一倍。 相似文献
5.
6.
一种改进的特征加权K-means聚类算法 总被引:4,自引:0,他引:4
提出了一种改进的特征加权K-means聚类算法.该算法首先基于数据样本分布选取初始聚类中心,然后设计特征加权的K-means聚类算法.实验结果证明,该算法能产生质量较高的聚类结果,并且能处理数值、符号两类数据. 相似文献
7.
8.
9.
10.
提出了一种基于距离相似性K-means的红外图像聚类算法。该算法对通过Isomap算法降维后的空间点,进一步进行聚类;算法中引入了密度因素,通过距离相似性的差异进一步排除孤立点和选取初始聚类中心,使数据内部的紧凑性得到加强。经过实验证明,改进后的方法比原方法更有效,时间复杂度也大幅度降低。 相似文献
11.
12.
阐述运用BP神经网络,计算所有层的误差函数,在指定的范围内进行样本训练获取权重与阈值,计算矩阵的特征向量并排列成新矩阵,获取特征值和阈值,计算样本到聚类中心的距离得到最优聚类数数据,从而实现基于K-mean聚类算法的电力营销数据分析。 相似文献
13.
14.
提出一种适用于大型数据集的分布式聚类算法。该算法以传统的K-means算法为基础进行合理的改进,使之更适用于分布式环境,并从算法的复杂度分析,将该算法与传统的集中式K-means算法及其他分布式算法进行比较。实验表明,该算法在保持了集中式K-means算法所有必要特性的同时,提高了数据处理速度。 相似文献
15.
16.
在线学习是近年来随着互联网的发展而逐渐兴起的一种学习方式,它的便捷性和丰富的学习资源吸引了越来越多的学习者。随着在线学习平台日益普及,海量的用户数据也随之产生。如何从这些数据中提取有价值的信息,促进教育教学质量提升是当前值得思考的重要课题。文章介绍了基于K均值聚类算法(K-means Clustering Algorithm, K-means)的在线学习行为聚类分析方法,为在线学习平台提供了重要的数据分析和应用支持,帮助教师及平台管理者及时调整教学模式和教学策略,以提升学习者的在线学习效果。 相似文献
17.
18.
阐述在传统K-means聚类算法的基础上,改进RFM模型,引入轮廓系数改进K-means聚类算法,检验其可行性,最后对方法进行实证检验,对细分后的结果进行特征分析。与肘部法相比,利用轮廓系数选择K值更加直观有效,能提高客户细分的准确性。 相似文献