排序方式: 共有7条查询结果,搜索用时 15 毫秒
1
1.
对近年来不确定性数据聚类算法的研究现状与进展进行总结。首先对较有代表性的聚类算法,从思想、关键技术和优缺点等方面进行分析。其次选用数据集对基于密度的算法进行测试和对比分析。并给出基于不确定性数据的聚类算法,上述工作将为不确定数据管理提供有益的参考。 相似文献
2.
数据挖掘中经常使用k-means算法,它是经常使用的一种聚类分析算法,但易受初始聚类中心和聚类个数k的影响。因此对近年从算法原理、关键技术和优缺点等方面提出的较有代表性的关于初始聚类中心和k值确定的改进的k-means算法进行了分析。并选用知名数据集对一些典型算法进行测试和应用。上述工作将为数据挖掘的研究提供有益的参考。 相似文献
3.
针对聚类中广泛应用的经典k均值算法随机选择初始质心和易受孤立点影响的不足,给出了二次改进的k均值算法。首先使用距离法移除孤立点,然后采用邻近吸收法对初始聚类中心的选择进行改进,并做了改进前后的对比实验。结果表明,改进后的算法比较稳定、准确,受孤立点和随机选择质心的影响也有所降低。 相似文献
4.
5.
聚类算法初始聚类中心的优化 总被引:1,自引:0,他引:1
对近年来k-means算法的研究现状与进展进行总结.首先对较有代表性的初始聚类中心改进的算法,从思想、关键技术和优缺点等方面进行分析.其次选用知名数据集对典型算法进行测试,主要从就同一个数据集不同改进算法的聚类情况进行对比分析,为聚类分析和数据挖掘等研究提供有益的参考. 相似文献
6.
针对孤立点检测算法的一些弊端和煤矿安全预警系统的实际情况,选择一个基于距离和孤立点检测算法对瓦斯浓度的异常数据进行处理,分析出设备异常数据、噪声数据和瓦斯突出孤立点数据,通过挖掘孤立点来发现真实的潜在的信息,保证安全预警的准确性。 相似文献
7.
基于MMD聚类算法及在高校成绩分析中的应用 总被引:2,自引:1,他引:1
介绍了在聚类算法中广泛使用的k均值算法。针对其受选择初始质心和聚类个数影响的缺点,给出了改进的k均值算法。使用最大最小距离法选择初始聚类中心,并确定聚类个数。进行了改进前后的对比实验。实验结果表明,改进后的算法比较稳定、准确。将改进后的算法应用到高校成绩分析中,达到较好的分类效果。 相似文献
1