首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 93 毫秒
1.
针对k-means算法对于远离群点敏感和k值难以确定等缺陷,在分析已有的k-means改进算法的基础上,引进肘部法则的思想对数据进行优化处理并且根据自适应思想结合误差平方和SSE(sum of squared error),提出一种自适应调整k值的k-means改进算法。选取机器学习库中的真实数据集进行仿真实验,其结果表明,改进后的k-means算法中的剔除远离群点和自适应调整k值的方法均可行,准确性高、聚类效果质量更优。  相似文献   

2.
基于细菌群体趋药性优化的k-means算法   总被引:1,自引:1,他引:0  
细茵趋药性算法是一种新的仿生进化算法,针对细菌趋药性算法,介绍了其基本原理,讨论了一种改进的算法--细菌群体趋药性(BCC)算法.将细菌群体趋药性优化方法应用在k-means聚类分析中,以类内离散度和为目标函数,建立了BCC优化的k-means算法模型,利用BCC算法的全局搜索能力,很大程度上避免了k-means算法易陷入局部极小的缺陷,同时也降低了算法对初始值的敏感度,并给出了一些实验,结果令人满意.  相似文献   

3.
《软件工程师》2019,(5):32-34
针对传统k-means算法中初始聚类中心随机确定的问题,提出k-means改进算法。首先,定义变量权值,权值的大小等于样本密度乘以簇间距离除以簇内样本平均距离,通过最大权值来确定聚类中心,克服了随机确定聚类中心的不稳定性。然后在Hadoop平台上用Map-Reduce框架下实现算法的并行化。最后以南通公交IC刷卡记录为例,通过改进的k-means聚类算法进行IC卡刷卡记录的分析。实验表明,在Hadoop平台下改进k-means算法运行稳定、可靠,具有很好的聚类效果。  相似文献   

4.
文档聚类中k-means算法的一种改进算法   总被引:14,自引:0,他引:14  
万小军  杨建武  陈晓鸥 《计算机工程》2003,29(2):102-103,157
介绍了文档聚类中基于划分的k-means算法,k-means算法适合于海量文档集的处理,但它对孤立点很敏感,为此,文章提出将聚类均值点与聚类种子相分离的思想,并具体给出了基于该思想的对k-means算法的改进算法,实验表明,该改进算法比原k-means算法具有更高的准确性和稳定性。  相似文献   

5.
陈培毅 《电脑迷》2018,(7):201-202
文章基于k-means改进算法的入侵检测系统进行应用分析,结合当前入侵检测系统发展需要以及传统k-means算法为基础,积极对k-means改进算法进行详细探讨,主要目的在于更好的提高入侵检测系统的检测质量.  相似文献   

6.
入侵检测技术作为一种主动的网络安全防护技术越来越引起研究者的关注,该文以k-means算法为基础,对基于k-means算法的入侵检测系统进行了研究和分析,指出了传统k-means算法的不足,提出了相应的改进策略,在此基础上完成基于k-means改进算法的入侵检测系统的研究。  相似文献   

7.
高波  黄敏 《数字社区&智能家居》2014,(31):7425-7427,7431
入侵检测技术作为一种主动的网络安全防护技术越来越引起研究者的关注,该文以k-means算法为基础,对基于k-means算法的入侵检测系统进行了研究和分析,指出了传统k-means算法的不足,提出了相应的改进策略,在此基础上完成基于k-means改进算法的入侵检测系统的研究。  相似文献   

8.
王萍  蔡思佳  刘宇 《计算机应用》2014,34(6):1587-1590
利用随机投影加速技术将高维矩阵的奇异值分解(SVD)投影到一个低维子空间上进行,可以减少SVD消耗的时间。定义了奇异值随机投影压缩算子,取代之前的奇异值压缩算子,并用这个算子改进了定点连续(FPC)算法得到FPCrp算法。对改进前后的算法进行了大量实验,结果表明:随机投影技术能够在保持算法鲁棒性和精度的同时,节省50%以上的时间。因此,基于随机投影技术的矩阵填充算法更适合求解大规模问题。  相似文献   

9.
聚类是数据挖掘中重要组成部分,为了提高聚类的处理效率,将并行处理技术运用于k-means和PAM算法中,对k-means与PAM算法进行了改进。实验结果表明:并行k-means算法相对串行k-means算法有更好的执行效率;且k-means算法有比PAM算法更好的并行性和可扩展性。最后,该文提出和介绍了将并行技术引入谱聚类算法。  相似文献   

10.
针对电力公司海量数据分类问题,提出一种改进的k-means数据分类方法。在k-means算法的基础上,应用PCA对k-means算法进行降维处理,用canopy算法优化最佳簇集数、初始聚类中心。然后,应用改进的k-means算法对居民用户用电进行聚类;最后以该聚类结果为基础,建立LSTM预测模型。通过LSTM预测模型对某小区90户居民用电数据进行仿真实验,并对比分析了传统聚类、改进聚类和不适用聚类下LSTM三种模型的预测结果。结果表明,未使用任何聚类算法构建的LSTM模型在进行电力负荷预测时,预测结果的精度最低;应用改进的k-means算法构建的LSTM模型预测结果精度最佳。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号