首页 | 本学科首页   官方微博 | 高级检索  
     

Spark环境下K-means初始中心点优化研究综述
引用本文:行艳妮,钱育蓉,南方哲,赵京霞.Spark环境下K-means初始中心点优化研究综述[J].计算机应用研究,2020,37(3):641-647.
作者姓名:行艳妮  钱育蓉  南方哲  赵京霞
作者单位:新疆大学 软件学院,乌鲁木齐830046;新疆大学 软件学院,乌鲁木齐830046;新疆大学 软件学院,乌鲁木齐830046;新疆大学 软件学院,乌鲁木齐830046
基金项目:国家自然科学基金;研究生创新项目;新疆维吾尔自治区项目
摘    要:为了能够及时了解Spark环境下经典聚类算法K-means的最新研究进展,把握K-means算法当前的研究热点和方向,针对K-means算法的初始中心点优化研究进行综述。首先介绍了内存计算框架Spark和K-means算法,并分析了K-means算法聚类不稳定性的成因和影响,其目的在于指出优化K-means算法的重要性;详细介绍了目前在Spark环境下优化K-means初始中心点的主要方法和最新研究现状,并展望了K-means初始中心点优化问题的未来研究方向。

关 键 词:K-均值算法  分布式内存计算框架  算法优化  聚类算法
收稿时间:2018/10/31 0:00:00
修稿时间:2020/1/29 0:00:00

Survey of optimization on K-means algorithm in Spark
XING Yanni,QIAN Yurong,NAN Fangzhe and ZHAO Jingxia.Survey of optimization on K-means algorithm in Spark[J].Application Research of Computers,2020,37(3):641-647.
Authors:XING Yanni  QIAN Yurong  NAN Fangzhe and ZHAO Jingxia
Affiliation:College of Software, Xinjiang University,,,
Abstract:In order to understand the latest research progress of the classical clustering algorithm K-means in Spark environment, and grasp the current research hotspots and directions of K-means algorithm, this paper reviewed the initial center point optimization research on K-means algorithm. Firstly, it introduced the memory computing framework Spark and K-means algorithms, and analyzed the cause and effects of clustering instability of K-means algorithm, which pointed out the importance of optimizing K-means algorithm. This paper introduced the main methods and the latest research status of optimizing the initial center point of K-means in Spark environment in detail, and also discussed the future research trends in initial center point optimization of K-means.
Keywords:K-means  distributed memory computing framework  algorithm optimization  clustering algorithm
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号