首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
随着计算机技术的发展,数据挖掘在很多方面得到应用,尤其是在电竞行业发展迅速的今天,数据挖掘技术被应用到电竞分析中。本研究用机器学习的方法进行数据挖掘,将机器学习中K-means算法应用于电子竞技职业选手,对电竞选手比赛数据的指标进行聚类,划分为三个不同的等级,并对聚类结果进行分析,将个人能力水平数据化,用聚类结果指导职业选手今后的针对性训练以及发展方向,为电子竞技行业标准化、成熟化起到推动作用。本研究旨在推动计算机技术中机器学习的发展,为我国电子竞技提供参考数据,对日后电竞选手分析的亚那就具有很大的意义。  相似文献   

2.
基于划分的数据挖掘K-means聚类算法分析   总被引:1,自引:0,他引:1  
《现代电子技术》2020,(3):14-17
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。  相似文献   

3.
空间数据挖掘技术是从空间数据库中提取隐含的、用户感兴趣的知识.针对当前的聚类算法没有很好考虑到空间数据的复杂性和数据之间的联系,再加上聚类的精确度不高,设计了一种新的算法—基于信息熵的空间聚类算法(ESCA算法),该算法优先考虑空间数据的复杂性和数据之间的联系,并采用蚁群优化机制改善传统算法中聚类簇数不确定的缺点.实验结果表明该算法是可行,并且具有更高的精确度.  相似文献   

4.
云计算从分布式存储和分布式计算两个方面为大数据处理提供了强力的支持,并逐渐成为大数据挖掘的主流平台。但是在处理云平台中的大规模数据集时典型聚类挖掘算法存在一定不足,因此,提出一种基于群智能算法的大数据K-means聚类挖掘算法。首先对云计算Hadoop框架的存储数据能力和采用的Map Reduce计算模型进行分析,然后采用群智能算法对传统数据挖掘K-means聚类算法进行改进,解决其容易陷入局部最优问题。实验结果表明,相比加权K-means聚类算法,提出的改进算法表现出更好的聚类精度和运行速度,可以适用于大规模数据的聚类挖掘。  相似文献   

5.
聚类算法是数据挖掘的核心技术,根据评价聚类算法优劣的几个标准,对数据挖掘中常用聚类算法做了比较分析,根据各自特点,加以改进,并应用于武警部队数据挖掘项目中。通过运用改进型K-means算法,取得了较好的挖掘结果,为进一步信息的智能化检索、信息的过滤、分拣提供依据。  相似文献   

6.
《信息技术》2019,(1):66-70
针对传统K-means聚类中存在的一系列问题,文中提出了一种基于K-means聚类的改进算法。该算法首先利用K-means++聚类从数据中选择K个距离尽可能远的对象作为初始聚类中心,然后利用K-mediods聚类选择数据样本的中位数作为聚类中心的对象,最后与两步聚类结合。通过对几个常用UCI标准数据集进行仿真实验,结果表明该算法比传统算法更优。  相似文献   

7.
聚类综述     
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要计算。阐述了聚类算法的基本原理,应用方向等,总结了聚类算法的研究现状。  相似文献   

8.
《现代电子技术》2020,(3):177-182
在大数据的数据挖掘模型中,普遍采用模糊聚类算法进行数据分析。常用的模糊C均值聚类算法即FCM聚类算法,具有较多明显缺点,如抗噪性偏低、收敛速度慢、聚类数目无法自动确定等。常用的增量式模糊聚类方法通常在原有的以一个中心点为集群代表的基础上,改为选取多中心点进行增量式聚类算法的分析。但是,通过这样的算法进行数据分析也存在一定的问题,主要表现在其中心点选择是固定的,灵活性很差。基于以上原因,文中将对原有基础算法做出改进,主要对大数据中数据挖掘模型的增量型模糊聚类算法做出分析,经实践验证,改进后算法切实可行,普适性较强。  相似文献   

9.
谱聚类算法是近年来国际上机器学习领域的一个新的研究热点,但其在文本聚类上的应用还较少。设计了一种文本聚类谱算法,首先构建文本相似度矩阵并进而得到拉普拉斯矩阵,随后对其进行特征值分解获得前k个最小特征向量,最后使用K均值算法(K-means)获得k个文本簇。在真实文本数据集上进行了实验,与超球K均值算法相比,本文算法获得了更好的聚类结果。  相似文献   

10.
文本聚类是数据挖掘的核心技术,能帮助用户有效地导航、总结和组织文本信息。本文通过对文本聚类的应用研究,探讨了几种聚类算法的原理与特点,提出并分析了K-means算法与层次凝聚算法的具体实现步骤。  相似文献   

11.
对聚类算法普遍存在问题的解决办法   总被引:8,自引:1,他引:7  
聚类广泛应用于统计、机器学习、模式识别、数据分析等领域并越来越受重视。本文研究了各种聚类算法共同面临的五个问题:聚类效果评估、类数目估计、数据预处理、样本间相似性测量、抗干扰性能,分析了对这些问题的有代表性的解决方法,总结并预测了未来聚类算法在这五个方面的研究方向。  相似文献   

12.
数据挖掘的聚类方法   总被引:41,自引:1,他引:40  
聚类是数据挖掘领域中的一个重要研究课题。本文介绍了数据挖掘领域中对聚类分析的典型要求,研究分析了聚类的主要算法及其改进方法的特点,并对其改进的各种方法进行了对比,讨论了数据挖掘领域中的聚类质量,最后指出了聚类研究的发展趋势。  相似文献   

13.
近几年来,流数据成为主流的数据形式之一。如网络入侵监测数据,股票数据等都是不断变化的流数据。聚类作为数据挖掘领域的主要技术手段之一,因此流数据的聚类也受到了众多学者的广泛关注。而流数据不同于静态数据的特性给流数据的聚类带来了挑战。本文总结了传统数据的聚类算法和流数据聚类挖掘的研究方法,并提出了对未来将群智能应用于流数据聚类算法的展望。  相似文献   

14.
刘燕  董蓉  李勃 《电视技术》2017,(11):32-39
图像分割是计算机视觉研究中重要的一部分,其主要目的是在图像中将兴趣域目标与背景分割,关系到后续的目标识别、图像理解等操作的准确性.经过几十年的发展,许多优秀的图像分割的方法被提出.机器学习是当今时代的研究热点,基于深度卷积神经网络等机器学习的图像分割研究进展迅速.总结介绍了应用于图像分割的几种典型机器学习方法,分析比较了相关的分割原理步骤、优缺点和发展现状.最后分析了基于机器学习的图像分割算法的发展方向.  相似文献   

15.
一种改进的基于密度的聚类算法   总被引:1,自引:0,他引:1  
聚类是数据挖掘领域中的一个重要研究方向,在基于密度的聚类算法DBSCAN的基础上,提出了一种改进的基于密度的聚类算法,该算法在核心点的邻域扩展中不再将邻域内的点作为种子点,而是按顺序选择一个邻域外未被标记的点作为种子点,然后分不同情况进行相应的聚类扩展,此算法可以有效减少聚类中核心点邻域重叠区域查询的次数和运行的时间,实验测试结果也表明该算法聚类的效率和质量明显优于DBSCAN算法.  相似文献   

16.
Clustering techniques have been widely used for solving various engineering problems such as system architecture, modular product/system design, group technology, machine layout, and so on. Most of these problems use matrix formulation to model the problem. Once the matrix formulation for the problem is obtained, cluster analysis is used to group objects represented in the matrix into homogenous clusters based on object features. In this correspondence, a new efficient algorithm for clustering large n x n binary and nonbinary (weighted) matrices is presented. For an n x n incidence matrix, the algorithm first creates n clusters. Once the initial clusters are obtained, the algorithm uses improvement steps to continuously improve the quality of the solution obtained in the previous step. Modifications to the algorithm are presented for clustering n x m matrices. A detailed discussion on the effectiveness of the clustering algorithm when it is applied to matrices of various sizes and sparsity is also presented. The application of the n x n clustering algorithm developed in this correspondence is presented with the development of modular electrical/electronic vehicle door architectures.  相似文献   

17.
在大数据时代,依靠以机器学习为代表的人工智能技术从海量、复杂多样的电磁大数据中快速挖掘出有效的信息是当前的研究热点。面向电磁数据的机器学习算法具有多样性、多变性的特点,要求相关人员具有专业能力与编程知识。为解决电磁大数据挖掘实现过程中的复杂编程问题,提出面向电磁大数据的图形化编程平台,将机器学习的各类算法组件化,用户无需编写代码即可建立机器学习模型和工作流分析数据,并以可视化的方式分析电磁数据,帮助用户进一步理解数据,具有快速开发与易上手的优点。  相似文献   

18.
Clustering of nodes is often used in wireless sensor networks to achieve data aggregation and reduce the number of nodes transmitting the data to the sink. This paper proposes a novel dual head static clustering algorithm (DHSCA) to equalise energy consumption by the sensor nodes and increase the wireless sensor network lifetime. Nodes are divided into static clusters based on their location to avoid the overhead of cluster re-formation in dynamic clustering. Two nodes in each cluster, selected on the basis of the their residual energy and their distance from the sink and other nodes in the cluster, are designated as cluster heads, one for data aggregation and the other for data transmission. This reduces energy consumption during intra-cluster and inter-cluster communication. A multi-hop technique avoiding the hot-spot problem is used to transmit the data to the sink. Experiments to observe the energy consumption patterns of the nodes and the fraction of packets successfully delivered using the DHSCA suggest improvements in energy consumption equalisation, which, in turn, enhances the lifetime of the network. The algorithm is shown to outperform all the other static clustering algorithms, while being comparable with the performance of the best dynamic algorithm.  相似文献   

19.
神经网络的特征映射聚类算法研究   总被引:1,自引:0,他引:1  
自组织特征映射作为一种神经网络方法,在数据挖掘、机器学习和模式分类中得到了广泛应用。他将高维输入空间的数据映射到一个低维、规则的栅格上,从而可以利用可视化技术探测数据的固有特性。说明自组织特征映射神经网络的工作原理和具体实现算法,并在对已有神经网络聚类分析方法概括和总结的基础上,结合一些实验数据、仿真数据对自组织特征映射算法进行研究,得出了一些有意义的结论。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号