共查询到19条相似文献,搜索用时 156 毫秒
1.
2.
基于划分的数据挖掘K-means聚类算法分析 总被引:1,自引:0,他引:1
《现代电子技术》2020,(3):14-17
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。 相似文献
3.
郑燕玲 《微电子学与计算机》2011,28(8)
空间数据挖掘技术是从空间数据库中提取隐含的、用户感兴趣的知识.针对当前的聚类算法没有很好考虑到空间数据的复杂性和数据之间的联系,再加上聚类的精确度不高,设计了一种新的算法—基于信息熵的空间聚类算法(ESCA算法),该算法优先考虑空间数据的复杂性和数据之间的联系,并采用蚁群优化机制改善传统算法中聚类簇数不确定的缺点.实验结果表明该算法是可行,并且具有更高的精确度. 相似文献
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
近几年来,流数据成为主流的数据形式之一。如网络入侵监测数据,股票数据等都是不断变化的流数据。聚类作为数据挖掘领域的主要技术手段之一,因此流数据的聚类也受到了众多学者的广泛关注。而流数据不同于静态数据的特性给流数据的聚类带来了挑战。本文总结了传统数据的聚类算法和流数据聚类挖掘的研究方法,并提出了对未来将群智能应用于流数据聚类算法的展望。 相似文献
14.
15.
一种改进的基于密度的聚类算法 总被引:1,自引:0,他引:1
聚类是数据挖掘领域中的一个重要研究方向,在基于密度的聚类算法DBSCAN的基础上,提出了一种改进的基于密度的聚类算法,该算法在核心点的邻域扩展中不再将邻域内的点作为种子点,而是按顺序选择一个邻域外未被标记的点作为种子点,然后分不同情况进行相应的聚类扩展,此算法可以有效减少聚类中核心点邻域重叠区域查询的次数和运行的时间,实验测试结果也表明该算法聚类的效率和质量明显优于DBSCAN算法. 相似文献
16.
Zakarian A. 《IEEE transactions on systems, man and cybernetics. Part C, Applications and reviews》2008,38(1):135-141
Clustering techniques have been widely used for solving various engineering problems such as system architecture, modular product/system design, group technology, machine layout, and so on. Most of these problems use matrix formulation to model the problem. Once the matrix formulation for the problem is obtained, cluster analysis is used to group objects represented in the matrix into homogenous clusters based on object features. In this correspondence, a new efficient algorithm for clustering large n x n binary and nonbinary (weighted) matrices is presented. For an n x n incidence matrix, the algorithm first creates n clusters. Once the initial clusters are obtained, the algorithm uses improvement steps to continuously improve the quality of the solution obtained in the previous step. Modifications to the algorithm are presented for clustering n x m matrices. A detailed discussion on the effectiveness of the clustering algorithm when it is applied to matrices of various sizes and sparsity is also presented. The application of the n x n clustering algorithm developed in this correspondence is presented with the development of modular electrical/electronic vehicle door architectures. 相似文献
17.
在大数据时代,依靠以机器学习为代表的人工智能技术从海量、复杂多样的电磁大数据中快速挖掘出有效的信息是当前的研究热点。面向电磁数据的机器学习算法具有多样性、多变性的特点,要求相关人员具有专业能力与编程知识。为解决电磁大数据挖掘实现过程中的复杂编程问题,提出面向电磁大数据的图形化编程平台,将机器学习的各类算法组件化,用户无需编写代码即可建立机器学习模型和工作流分析数据,并以可视化的方式分析电磁数据,帮助用户进一步理解数据,具有快速开发与易上手的优点。 相似文献
18.
Clustering of nodes is often used in wireless sensor networks to achieve data aggregation and reduce the number of nodes transmitting the data to the sink. This paper proposes a novel dual head static clustering algorithm (DHSCA) to equalise energy consumption by the sensor nodes and increase the wireless sensor network lifetime. Nodes are divided into static clusters based on their location to avoid the overhead of cluster re-formation in dynamic clustering. Two nodes in each cluster, selected on the basis of the their residual energy and their distance from the sink and other nodes in the cluster, are designated as cluster heads, one for data aggregation and the other for data transmission. This reduces energy consumption during intra-cluster and inter-cluster communication. A multi-hop technique avoiding the hot-spot problem is used to transmit the data to the sink. Experiments to observe the energy consumption patterns of the nodes and the fraction of packets successfully delivered using the DHSCA suggest improvements in energy consumption equalisation, which, in turn, enhances the lifetime of the network. The algorithm is shown to outperform all the other static clustering algorithms, while being comparable with the performance of the best dynamic algorithm. 相似文献
19.
神经网络的特征映射聚类算法研究 总被引:1,自引:0,他引:1
自组织特征映射作为一种神经网络方法,在数据挖掘、机器学习和模式分类中得到了广泛应用。他将高维输入空间的数据映射到一个低维、规则的栅格上,从而可以利用可视化技术探测数据的固有特性。说明自组织特征映射神经网络的工作原理和具体实现算法,并在对已有神经网络聚类分析方法概括和总结的基础上,结合一些实验数据、仿真数据对自组织特征映射算法进行研究,得出了一些有意义的结论。 相似文献