共查询到19条相似文献,搜索用时 78 毫秒
1.
陈应显 《计算机工程与应用》2012,48(11):7-10
经典的聚类方法(如划分方法、层次方法等)的聚类相似度由点与点之间的距离决定。但在空间数据的分布中,数据间的方向变化往往产生不同的类簇。空间离散点的方向可以是空间的任意方向,通过将空间离散点的方向转换为其所在三角面的方向,设计并实现了空间离散点在一定方向变化阈值内的方向聚类。设计各点间等间距的金字塔形实验数据,使用空间离散点方向聚类算法成功实现了对实验数据进行聚类。以内蒙古某露天煤矿的实际测量点数据为例,使用该聚类算法成功实现对露天矿采场的测量点进行聚类。 相似文献
2.
提出一种融合化学反应优化与K均值的文本聚类算法.结合K均值聚类的局部快速开发寻优能力和化学反应优化的全局勘探能力,以K均值聚类解集合作为化学反应优化的初始分子结构群,通过引入单分子碰撞、单分子分解、分子间碰撞和分子间合成4种化学反应操作,增加种群分子多样性;利用融合余弦相似度和欧氏距离的适应度函数评估分子优劣,在扩展搜... 相似文献
3.
K均值算法是一种常用的基于原型的聚类算法。但该算法要求用户随机选择初始质心,使得K均值算法受初始化影响较大。二分K均值算法虽然改善了这个问题,但仍然要求用户指定聚类个数,影响了聚类效果。用层次聚类对二分法进行改进,解决了二分K均值算法受用户指定的聚类个数的影响的问题。并结合Chameleon算法,合并划分过细簇,优化聚类结果。仿真实验证明改进的聚类算法的抱团性和分离性优于二分K均值聚类算法。 相似文献
4.
针对高分辨率天文图像中的星点聚类研究中存在的 2 个问题:①天文图像的分辨率 较高,且图像处理速度较慢;②选取何种聚类算法对天文图像中的星点进行聚类分析效果较好。 在研究中,问题 1 采用图像分块的方法提高图像的处理速度;问题 2 提出了一种改进的 K 均值聚 类算法,以解决传统的 K 均值聚类算法的聚类结果易受到 k 值和初始聚类中心随机选择影响的问 题。该算法首先在用 K 均值聚类算法对数据初步聚类的基础上确定合适的 k 值,其次用层次聚类 对数据聚类确定初始聚类中心,最后在此基础上再采用 K 均值聚类算法进行聚类。通过 MATLAB 仿真实验的结果表明,该算法的聚类结果与效率优于其他聚类算法。 相似文献
5.
胡伟 《计算机工程与应用》2013,49(2):157-159
针对传统K均值聚类方法采用聚类前随机选择聚类个数K而导致的聚类结果不理想的问题,结合空间中的层次结构,提出一种改进的层次K均值聚类算法。该方法通过初步聚类,判断是否达到理想结果,从而决定是否继续进行更细层次的聚类,如此迭代执行,从而生成一棵层次型K均值聚类树,在该树形结构上可以自动地选择聚类的个数。标准数据集上的实验结果表明,与传统的K均值聚类方法相比,提出的改进的层次聚类方法的确能够取得较优秀的聚类效果。 相似文献
6.
视频运动目标的检测与定位是视频监控系统的主要技术之一。针对现有视频监控系统目标定位过程在目标被浅度遮挡或存在噪声时定位不准确的问题,提出了一种新的视频运动目标定位方法。采用减法聚类、聚类有效性函数与加权模糊C-均值聚类方法相结合。首先利用减法聚类,获得初始聚类中心,再通过加权模糊C-均值聚类算法对视频运动进行目标定位,避免了算法陷入局部最优而获取了全局最优。然后引入聚类有效性函数,获得视频序列中目标的最佳个数。仿真结果表明,改进方法对存在噪声或野点的情况具有较好的鲁棒性,并可以在不需要人为给定待检测图像目标个数的情况下,对存在浅度遮挡区域的目标进行准确定位。 相似文献
7.
8.
K-means聚类算法的研究综述 总被引:2,自引:0,他引:2
K-均值聚类算法(K-means)是基于划分的聚类算法中的典型算法,针对K-means算法初始聚类中心存在对K依赖的缺陷,提出一种新的选取K-means算法初始聚类中心的方法,该方法提高聚类结果的有效性和稳定性;还提出一种极值选择法,将最大距离法和最小距离法相结合,进一步提高初始聚类中心选择的准确性。 相似文献
9.
基于空间邻域加权的模糊C-均值聚类及其应用研究* 总被引:2,自引:0,他引:2
针对模糊C-均值聚类法用于图像聚类时仅利用了像素的灰度信息,而忽视空间位置信息,导致在噪声区域和边界处有误分类现象,提出一种新的基于空间邻域加权的模糊C-均值图像聚类法。首先,定义了一个空间邻域信息函数,该函数能够有力抑制噪声点,同时能够很好保留边界的特性;其次,设计了具有空间约束的样本邻域信息加权隶属度矩阵;最后,将该方法应用于人工合成图像和模拟MR脑图像的聚类。实验结果表明,该方法能够获得较好的聚类效果,同时具有较强的抑制噪声的能力。 相似文献
10.
对分别采用欧氏距离和网络距离作为相似性测度的聚类方法进行分析,并从空间网络中对象间着手,提出一种具有方向特点的网络对象聚类算法.算法利用空间网络的邻接关系,将两种距离结合起来作为聚类的相似性测度以提高聚类的精度.算法分析和实验证明,该算法的聚类效果优于单一度量的聚类方法. 相似文献
11.
为了有效地提高丈本聚类的质量和效率,在对已有的层次聚类和K-means算法分析和研究的基础上,针对互联网信息处理量大、实时性高的特点,设计并实现了一种用于高维稀疏相似矩阵的文本聚类算法.该算法结合了层次聚类和K-means聚类的思想,根据一个阈值来控制聚类算法的选取和新簇的建立,并通过文本特征提取和文档相似度矩阵计算实现文本聚类.实验结果表明,该算法的召回率和正确率更高. 相似文献
12.
Malika Bendechache A-Kamel Tari M-Tahar Kechadi 《International Journal of Parallel, Emergent and Distributed Systems》2019,34(6):671-689
ABSTRACTClustering techniques are very attractive for identifying and extracting patterns of interests from datasets. However, their application to very large spatial datasets presents numerous challenges such as high-dimensionality, heterogeneity, and high complexity of some algorithms. Distributed clustering techniques constitute a very good alternative to the Big Data challenges (e.g., Volume, Variety, Veracity, and Velocity). In this paper, we developed and implemented a Dynamic Parallel and Distributed clustering (DPDC) approach that can analyse Big Data within a reasonable response time and produce accurate results, by using existing and current computing and storage infrastructure, such as cloud computing. The DPDC approach consists of two phases. The first phase is fully parallel and it generates local clusters and the second phase aggregates the local results to obtain global clusters. The aggregation phase is designed in such a way that the final clusters are compact and accurate while the overall process is efficient in time and memory allocation. DPDC was thoroughly tested and compared to well-known clustering algorithms BIRCH and CURE. The results show that the approach not only produces high-quality results but also scales up very well by taking advantage of the Hadoop MapReduce paradigm or any distributed system. 相似文献
13.
An unsupervised grid-based approach for clustering analysis 总被引:1,自引:0,他引:1
14.
K-means算法是数据挖掘领域研究、应用都非常广泛的一种聚类算法,其各种衍生算法很多,其中包括近年出现的以点对称距离为测度的K-means聚类算法。在点对称距离聚类算法的基础上提出一种新的聚类算法,根据对对称性的分析,为对称性的描述增加方向约束,提高对称距离的描述准确性,以此来提高聚类的准确性。同时,针对对称点成对出现的特点,调整了聚类过程中的收敛策略,以对称点对连线中点计算聚类中心,改善了基于对称距离的聚类算法收敛性能。通过数值仿真比较了所提算法与原有算法的优劣,结果显示该算法在计算复杂度不变的条件下获得了更准确的结果,聚类结果更接近数据的真实分类。 相似文献
15.
基于粒子群优化的带障碍约束空间聚类分析 总被引:1,自引:0,他引:1
聚类分析是空间数据挖掘的主要方法之一.传统聚类算法忽略了真实世界中许多约束条件的存在,而约束条件的存在会影响聚类结果的合理性.在分析K中心聚类方法易陷入局部极小值和对初始值敏感的基础上,提出了一种新的聚类方法--基于粒子群优化的带障碍约束空间聚类方法.实验结果表明,该聚类方法不仅使得聚类结果更具实际意义,而且在全局寻优能力方面明显优于K中心聚类方法,且有较快的收敛速度. 相似文献
16.
提出了一种基于空间单元单维运算的快速聚类算法SUSDC。该算法首先将被聚类的数据逐维划分成 若干个不相交的空间单元;然后基于空间距离阈值判定相邻的空间单元是否合并,直到全部维处理完毕。实验 结果验证了SUSDC算法运算速度快,能够处理不规则形状数据和高维数据,且具有对噪声数据不敏感的特点。 相似文献
17.
针对传统的K-均值算法聚类时所面临的维数灾难、初始聚类中心点难以确定的缺点,提出一种改进的K-均值算法,其核心思想是通过降维、基于密度及散布的初始中心点搜索等方法改进K-均值算法。实验结果证明改进后的算法无论在聚类精度还是在稳定性方面,都明显优于标准的K-均值算法。 相似文献
18.
给出了一种改进的基于遗传算法的聚类方法。传统的K-means算法局部搜索能力强,但是对初始化比较敏感,容易陷入局部最优值。基本的基于遗传算法的聚类算法是一种全局优化算法,但是其局部搜索能力较差,收敛速度慢。针对这两个方法所存在的问题,提出了一种改进的聚类算法。该方法结合了两个方法的优点,引入了K-means操作,再用遗传算法进行优化,并且在该方法中改进了遗传算法中的交叉算子,大大提高了基于遗传算法的聚类算法的局部搜索能力和收敛速度。 相似文献