共查询到10条相似文献,搜索用时 31 毫秒
1.
基于密度和对象方向聚类算法的改进 总被引:10,自引:1,他引:10
针对K-means算法所存在的问题进行了深入的研究,提出了基于密度和聚类对象方向的改进算法(KADD算法)。该算法采取聚类对象分布密度方法来确定初始聚类中心,然后根据对象的聚类方向来发现任意形状的簇。理论分析与实验结果表明,改进算法在不改变时间、空间复杂度的情况下能取得更好的聚类结果。 相似文献
2.
针对K-Means算法所存在的问题进行了深入研究,提出了基于密度的K-Means算法(KMAD算法)。该算法采用聚类对象区域空间的密度分布方法来确定聚类个数K的值,然后用高密度区域的质心作为K-Means算法的初始聚类中心。理论分析与实验结果表明了改进算法的有效性和稳定性,并将改进的算法应用于客户细分研究中。 相似文献
3.
面向复杂簇的聚类算法研究与实现 总被引:2,自引:0,他引:2
有效聚类各种复杂的数据对象簇是聚类算法应用干事务对象划分、图像分割、机器学习等方面需要解决的关键技术.在分析与研究现有聚类算法的基础上,提出一种基于密度和自适应密度可达的改进算法.实验证明,该算法能够有效聚类任意分布形状、不同密度、不同尺度的簇;同时,算法的计算复杂度与传统基于密度的聚类算法相比有明显的降低. 相似文献
4.
传统的K-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动,针对K-means算法存在的问题,提出了基于密度的改进的K-means算法,该算法采取聚类对象分布密度方法来确定初始聚类中心,选择相互距离最远的K个处于高密度区域的点作为初始聚类中心,理论分析与实验结果表明,改进的算法能取得更好的聚类结果。 相似文献
5.
一种基于密度的快速聚类算法 总被引:52,自引:0,他引:52
聚类是数据挖掘领域中的一个重要研究方向,聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用,迄今为止人们提出了许多用于大规模数据库的聚类算法。基于密度的聚类算法DBSCAN就是一个典型代表。以DBSCAN为基础,提出了一种基于密度的快速聚类算法。新算法以核心对象领域中所有对象的代表对象为种子对象来扩展类,从而减少区域查询次数,降低I/O开销,实现快速聚类,对二维空间数据测试表明:快速算法能够有效地对大规模数据库进行聚类,速度上数倍于已有DBSCAN算法。 相似文献
6.
基于密度加权的粗糙K-均值聚类改进算法 总被引:7,自引:1,他引:7
针对粗糙K-均值聚类算法中类均值计算式的特点,提出了一种改进的粗糙K-均值算法.改进后的算法基于数据对象所在区域的密度,在类的均值计算过程中对每个对象赋以不同的权重.不同测试数据集的实验结果表明,改进后的粗糙K-均值算法提高了聚类的准确性,降低了迭代次数,并且可以有效地减小孤立点对聚类的影响. 相似文献
7.
在优化空间聚类算法的研究中,传统的K-means空间算法存在两个缺陷,其一是对空间对象的属性描述不全面,其二是对初始种子集选取敏感,容易陷入局部最优值,聚类结果不稳定.为了优化算法,引入适合空间对象的空间属性距离和基于最大维密度选择方案(Max-Dimension of Density Based Seeking,MDDBS)来改进K-means算法,提出利用最大维密度的全局优化空间聚类算法(Max-Dimension of Density Based Clustering,MDDBC),可从密度大的区域选取初始种子,同时又尽量将种子分散在数据空间.实验结果表明,改进方法可以很好消除聚类结果的波动性,同时更加客观地呈现空间对象的分布规律. 相似文献
8.
IncSNN——一种基于密度的增量聚类算法 总被引:1,自引:0,他引:1
基于密度的聚类算法是一类重要的聚类算法,能发现任意形状的簇,但由于它的时间复杂度较高,因此设计有效的增量更新算法是一个重要研究方向.在SNN算法的基础上,提出一种基于密度的增量聚类算法-IncSNN.该算法将所更新对象的空间进行划分,定义了基于该划分的最近邻居的概念,进而确定了受影响对象的集合,当算法更新时,只需要对受影响的数据进行处理.由于受影响对象的集合远小于原数据集合,因此显著提高了算法的效率.实验结果验证了IncSNN的有效性. 相似文献
9.
10.
陈应显 《计算机工程与应用》2009,45(18):144-145
基本蚁群聚类算法在计算相似度时,由于没有考虑相邻对象之间方向的影响,往往造成聚类速度缓慢甚至算法不收敛。通过引入相邻对象方向角和屏蔽角,对方向接近的相邻对象进行屏蔽,实现对确定相邻对象方法的改进。并以矿山实际测量数据为数据源,采用基本的蚁群聚类算法和改进后的算法分别对其进行聚类。通过对这两种算法的实验结果进行分析比较,证明改进后的算法提高了聚类效果。 相似文献