首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 93 毫秒
1.
K-均值(K-means)聚类算法是学术与工业领域的经典算法。然而,它却具有两个明显缺陷:1) 需要预先知道聚类的数量;2) 对算法的随机初始化非常敏感。为了解决这两个问题,首先归纳了K-均值算法的基本步骤,并对聚类有效性进行了分析;然后以数据样本点的欧几里德距离为基础,定义了以聚类数量k为自变量的类间质心距离之和以及类内距离之和,由此构造了聚类有效性评价函数;最后根据经验规则,在聚类数量的可能范围内通过求解聚类有效性评价函数的最小值以确定数据集的最优聚类数量。对UCI的3个数据集Iris、Seeds和Wine的仿真结果说明,提出的聚类有效性评价函数不仅能够准确地反映数据的真实聚类结构,还能有效地抑制算法对随机初始化的敏感性,通过对K-均值算法的多次运行,其结果也验证了聚类有效性评价函数的鲁棒性。  相似文献   

2.
数据集的聚类结果是否合理的问题属于聚类有效性问题。本文依据模糊集的包含度理论,定义了一个模糊c-均值聚类有效性函数。通过三组数据对这个聚类有效性函数的判决功能和鲁棒性进行了对比研究。  相似文献   

3.
模糊相关度与聚类有效性   总被引:14,自引:0,他引:14  
基于数据集的几何结构,引入数据集的模糊划分的类间相关度.依据类间相关度,定义了一个聚类有效性函数.通过人造数据和实际数据对该聚类有效性函数的性能进行了实验.  相似文献   

4.
针对典型模糊聚类算法难以准确获取最佳聚类数的问题,提出了一种基于改进划分系数的模糊聚类有效性函数.在划分系数方法基础上,将类与类之间的分离性和类内的紧致性相结合,引入指数函数有效抑制噪声和孤立点数据对聚类有效性的影响.仿真实验将所提及的聚类有效性函数应用于模糊C均值聚类中,分别对两组自定义数据集和IRIS数据集进行了有效性验证,实验结果表明,本文提出的模糊聚类有效性函数能够准确划分最佳聚类数.  相似文献   

5.
在对现有各种聚类有效性函数进行深入分析的基础上,提出了一种改进的聚类有效性函数,通过引入模拟退火机制,以获得最佳聚类结果。与其他经典的聚类有效性函数相比,改进后的聚类有效性函数一方面避免了单调性,另一方面又与数据集合本身的特征相关。仿真实验表明了其有效性。  相似文献   

6.
聚类有效性研究   总被引:1,自引:0,他引:1  
在对现有各种聚类有效性函数进行深入分析的基础上,提出了一种改进的聚类有效性函数,通过引入模拟退火机制,以获得最佳聚类结果。与其他经典的聚类有效性函数相比,改进后的聚类有效性函数一方面避免了单调性,另一方面又与数据集合本身的特征相关。仿真实验表明了其有效性。  相似文献   

7.
针对谱聚类算法相似度函数设置困难问题,提出了一种使用证据累积的文本聚类谱算法.该算法使用超球K均值算法对文本集进行多次聚类,并将每次得到的划分结果作为判断2个文本是否应该放在一个簇中的证据,由此构建文本的相似度矩阵和正则化拉普拉斯矩阵.在TREC和Reuters文本集上进行了实验,验证了本文算法的有效性,它比层次聚类算法和CLUTO提供的K均值算法更加优越.  相似文献   

8.
模糊C-均值(FCM)聚类算法的一个主要问题是需要事先确定聚类的数目,为此定义了类内差异度和类间重叠度来分别度量同一个聚类中数据的相似度和不同聚类间的分离程度,进而基于这两个度量提出一个新的有效性函数用于判定最佳聚类数目。实验结果表明,该有效性函数能有效地判定聚类数目,并且有较好的鲁棒性。  相似文献   

9.
自适应的模糊C均值聚类算法   总被引:1,自引:0,他引:1  
针对模糊C均值聚类算法对聚类数预先不可知的缺陷,提出了自适应的模糊C均值聚类算法,该算法利用已有的有效性函数自动确定聚类数目,继而进行模糊聚类,实验表明,该方法无须人工的干预,并且具有良好的有效性和可行性.  相似文献   

10.
针对传统的模糊聚类算法(FCM)的不足,提出了具体的改进和提高的方法,使用模糊等价性理论对原始样本集进行处理以得到聚类数和初始聚类中心,通过修改聚类目标函数来提高算法处理孤立点的能力和体现样本空间各维度对聚类效果的价值,最后通过实验比较表明算法的有效性。  相似文献   

11.
根据Vcso-new对Vcso有效性指标的改进思想,对分离度进行了新的定义,并提出了一种新的模糊聚类有效性指标,理论证明和实验分析说明了该有效性指标的可靠性。  相似文献   

12.
利用PBM模糊聚类有效性函数以图像特征空间为搜索空间,实现有效性函数的全局寻优,用并行小生境技术解决粒子群(PSO)算法的早收敛问题,优化聚类的全局收敛性能,实现有效聚类数目与聚类中心的并行寻优。通过对遥感图像分割的实验证明,与传统粒子优化群算法的分割结果相比,本文算法拥有更高的有效性且分割效果更优。  相似文献   

13.
针对模糊聚类算法存在的问题,通过对聚类有效性函数的分析,对聚类数c和加权指数m进行改进,将改进后的模糊聚类算法引入BP算法中,建立基于模糊聚类与BP算法的混合模型,并进行实验分析,分析结果表明,混合模型在准备性上优于传统的BP算法,因为数据经过模糊聚类之后同类数据具有更多的相似特征。  相似文献   

14.
针对传统近邻传播聚类算法不能进行限定类簇数目的聚类缺陷,提出一种三阶段的改进聚类方法。该方法通过近邻传播聚类从数据集中获得中心代表点集合,利用K-means算法对中心代表点集合进行指定类簇数目的聚类进而获得初始训练集,结合改进的K最近邻算法实现数据的聚类分析。采用人工仿真数据及UCI数据集进行对比实验,实验结果分析表明,与近邻传播聚类算法和传统限定类簇数目的聚类算法相比,新聚类算法具有更好的聚类效果。  相似文献   

15.
基于径向基函数神经网络的预测方法研究   总被引:11,自引:0,他引:11  
提出了一种新的确定径向基函数中心的方法. 该方法首先利用交叉迭代模糊聚类算法确定样本数据的模糊聚类中心,然后采用正则化正交最小二乘法从模糊聚类中心中进一步优选径向基函数中心,并将广义交叉有效性指标作为停止选择过程的标准. 该方法集中了交叉迭代模糊聚类和正则化正交最小二乘法的优势,可有效减小网络规模,提高网络推广能力,而且能够避免数值病态情况发生. 以新疆伊犁河雅马渡站的年径流量预测为例进行计算,其结果验证了所提方法的有效性.  相似文献   

16.
In traditional data clustering, similarity of a cluster of objects is measured by distance between objects. Such measures are not appropriate for categorical data. A new clustering criterion to determine the similarity between points with categorical attributes is presented. Furthermore, a new clustering algorithm for categorical attributes is addressed. A single scan of the dataset yields a good clustering, and more additional passes can be used to improve the quality further.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号