期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王慧研张腾飞马福民《计算机科学》2018,45(7):190-196

粗糙K-means算法中下近似和边界区域权重系数的设置对算法的聚类效果有着重要的影响。传统的粗糙K-means算法及很多改进的粗糙K-means算法对所有类簇的下近似和边界区域设置固定的权重,忽视了簇内数据对象分布差异性的影响。针对这个问题,根据下近似和边界区域的数据对象相对于类簇中心的空间分布情况,提出一种新的基于空间距离自适应权重度量的粗糙K-means算法。该算法在每次迭代过程中,根据每个类簇的下近似和边界区域的数据对象相对于类簇中心的平均距离,综合度量下近似和边界区域对于类簇中心迭代计算的不同重要程度,动态地计算下近似和边界区域的相对权重系数。通过实例验证及实验仿真证明了所提算法的有效性。相似文献

2.

基于区间2-型模糊度量的粗糙K-means聚类算法^*

逯瑞强马福民张腾飞《模式识别与人工智能》2018,31(3):265-274

现有粗糙K-means聚类算法及系列改进、衍生算法均是从不同角度描述交叉类簇边界区域中的不确定性数据对象,却忽视类簇间规模的不均衡对聚类迭代过程及结果的影响.文中引入区间2-型模糊集的概念度量类簇的边界区域数据对象,提出基于区间2-型模糊度量的粗糙K-means聚类算法.首先根据类簇的数据分布生成边界区域样本对交叉类簇的隶属度区间,体现数据样本的空间分布信息.然后进一步考虑类簇的数据样本规模,在隶属度区间的基础上自适应地调整边界区域的样本对交叉类簇的影响系数.文中算法削弱边界区域对较小规模类簇的中心均值迭代的不利影响,提高聚类精度.在人工数据集及UCI标准数据集的测试分析验证算法的有效性. 相似文献

3.

基于混合度量与类簇自适应调整的粗糙模糊K-means聚类算法

张鑫涛马福民曹杰张腾飞《模式识别与人工智能》2019,32(12):1141-1150

针对粗糙K-means聚类及其相关衍生算法需要提前人为给定聚类数目、随机选取初始类簇中心导致类簇交叉区域的数据划分准确率偏低等问题,文中提出基于混合度量与类簇自适应调整的粗糙模糊K-means聚类算法.在计算边界区域的数据对象归属于不同类簇的隶属程度时,综合考虑局部密度和距离的混合度量,并采用自适应调整类簇数目的策略,获得最佳聚类数目.选取数据对象稠密区域中距离最小的两个样本的中点作为初始类簇中心,将附近局部密度高于平均密度的对象划分至该簇后再选取剩余的初始类簇中心,使初始类簇中心的选取更合理.在人工数据集和UCI标准数据集上的实验表明,文中算法在处理类簇交叠严重的球簇状数据集时,具有自适应性,聚类精度较优. 相似文献

4.

基于簇内不平衡度量的粗糙K-means聚类算法

张腾飞陈龙李云《控制与决策》2013,(10)

粗糙K-means聚类算法是一种有效的处理聚类边界模糊问题的算法,但大多数算法对簇的下近似集和边界中的对象使用统一的权值,忽略了簇内对象之间的差异性。针对这一问题提出一种新的改进算法,通过对簇内的每个对象加入簇内不平衡度量,以区分不同对象对簇的贡献程度,使得聚类结果簇内更紧凑、簇间更疏远。不同数据集的仿真实验结果表明,所提出算法可以有效提高聚类结果的精度。相似文献

5.

基于边界区域局部模糊增强的uppiRKM 聚类算法

马福民逯瑞强张腾飞《控制与决策》2017,32(11):1949-1956

如何对交叉边界区域的数据对象进行度量与处理一直是粗糙k-means(RKM)及其衍生算法的主要出发点.uppiRKM算法通过引入Laplace无差别原则,较好地解决了传统RKM算法对权重系数的选择比较敏感等相关问题,但没有考虑边界区域多个类簇的交叉程度以及边界区域数据对象的空间位置分布对聚类结果的影响.鉴于此,设计一种对边界区域的数据对象进行局部模糊度量的方法,并提出基于边界区域局部模糊增强的uppiRKM聚类改进算法,通过多组实例分析验证了所提出算法的有效性. 相似文献

6.

考虑边界样本邻域归属信息的粗糙K-means增量聚类算法

马福民孙静勇张腾飞《控制与决策》2022,37(11):2968-2976

在原有数据聚类结果的基础上,如何对新增数据进行归属度量分析是提高增量式聚类质量的关键,现有增量式聚类算法更多地是考虑新增数据的位置分布,忽略其邻域数据点的归属信息.在粗糙K-means聚类算法的基础上,针对边界区域新增数据点的不确定性信息处理,提出一种基于邻域归属信息的粗糙K-means增量式聚类算法.该算法综合考虑边界区域新增数据样本的位置分布及其邻域数据点的类簇归属信息,使得新增数据点与各类簇的归属度量更为合理;此外,在增量式聚类过程中,根据新增数据点所导致的类簇结构的变化,对类簇进行相应的合并或分裂操作,使类簇划分可以自适应调整.在人工数据集和UCI标准数据集上的对比实验结果验证了算法的有效性. 相似文献

7.

融合最近邻矩阵与局部密度的自适应K-means聚类算法

艾力米努尔·库尔班谢娟英姚若侠《计算机科学与探索》2023,(2):355-366

针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启发,通过引入数据对象间的距离差异值构造邻近矩阵,根据邻近矩阵计算局部密度,不需要任何参数设置,采取最近邻矩阵与局部密度融合策略,自适应确定初始聚类中心数目和位置,同时完成非中心点的初分配。人工数据集和UCI数据集的实验测试,以及与传统K-means算法、基于离群点改进的K-means算法、基于密度改进的K-means算法的实验比较表明,提出的自适应K-means算法对人工数据集的孤立点免疫度较高,对UCI数据集具有更准确的聚类结果。相似文献

8.

一种优化初始中心的K-means粗糙聚类算法 总被引：3，自引：0，他引：3

下载免费PDF全文

姚跃华史秀岭《计算机工程与应用》2010,46(34):126-128

针对K-means算法的不足,提出了一种优化初始中心的聚类算法。首先,采用密度敏感的相似性度量来计算对象的密度,基于对象之间的距离和对象的邻域,选择相互距离尽可能远的数据点作为初始聚类中心。然后,采用基于粗糙集的K-means聚类算法处理边界对象,同时利用均衡化函数自动生成聚类数目。实验表明,算法具有较好的聚类效果和综合性能。相似文献

9.

基于密度峰值与密度聚类的集成算法

王治和黄梦莹杜辉秦红武《计算机应用》2019,39(2):398-402

针对快速搜索和发现密度峰值聚类（CFSFDP）算法需人工在决策图上选择聚类中心的问题，提出一种基于密度峰值和密度聚类的集成算法。首先，借鉴CFSFDP思想，将局部密度最大的数据作为第一个中心；接着，从该中心点出发采用一种利用Warshall算法求解密度相连改进的基于密度的噪声应用空间聚类（DBSCAN）算法进行聚类，得到第一个簇；最后，在尚未被划分的数据中找出最大局部密度的数据，将它作为下一个簇的中心后再次采用上述算法进行聚类，直到所有数据被聚类或有部分数据被视为噪声。所提算法既解决了CFSFDP选择中心需人工干预的问题，又优化了DBSCAN算法，即每次迭代都是从当前最好的点（局部密度最大的点）出发寻找簇。通过可视化数据集和非可视化数据集与经典算法（CFSFDP、DBSCAN、模糊C均值（FCM）算法和K均值（K-means）算法）的对比实验结果表明，所提算法聚类效果更好，准确率更高，优于对比算法。相似文献

10.

基于簇内不平衡度量的粗糙??-means 聚类算法

张腾飞陈龙李云《控制与决策》2013,28(10):1479-1484

粗糙??-means 聚类算法是一种有效的处理聚类边界模糊问题的算法, 但大多数算法对簇的下近似集和边界中的对象使用统一的权值, 忽略了簇内对象之间的差异性. 针对这一问题提出一种新的改进算法, 通过对簇内的每个对象加入簇内不平衡度量, 以区分不同对象对簇的贡献程度, 使得聚类结果簇内更紧凑、簇间更疏远. 不同数据集的仿真实验结果表明, 所提出算法可以有效提高聚类结果的精度.

相似文献

11.

基于邻域归属信息混合度量的粗糙K-Means算法

孙静勇马福民《计算机工程》2021,47(3):109-116

粗糙K-Means及其衍生算法在处理边界区域不确定信息时,其边界区域中的数据对象因与各类簇中心点的距离相差较小,导致难以依据距离、密度对数据点进行区分判断。提出一种新的粗糙K-Means算法,在对数据进行划分时,综合数据对象的局部密度与邻域归属信息来衡量数据点与类簇的相似性,边界数据与类簇之间的关系由其局部的空间分布所决定,使得模糊不确定信息之间的差异更明显。在人工数据集和UCI标准数据集上的实验结果表明,该算法对边界区域数据的划分具有更高的准确率。相似文献

12.

基于粒子群的粗糙核聚类算法

姚丽娟罗可《计算机应用研究》2012,29(8):2854-2857

针对K-means聚类算法容易陷入局部最优、不能处理边界对象及线性不可分的缺点,提出一种基于粒子群的粗糙核聚类算法。该算法通过Mercer核将输入样本空间中的样本映射到高维空间,使样本变得线性可分,并结合粗糙集的思想,通过动态改变上下近似集的权重因子对边界对象进行有效处理,同时采用reliefF方法对样本属性进行加权处理,以解决混合数据的聚类问题,最后利用粒子群算法防止算法陷入局部最优。仿真实验表明,相对于其他改进算法,该算法具有较高的正确率和较短的收敛时间,并进一步验证了该算法的鲁棒性和稳定性,具有一定的实用价值。相似文献

13.

一种新的带模糊权的粗糙聚类算法

李订芳章文何炎祥《信息与控制》2006,35(1):120-125

针对粗糙聚类算法缺乏对数据比例变换的鲁棒性的问题，在粗糙聚类的框架下融合模糊聚类的思想，将临界区域中对象的模糊隶属度作为它们对于聚类中心调整的作用权值，得到一种带有模糊权的粗糙聚类算法（fuzzy weighing rough clustering algorithm, FWRCA）．实验表明，该算法不仅对于数据的比例变化具有鲁棒性，且在一定程度上克服了粗糙C均值聚类算法对划分阈值ε的敏感性，在性能上优于传统粗糙C均值聚类算法(如RCMCA)，可应用于水电工程科学等以原型模型为研究手段并有大量需做比例变换的观测数据的领域．相似文献

14.

基于粒计算的粗糙集聚类算法

李莲罗可周博翔《计算机应用研究》2013,30(10):2916-2919

针对传统K-means聚类算法初始聚类中心随机选取、不能处理边界对象、效率低、聚类精度低等问题, 提出了一种新的K-means聚类算法。算法引入粒计算理论, 并依据密度和最大最小距离法选择初始聚类中心, 避免初始聚类中心在同一个类中, 结合粗糙集, 通过动态调整上近似集和边界集的权重因子, 以解决边界数据的聚类问题; 最后采用类间距和类内距均衡化准则函数作为算法终止判断条件, 来得到更好的聚类效果。实验结果表明：该算法具有较高的准确率, 迭代次数较少, 并降低了对噪声的敏感程度。相似文献

15.

A hybrid approach for data clustering based on modified cohort intelligence and K-means

《Expert systems with applications》2014,41(13):6009-6016

Clustering is an important and popular technique in data mining. It partitions a set of objects in such a manner that objects in the same clusters are more similar to each another than objects in the different cluster according to certain predefined criteria. K-means is simple yet an efficient method used in data clustering. However, K-means has a tendency to converge to local optima and depends on initial value of cluster centers. In the past, many heuristic algorithms have been introduced to overcome this local optima problem. Nevertheless, these algorithms too suffer several short-comings. In this paper, we present an efficient hybrid evolutionary data clustering algorithm referred to as K-MCI, whereby, we combine K-means with modified cohort intelligence. Our proposed algorithm is tested on several standard data sets from UCI Machine Learning Repository and its performance is compared with other well-known algorithms such as K-means, K-means++, cohort intelligence (CI), modified cohort intelligence (MCI), genetic algorithm (GA), simulated annealing (SA), tabu search (TS), ant colony optimization (ACO), honey bee mating optimization (HBMO) and particle swarm optimization (PSO). The simulation results are very promising in the terms of quality of solution and convergence speed of algorithm. 相似文献

16.

一种粗糙不确定的图像分割方法

饶梦苗夺谦罗晟《计算机科学》2020,47(2):72-75

图像分割是计算机视觉领域的一个基础问题,涉及图像检索、物体检测、物体识别、行人跟踪等众多后续任务。目前已有大量研究成果,有基于阈值、聚类、区域生长的传统方法,也有基于神经网络的流行算法。由于图像区域边界的不确定性问题,现有算法并没有很好地解决图像部分区域渐变导致的边界模糊问题。粒计算是解决复杂问题的有效工具之一,在不确定的、模糊的问题上取得了良好的效果。针对现有图像分割算法在不确定性问题上的局限性,基于粒计算思想,提出了一种粗糙不确定性的图像分割方法。该算法在K均值算法的基础上,结合邻域粗糙集模型,先对类别边界区域的像素点进行粒化,运用邻域关系矩阵,得到各类别对各粒化像素点的包含度,从而对边界区域类别模糊的像素点进行重新划分,优化了图像分割的结果。在Matlab2019编程环境中,实验选取了BSDS500数据集中的一张马术训练图片和一张建筑物图片来测试算法性能。实验先对彩色图像进行灰度处理,用K均值算法对图像进行初步分割,再设置邻域因子值,依据边界像素点邻域信息重新划分边界点。对比K均值算法的分割结果可知,所提算法取得了更佳的效果。实验结果表明,该方法在粗糙度这一评价标准上优于K均值算法,可以有效降低图像区域边界的模糊性,实现灰度边界模糊的图像渐变区域的分割。相似文献