首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 165 毫秒
1.
针对传统近邻传播聚类算法不能进行限定类簇数目的聚类缺陷,提出一种三阶段的改进聚类方法。该方法通过近邻传播聚类从数据集中获得中心代表点集合,利用K-means算法对中心代表点集合进行指定类簇数目的聚类进而获得初始训练集,结合改进的K最近邻算法实现数据的聚类分析。采用人工仿真数据及UCI数据集进行对比实验,实验结果分析表明,与近邻传播聚类算法和传统限定类簇数目的聚类算法相比,新聚类算法具有更好的聚类效果。  相似文献   

2.
对聚类结果的理解有助于评价聚类效果,可以据此调整聚类过程,更高效地使用聚类结果.但是,聚类结果的理解仍然是一个尚未解决的问题.提出了基于离群点识别技术分析任意聚类算法的聚类结果,发现了聚类结果属性特征簇的方法;提出一种基于不相似性比值的离群点识别算法.通过对全部数据簇的属性描述进行离群点分析,发现各数据簇的特征属性,实现对聚类结果的理解.所提方法适用于任意聚类算法结果的分析.对UCI的iris、ZOO和Housing数据集的采用X-means、Frozen和DBScan算法的聚类结果进行聚类结果分析,实验表明所提方法较成功地发现了不同聚类算法的属性特征簇,有助于对聚类结果的深入理解.  相似文献   

3.
空间域减法聚类粒子滤波算法   总被引:1,自引:1,他引:0  
针对粒子滤波计算复杂度高的问题,为降低滤波中所需的样本数目,提出了一种基于减法聚类的粒子滤波算法,算法将样本及对应权重进行映射构成聚类向量,在设定的聚类半径下,采用改进的减法聚类算法对向量进行分类,得到若干在空间中分离的子类中心,然后用子类中心代替整个向量集,并利用产生的新向量集重构样本集和权重.仿真实验表明该算法在保持了粒子滤波估计精度的同时,有效降低了样本数目,提高了计算效率.  相似文献   

4.
为解决k-means聚类算法中异常样本点破坏数据分布,致使簇中心发生较大偏差的问题,通过计算样本点与潜在簇中心的距离赋予样本点不同的权重,降低外点对数据分布的影响,并通过对权重向量施加0-norm范数在聚类模型中自适应移除外点. 采用交替最小化优化算法求解模型,在人工合成数据集和真实数据集上的实验表明,所提模型能有效降低外点对聚类的影响,可得到更有效的聚类效果.  相似文献   

5.
在过抽样技术研究中,为了合成较有意义的新样本,提出一种基于聚类的过抽样算法ClusteredSMOTE-Boost。过滤小类的噪声样本,将剩余的每个小类样本作为目标样本参与合成新样本。对整个训练集聚类,根据聚类后目标样本所在簇的特点确定其权重及合成个数。将所有目标样本聚类,在目标样本所在的簇内选取K个近邻,并从中任选一个与目标样本合成新样本,使新样本与目标样本簇内的样本尽量相似,并减少由于添加样本而造成的边界复杂度。试验结果表明,ClusteredSMOTE-Boost算法在各个度量上均明显优于SMOTE-Boost、ADASYN-Boost和BorderlineSMOTE-Boost三种经典算法。  相似文献   

6.
为了提高噪声干扰彩色图像分割的鲁棒性,给出一种基于中智模糊聚类的彩色图像改进分割算法。将像素空间邻域信息嵌入现有的中智模糊C-均值聚类目标函数,利用马氏距离代替欧氏距离,度量中智模糊聚类中样本与聚类中心之间的差异程度,获得适合彩色图像分割的模糊聚类目标函数,并采用拉格朗日乘子法获取隶属度和聚类中心的迭代求解表达式。对彩色图像添加高斯噪声和椒盐噪声,图像分割测试结果表明,所给算法相比模糊C-均值聚类算法和基于马氏距离的中智模糊聚类算法有更强的鲁棒性。  相似文献   

7.
基于特征加权理论的数据聚类算法   总被引:1,自引:0,他引:1  
针对数据挖掘过程中数据聚类操作的初始聚类数目和初始聚类中心确定困难的问题,提出了一种软子空间结合竞争合并机制的模糊加权聚类算法.通过对软子空间聚类算法的目标函数进行改写,并结合数据簇势的大小对各数据簇进行竞争与合并操作,实现了对数据的聚类处理.结果表明,该算法能够准确地对数据样本进行聚类,并且聚类结果与初始数据簇数目和初始聚类中心无关,能够满足对高维数据聚类处理的需要,具有较好的实际应用价值.  相似文献   

8.
针对并行化密度聚类的过程中,不同密度聚类簇边界点划分模糊,并且存在数据噪声,从而影响聚类性能,使聚类结果受制于局部最优影响的问题,提出一种基于MapReduce与优化布谷鸟算法的并行密度聚类算法。首先,该算法结合K-means中的近邻与逆近邻思路的策略KDBSCAN(K-means DBSCAN),通过计算各数据点的影响空间,以此重新定义基于密度的聚类(Density-based spatial dutering of apptications with noise,DBSCAN)算法中聚类簇的拓展条件,避免了不同密度聚类簇边界点划分模糊的问题;其次,结合KDBSCAN密度聚类中的近邻思想提出了一种可行的迭代性噪声点处理策略,减轻数据中噪声点对于聚类算法性能的影响;再次,提出基于传统布谷鸟算法的优化改进策略MCS(Majorization cuckoo search),通过衰减发现巢穴概率的权重,随着迭代搜寻次数的增加提升算法收敛速度,解决了聚类结果受制于局部最优的问题;最后,结合MapReduce提出了并行密度聚类策略MCS-KDBSCAN,通过并行化密度聚类算法运算,减轻了并行聚类...  相似文献   

9.
针对传统的模糊聚类算法(FCM)的不足,提出了具体的改进和提高的方法,使用模糊等价性理论对原始样本集进行处理以得到聚类数和初始聚类中心,通过修改聚类目标函数来提高算法处理孤立点的能力和体现样本空间各维度对聚类效果的价值,最后通过实验比较表明算法的有效性。  相似文献   

10.
传统的基于机器学习的阿尔茨海默病诊断方法在跨域数据集上的分类结果不尽如人意。为了解决域间数据分布差异的问题,本文提出了一种基于多图谱特定类重构的域自适应迁移学习方法。首先使用多图谱数据来获取样本丰富的特征信息;接着通过投影矩阵将源域和目标域的数据投影到公共子空间中;然后使用重构矩阵来消除源域和目标域相同类的数据之间的分布差异;最后为了保留域中数据全局的结构信息,对重构矩阵使用低秩约束。该方法在多中心阿尔茨海默病成像数据集和阿尔茨海默病神经影像学计划数据集上进行实验,实验结果显示,提出的方法相比其他传统方法在跨域数据集上可以更准确地诊断阿尔茨海默病。  相似文献   

11.
服务聚类能够极大的提升服务发现的能力。但是,现有服务聚类方法缺乏针对服务描述文件语义稀疏情境下的研究。针对该问题,本文首次将迁移学习技术应用到服务聚类领域以尝试解决服务聚类过程中语义稀疏的问题。通过使用一种对偶PLSA模型来融合目标领域和辅助领域语料知识,利用无监督的方式迁移知识以促进语义稀疏领域的服务聚类过程。实验结果表明,该方法能够提高针对语义稀疏情景下服务的聚类效果。与K-Means等方法相比,该方法在聚类纯度、熵指标上均具有更好的效果。  相似文献   

12.
针对不同工况下轴承监测数据分布差异性导致的诊断精度下降问题,基于深度学习与迁移学习,提出一种多领域深度对抗迁移网络,用于变工况下轴承的智能诊断。将不同工况下的样本集视作属于不同的领域,在特征提取时利用深度残差网络将轴承源域的训练数据与目标域的测试数据映射到高维特征空间,提取监测数据高层抽象的特征表示;设计多领域对抗模块,以支持多故障模式的轴承样本在不同领域对抗模块上进行对抗迁移训练,保障源域与目标域数据在特征空间中的分布有效对齐;在利用源域数据训练故障分类器时引入标签平滑约束,增强故障识别的泛化能力,将源域故障诊断知识迁移到目标域数据的故障信息识别,实现变工况下的轴承智能诊断。利用变工况下的齿轮箱轴承故障数据集与电机轴承数据集对提出方法进行验证,结果表明:相比其他方法,提出的新方法考虑了轴承监测数据的多故障模式结构,更好地提取了领域不变特征,提升了变工况下轴承故障的识别精度。  相似文献   

13.
基于蚁群算法的模糊C均值聚类医学图像分割   总被引:1,自引:0,他引:1  
在医学图像分割研究中,针对模糊C均值(FCM)聚类算法聚类个数难于确定、搜索过程容易陷入局部最优的缺陷,把蚁群算法与FCM聚类算法有机结合,提出了一种基于蚁群算法的模糊C均值聚类图像分割算法. 该算法首先利用蚁群算法全局性和鲁棒性的优点,得到聚类中心和聚类个数,再将其作为模糊C均值聚类的初始聚类中心和聚类个数,弥补了传统FCM聚类算法的不足,得到了较好的分割效果. 实例分析证明了算法的有效性和实用性.  相似文献   

14.
基于核方法的模糊聚类算法   总被引:31,自引:0,他引:31  
将核方法的思想推广到模糊C-均值算法,构造了基于核函数的模糊核C-均值算法,使其能够聚类非超球体数据、被噪声污染数据、多种模式原型混合数据、不对称数据等多种数据结构,并指出一阶多项式模糊核C-均值算法等价于模糊C-均值算法.人工和实际数据的实验结果表明,与模糊C-均值算法相比,模糊核C-均值算法在多种数据结构条件下可以有效地进行聚类.  相似文献   

15.
针对传统的模糊C均值(FCM)算法在图像分割方面存在的缺点,提出一种基于空间信息及隶属度约束的FCM图像分割算法.该算法在传统FCM算法的目标函数中引入图像空间信息及对隶属度的约束,使得到的聚类中心更加合理,并且增强了算法对噪音的鲁棒性.实验结果表明,本算法可以有效地提高图像分割的质量.  相似文献   

16.
一种改进的模糊C均值聚类算法   总被引:1,自引:0,他引:1  
针对模糊C均值(FCM)聚类算法中,聚类效果往往受到聚类数目和初始聚类中心的影响这一问题,提出了基于平均信息熵确定聚类数目的方法,并采用密度函数法来获得初始聚类中心.实验结果表明,改进后的算法较好地解决了初值问题,与随机初始化方法相比,迭代次数少,收敛速度快.  相似文献   

17.
采用模糊C-均值聚类算法(FCM)实现声纹码本的矢量量化,使用基于相似系数和的孤立点检测法识别孤立点.试验表明,该方法能有效地减少孤立点对识别结果的干扰,显著降低码本量化误差,从而提高矢量量化声纹识别系统的识别率.  相似文献   

18.
SAR图像变化检测可以转化为对差异图的聚类问题。由于 SAR 图像本身容易受到斑点噪声干扰,为提高聚类效果提出了一种结合邻域信息的自适应粒子群聚类算法。该方法在模糊 C 均值原目标函数基础上,引入中心像素的邻域信息,并通过自适应粒子群的全局搜索来优化聚类中心。该方法还引入了自学习算子即粒子编码中的中心像素的隶属度,能够向其相邻像素的隶属度学习,并据此修正自身的隶属度值相关。实验结果表明,与模糊C均值和量子免疫克隆聚类算法相比,该方法利用了像素的邻域信息,从而增强了抗噪性能。与模糊局部信息C均值算法相比,该方法对图像细节保持能力较强,运行时间也较少。  相似文献   

19.
为了实现自动建立Mamdani模糊模型,提出了一种基于局部数据密度的新方法.该方法采用局部近似隶属函数的模糊聚类算法对数据进行学习,从而挖掘出潜在的模糊规则集和隶属函数的参数,实现自动建立Mamdani模糊模型.在聚类时,不需要事先指定类的数目,确定类中心的同时能自动识别噪声,因此在建模时不需要做额外的去噪声处理.使用该方法对交通信息预测进行了仿真实验,结果表明本文提出的模糊建模方法行之有效.  相似文献   

20.
提出了一种基于动态粒子群的聚类算法应用于图像边缘检测。由于FCM算法容易陷入局部最优,并对初始化敏感,这种算法利用粒子群较强全局寻优能力与局部寻优能力,动态确定聚类数目和中心,在此基础上又进行FCM聚类。两者有效地结合起来能搜索到有效的全局最优解。仿真实验表明,该算法应用与图像边缘检测是可行和有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号