首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
模糊聚类是近年来使用的一类性能较为优越的聚类算法,但该类算法对初始聚类中心敏感且对边界样本的聚类结果不够准确。为了提高聚类准确性、稳定性,该文通过联合多个模糊聚类结果,提出一种距离决策下的模糊聚类集成模型。首先,利用模糊C均值(FCM)算法对数据样本进行多次聚类,得到相应的隶属度矩阵。然后,提出一种新的距离决策方法,充分利用得到的隶属度关系构建一个累积距离矩阵。最后,将距离矩阵引入密度峰值(DP)算法中,利用改进的DP算法进行聚类集成以获取最终聚类结果。在UCI机器学习库中选择9个数据集进行测试,实验结果表明,相比经典的聚类集成模型,该文提出的聚类集成模型效果更佳。  相似文献   

2.
一种基于调和均值的模糊聚类算法   总被引:1,自引:0,他引:1  
k调和均值算法用数据点与所有聚类中心的距离的调和平均替代了数据点与聚类中心的最小距离,是一种减小初始值影响聚类结果的有效的聚类方法。本文对k调和均值算法进行扩展,考虑到数据点同时对不同聚类的隶属关系,将模糊的概念应用到聚类中,提出了模糊k调和均值-Fuzzv K—Harmonic Means(FKHM)算法。在中心迭代聚类算法的统一框架的基础上,推导出FKHM算法聚类中心的条件概率表达式以及在迭代过程中的数据点加权函数表达式。以划分相似度作为聚类结果的评价准则,实验表明,FKHM算法在聚类对于初值不敏感的同时提高了聚类结果的精确度,达到较好的聚类效果。  相似文献   

3.
与经典的K均值聚类算法相比,模糊C均值(FCM)聚类算法通过引入模糊因子,考虑不同聚类数据簇之间的相互关系,得到可分性更好的聚类结果。但是模糊因子的引入,使得任意一个样本点都存在模糊性,造成FCM极易受到噪声和离群点的影响,聚类结果泛化性能较差。因此,该文提出一种簇间可分的鲁棒FCM算法(RBI-FCM)。RBI-FCM利用K均值算法对模糊隶属度的稀疏特征,降低不同数据簇之间的相互作用,突出不同数据簇相邻区域的可分性;另外,RBI-FCM在极小化数据簇内部散布度的条件下,考虑不同数据簇之间的可分性,可提高聚类模型的泛化性能。该文设计了有效的模型求解迭代算法。实验结果表明,RBI-FCM算法提高了FCM的鲁棒性,有效降低FCM对数据簇分布差异性和抽样不均衡的敏感性,得到理想的聚类结果。  相似文献   

4.
林辉 《电子测试》2014,(23):28-30
考虑到现有客户关系关系存在的一些问题,本文引入了模糊数学的相关算法,给数据对象的隶属度加上一个权值,以及在算法中采用有效性函数来自动确定聚类的初始数目,理论分析与实验结果表明,在客户关系管理环境下所引入的改进模糊聚类算法比传统模糊聚类算法有更好的聚类效果,更快的聚类速度,为企业对不同客户采用不同营销策略提供了依据。  相似文献   

5.
基于样本加权的可能性模糊聚类算法   总被引:2,自引:0,他引:2       下载免费PDF全文
刘兵  夏士雄  周勇  韩旭东 《电子学报》2012,40(2):371-375
可能性模糊聚类算法解决了噪音敏感和一致性聚类问题,但算法假定每个待分析样本对聚类的贡献相同,导致离群点或噪声点对算法的干扰较强,算法迭代次数过大.为此,提出一种基于样本加权的可能性模糊聚类算法,新算法具有更快的收敛速度,对标准数据集和人工数据集加噪后的测试结果表明,该算法具有更强的鲁棒性,在有效降低时间复杂度的同时能够...  相似文献   

6.
针对密度峰值聚类(Density Peak Clustering, DPC)算法对截断距离的取值较为敏感,密度度量标准不统一且人为选取聚类中心存在主观性的问题,提出了一种自适应引力密度峰值聚类优化(Optimized Adaptive Gravitational Density Peak Clustering Algorithm, OAGDPC)算法。首先采用模糊加权K-近邻技术(Fuzzy Weighted KNearest Neighbors Density Peak Clustering, FKNN-DPC)重新定义了局部密度,统一了密度度量的标准;然后提出一种自适应选择聚类中心的策略,结合基于引力的密度峰值(Gravitational Density Peak Clustering, GDPC)算法中牛顿万有引力定律与DPC算法的参数映射,使用引力类比距离,并设置综合考虑局部密度和引力的决策参数,依据决策参数降序折线图的顶角变化自适应确定聚类中心;最后聚集非中心点并识别异常点。实验选取DPC、GDPC、FKNN-DPC和OAGDPC在人工和UCI数据集上进行测试,结果表明,OA...  相似文献   

7.
模糊核聚类算法是一种结合无监督聚类和模糊集合概念的图像分割技术,已广泛应用于图像分割领域,但其算法对初值敏感,很大程度上依赖初始聚类中心的选择,并且容易收敛于局部极小值,用于图像分割时,隶属度的计算只考虑了图像中当前的像素探值,而未考虑邻域像素探间的相互关系,故对分割含有噪声图像不理想。故提出了一种改进的模糊核聚类图像分割算法,先通过数据约简,不损失数据聚类结构的前提下对数据进行挖掘,然后在模糊核聚类算法中引入特性核函数,将约简后的数据映射到高维非线性特征空间进行划分,最后再利用表征邻域像素的参数来修正当前空间像素的隶属度。实验结果表明,提出的算法较好地解决了模糊核聚类算法在局部极值处收敛和在迭代过程中出现停滞等问题,最终得到最佳全局聚类,迭代次数降低明显,并具有高鲁棒性、对噪声不敏感的特点。  相似文献   

8.
高阶异构数据模糊联合聚类算法   总被引:1,自引:0,他引:1  
为了更有效地分析聚簇重叠部分高阶异构数据的聚簇结果,提出了一种高阶异构数据模糊联合聚类(HFCC)算法,该算法最小化每个特征空间中对象与聚簇中心的加权距离。推导出对象隶属度和特征权重的迭代更新公式,设计出聚类过程的迭代算法,并且从理论上证明了该迭代算法的收敛性。另外,通过泛化XB指标,提出适用于评估高阶异构数据聚类质量的指标GXB,用于判断聚簇数目。实验表明,HFCC算法能够有效探测数据内部隐藏的重叠聚簇结构,并且HFCC算法聚类效果明显优于5种有代表性的硬划分算法,此外GXB指标能够有效判定高阶异构数据的聚簇数目。  相似文献   

9.
刘梦娇 《电子科技》2016,29(11):107
针对传统模糊C-均值聚类算法对复杂的医学、遥感图像难以获得满意分割效果问题,将图像模糊C-均值聚类引入图像分割问题研究中,提出了基于直方图的图像模糊聚类快速分割算法。将越南学者Le提出的分布式图像模糊聚类算法目标函数进行简化,得到图像模糊聚类算法目标函数;采用拉格朗日乘子法获取其迭代求解所对应的隶属度、中立度、拒分度和聚类中心表达式,设计图像模糊聚类算法并对其收敛性进行了证明。通过复杂医学和遥感图像的分割测试结果表明,新的分割算法相比现有的模糊C-均值聚类分割算法和直觉模糊C-均值聚类分割算法具有更好的分割性能。  相似文献   

10.
基于数据加权策略的模糊聚类改进算法   总被引:2,自引:0,他引:2  
该文提出了一种数据指数加权的模糊均值聚类策略,引入了指数权因子和影响指数,使得可以在聚类过程中差异化处理各个数据。新策略和现有的Gustafson-Kessel(G-K)算法相结合,提出了一种新的模糊聚类算法DWG-K用于提高聚类质量和挖掘离群点。数据试验表明DWG-K在提高聚类质量方面优于现有的G-K;在离群点挖掘方面,DWG-K对离群点的判定是全局的,离群点的物理意义清楚,且计算效率明显高于当前广泛采用的基于密度的离群点挖掘算法。  相似文献   

11.
To improve the fairness, the energy consumption changing pseudonyms needs to be taken into account. Existing works focus on changing velocity‐based pseudonyms changing strategy and short changes interval with limited coverage, but due to similar velocity and short changes, internal attacker guesses easily known communication and location information due to location information of vehicle on tracking, which may expose adversary private information, and frequently, pseudonyms changing occurs due to movement of vehicles' similar velocity and short coverage, which may cause serious attack of vehicle. To overcome this problem, distance and cluster can be performed. In this work, we proposed distance and cluster‐based energy pseudonyms changing method for road network. We proposed distance and energy‐based clustering routing service over road network, the cluster head elected to depend on random number of distance and energy to change pseudonyms of vehicles. An each interval to be establish cluster head vehicle deployed while selects the operation mode and informs the cluster members of the selected mode through beacon signal. The cluster head vehicle node performs the pseudonyms changing based on the predicted distance and energy of the cluster member to use clustering optimization. The data of whole network send to report server through these nodes while near the RSU, and the vehicles in this area will use less energy to change the pseudonyms. The simulation results show that the proposed method enhances pseudonyms changing strategy less consumption and delays sufficient privacy level each vehicle also our method has outperform compare with existing methods than we use Sumo simulation and Matlab tools to verify our proposed method. Our proposed method outperformed in terms of pseudonym changing energy efficiency to careful attention during the cluster formation process, stable and balanced clusters that prolong the network lifetime, increases distances to more CH vehicles connectivity to makes clustering group and changing their pseudonyms in terms of high level privacy and finally, CH nodes use Dijkstra's algorithm use MST among the vehicles nodes depend on existing road networks to follow shortest path selection roads in terms of high connectivity probability of CH and stable structure of the network decreases the topology changes and thus,the clustering overhead is reduced.  相似文献   

12.
卢晶  段勇  刘海波 《电子学报》2018,46(3):730-738
密度峰值聚类算法由于在发现任意形状簇且不需指定聚类个数等方面具有一定的优势而被广泛关注.但是该算法需要计算数据集中所有点的密度和点对之间的距离,因此不适合处理大规模高维数据集.为此,本文提出了一种基于z值的分布式密度峰值聚类算法,DP-z.本方法利用空间z填充曲线将高维数据集映射到一维空间上,根据数据点的z值信息对数据集分组.为了能够得到正确的结果,需要对分组间数据进行交互,然后并行计算每个点密度和斥群值.DP-z算法在分组间数据交互时采用过滤策略,减少大量无效距离计算和数据传输开销,有效提高算法的执行效率.最后,本文在云计算平台上对DP-z算法进行了验证,实验表明在保证DP-z算法与原始密度峰值聚类算法聚类结果相同的情况下有效的提高了算法执行效率.  相似文献   

13.
汉语文本聚类及其算法设计   总被引:1,自引:0,他引:1  
主要针对传统的聚类算法倾向于识别大小类似的球形聚类簇,且对离群数据较为敏感等问题,利用聚类簇代表点选取的方法,同时结合基于人进行聚类判断所遵循的基本原则,即聚类中对象间距离应小于聚类间距离,设计了一种有效的聚类算法,实验结果表明算法是有效的。  相似文献   

14.
传统K-means算法的初始聚类中心从数据集中随机抽取,聚类结果会随着初始聚类中心的不同而产生波动。针对这一问题,提出一种基于密度的优化初始聚类中心选取算法,通过计算每个数据对象的密度参数和邻域距离,选取k个处于高密度分布的点作为初始聚类中心。在聚类类别数给定的情况下,使用标准的UCI数据库进行对比实验,发现改进后的算法较传统算法有相对较高的准确率和稳定性。  相似文献   

15.
刘秀文 《无线电工程》2012,42(12):61-64
采用目标分群和部队编制模糊匹配技术实现了态势评估系统。介绍了数据融合发展概况与融合模型,在数据融合修正模型的基础上,提出了态势评估总体技术框架、功能模块和关键技术。介绍了目标分群处理流程,包括目标分群、群的分裂与合并,并进一步阐述了目标分群算法与模糊匹配算法。介绍了基于模糊匹配技术实现军事体系单元假设推理的方法,给出目标分群计算结果,说明了算法的有效性。  相似文献   

16.
一种基于距离调节的聚类算法   总被引:2,自引:1,他引:1  
针对k-means算法不适合凹形样本空间的问题,提出了一种基于距离调节的聚类算法.算法中引入了一种调节最短路径距离作为算法的相似度函数,该函数可以使经过高密度数据区域的两点距离缩短,而经过低密度数据区域的两点距离加长,由此来缩小类间样本的相似度,同时加大类间的相似度,以及更好的聚类.实验结果证明,该算法对凹状的聚类样本空间具有很好的聚类效果.  相似文献   

17.
针对现有直觉模糊c均值聚类算法无法发现非凸聚类结构的缺陷,提出了一种基于核化距离的直觉模糊c均值聚类算法。算法在定义了基于核的直觉模糊欧式距离基础上,通过把聚类样本映射到高维特征空间,使原来没有显现的特征突现出来,从而能够更好地聚类。实验选择一组人工数据集及一组UCI数据集测试了本文算法,并将其与五种经典的聚类算法进行了比较。实验结果充分表明了该算法的有效性及优越性。  相似文献   

18.
张长青  杨楠 《电子科技》2019,32(8):66-70
为解决城市交通拥堵问题,给人们提供优质的出行体验,文中提出了基于车联网大数据分析的实时路况检测系统。使用GPS技术对行驶的车辆进行数据采集,通过数据清洗和数据修复得到样本集合,利用改进模糊C均值聚类算法对样本数据进行分析,得出各路段的平均车速,进而得到相应路段的交通状态。测试结果表明,该系统能够准确得获取道路上行驶车辆的交通数据,识别出当前路段的交通状态,从而证明了该系统设计的合理性和正确性。  相似文献   

19.
为提高数据挖掘算法的挖掘速度,同时提高其精准度,提出基于电力营销聚类分析数据挖掘算法研究。首先运用聚类算法筛选数据,再计算数据结构和相异度矩阵相异度,得出最接近的类距离。完成上述步骤后,在聚类分析框架下,设计聚类分析数据挖掘算法流程。先输入数据,再设计数据挖掘算法基本策略,最后提出SLIO算法处理离散字段,得到有价值的数据信息。由此,完成基于电力营销聚类分析的数据挖掘算法设计。实验结果表明,与基于支持度-置信度-提升度的配网自动化系统数据挖掘算法和基于神经网络和粒子群优化的数据挖掘算法相比,文中基于电力营销聚类分析的数据挖掘算法的挖掘速度稳定,挖掘效果更好。同时测试精准度较高,可有效提高数据挖掘的可信度。  相似文献   

20.
范建德  谢维信  杜浩翠 《信号处理》2020,36(11):1838-1845
本文提出了一种改进的多源约束聚类算法,以解决多传感器多目标跟踪(Multi-Object Tracking/Estimation, MOTD)问题。MOTD问题对应于在缺乏噪声和目标运动模型等先验信息的情况下,对多个传感器的量测数据进行聚类。针对现有算法对选定传感器量测敏感的问题,本文提出的算法首先根据选定传感器量测数据点的局部密度,对该传感器量测数据进行筛选排序;其次,对排序后的每一个量测数据点,计算和其他传感器量测的高斯核距离,每个传感器返回距离最小的数据点;最后计算在截断距离内的数据点的数量,当大于给定阈值时判定这些数据点为目标产生的量测,簇的中心(个数)即为目标的位置(个数)。实验结果表明,对比现有多源聚类算法,本文提出的算法在传感器目标检测概率较高的场景中聚类精度和聚类速度均有所改善。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号