首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
传统方法受噪声点影响,存在分类精准低的问题。为此,提出基于聚类算法的海量医院财务数据精准分类方法。在对大数据去噪原理基础上,通过PNCC模型对财务数据去噪处理,避免噪声对数据分类结果产生影响;采取自适应邻域选择方法降维处理去噪后财务数据,构建聚类算法中QS-KFCM模型,将预处理后医院财务数据输入QS-KFCM模型中,完成海量医院财务数据的精准分类。实验表明方法可有效提高财务数据分类精度。  相似文献   

2.
无线传感器网络的生命周期与节点的能耗直接相关。为解决能量消耗分布不均,影响网络寿命的问题,提出一种基于AGNES聚类的能耗均衡WSNs优化路由算法(EBRAA)。通过AGNES聚类算法获得网络均匀分簇,根据簇内节点的剩余能量和节点与基站距离及两者权重因子,完成分布式簇头选举,采用改进后的Dijkstra算法产生簇头间最短路径的多跳路由。仿真结果表明,与LEACH和KBECRA算法相比,EBRAA算法的簇分布更加合理,能耗更加均衡,延长了网络生命周期。  相似文献   

3.
提出一种新的选取初始聚类中心的算法,该算法结合了凝聚层次聚类算法AGNES,利用该算法选出初始聚类中心,再应用到K-means算法中进行聚类。实验表明,改进的算法聚类效果更好,准确率得到了提高,迭代次数也明显减少,还能够发现异常点。  相似文献   

4.
核模糊聚类算法不适用于含孤立点与噪声点的数据,并且对初始化中心敏感。针对此种情况,结合减法聚类,对样本加权,放宽隶属度归一化条件,提出基于减法聚类的加权核模糊聚类。通过IRIS和WINE数据集证实改进算法比传统的核聚类算法具有更高的健壮性与抗噪性,并将改进后的算法运用在育肥猪出栏中,验证了算法的实用性与可行性。  相似文献   

5.
谱聚类集成的淋巴结超声图像分割算法   总被引:1,自引:1,他引:0  
为了对低信噪比的超声图像进行有效分割,提出一种谱聚类集成的超声图像分割算法.首先用改进的全变差去噪模型对超声图像进行有效的去噪;然后用聚类集成的方法对去噪后的图像进行图像分割,基聚类器采用K均值算法,集成采用改进的谱聚类算法;最后用K均值算法对谱聚类集成的结果进行再次聚类,得到最终的集成聚类分割结果.实验结果表明,与现有的方法相比较,该算法分割效果更好.  相似文献   

6.
空间数据聚类是一种很重要的数据挖掘技术,它可以从大量的空间数据中提取到知识,并且有着广泛的用途,空间数据库里的数据分布对聚类结果的影响很大,很少有算法在聚类时考虑到了空间数据的分布.在本文中,提出了一种新的自适应基于密度的取样聚类算法ADBSC(adaptive density-based sampling clustering),它可以根据空间数据的分布,对一个中心点自适应的选取近邻,并对这些近邻点进行取样,扩展,有效提高了聚类分析的准确性和效率.本文结尾部分,时模拟数据进行了一系列的实验,对其和DBSCAN算法做了比较,证明了ADBSC的优越性.  相似文献   

7.
多代表点特征树与空间聚类算法   总被引:1,自引:0,他引:1  
空间数据具有海量、复杂、连续、空间自相关、存在缺损与误差等的特点,要求空间聚类算法具有高效率,能处理各种复杂形状的簇,聚类结果与数据空间分布顺序无关,并且对离群点是健壮的等性能,已有的算法难以同时满足要求。本文提出了一个适合处理海量复杂空间数据的数据结构一多代表点特征树。基于多代表点特征树提出了适合挖掘海量复杂空间数据聚类算法CAMFT,该算法利用多代表点特征树对海量的数据进行压缩,结合随机采样的方法进一步增强算法处理海量数据的能力;同时,多代表点特征树能够保存复杂形状的聚类特征,适合处理复杂空间数据。实验表明了算法CAMFT能够快速处理带有离群点的复杂形状聚类的空间数据,结果与对象空间分布顺序无关,并且效率优于已有的同类聚类算法BLRCH与CURE。  相似文献   

8.
一种基于密度的空间数据流在线聚类算法   总被引:2,自引:0,他引:2  
于彦伟  王沁  邝俊  何杰 《自动化学报》2012,38(6):1051-1059
为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial datastream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点及其满足核心点条件的邻域数据做局部聚类更新,降低聚类更新的时间复杂度,实现对空间数据流的在线聚类.OLDStream算法具有快速处理大规模空间数据流、实时获取全局任意形状的聚类簇结果、对数据流的输入顺序不敏感、并能发现孤立点数据等优势.在真实数据和合成数据上的综合实验验证了算法的聚类效果、高效率性和较高的可伸缩性,同时实验结果的统计分析显示仅有4%的空间点消耗最坏运行时间,对每个空间点的平均聚类时间约为0.033 ms.  相似文献   

9.
数据挖掘空间聚类   总被引:1,自引:1,他引:0  
聚类分析在数据挖掘领域中得到了广泛的应用,对空间数据的聚类是其中的一个重要研究方向。文章提出了对空间数据聚类的6个标准,并基于这6个标准对一些传统的空间数据聚类算法作了分析比较。在分析的基础上指出没有一种老的算法能同时处理大量数据点、高维数据和多噪声的问题。接着对近年来改进或创新的聚类算法作了简要分析,并对未来发展方向进行了简要展望,目的主要是便于研究者全面了解和掌握空间数据聚类的现有算法,发现更高性能的聚类算法,也使用户能方便快速地找到适合特定问题的聚类方法。  相似文献   

10.
基于模糊聚类的小波变换图像去噪算法改进   总被引:1,自引:0,他引:1  
介绍一种改进的较优的基于模糊聚类的小波变换图像去噪算法.首先分析了模糊C均值聚类算法中加权指数m的重要性,采用基于模糊决策的方法,分别构造模糊目标和模糊约束,由模糊目标和模糊约束的交集来共同确定最优的加权指数m以获取较为理想的聚类分类结果.再利用该种加权模糊聚类算法把小波系数划分成包含信号与只包含噪声的小波系数两类,将只包含噪声的小波系数置为零,将包含信号的小波系数利用软阈值法进行收缩,最后对处理后的系数根据M带小波变换的局部时频分析能力及其良好的信噪分离能力进行M带小波变换,得到去噪效果较好的图像.  相似文献   

11.
When dealing with high dimensional data, clustering faces the curse of dimensionality problem. In such data sets, clusters of objects exist in subspaces rather than in whole feature space. Subspace clustering algorithms have already been introduced to tackle this problem. However, noisy data points present in this type of data can have great impact on the clustering results. Therefore, to overcome these problems simultaneously, the fuzzy soft subspace clustering with noise detection (FSSC-ND) is proposed. The presented algorithm is based on the entropy weighting soft subspace clustering and noise clustering. The FSSC-ND algorithm uses a new objective function and update rules to achieve the mentioned goals and present more interpretable clustering results. Several experiments have been conducted on artificial and UCI benchmark datasets to assess the performance of the proposed algorithm. In addition, a number of cancer gene expression datasets are used to evaluate the performance of the proposed algorithm when dealing with high dimensional data. The results of these experiments demonstrate the superiority of the FSSC-ND algorithm in comparison with the state of the art clustering algorithms developed in earlier research.  相似文献   

12.
模糊C均值(FCM)算法是模式识别领域中应用最广的聚类算法之一。但是FCM算法存在很多缺点,其中以对噪声数据敏感,鲁棒性较差最为突出。针对这种情况,许多学者都提出了改进算法。介绍一种改进算法即PCA算法,并对PCA在处理噪声数据方面作出了实践性尝试,实验数据进一步证明了PCA算法的好处,这对合理使用模糊聚类算法提供了一定的理论依据。  相似文献   

13.
可能性C均值聚类算法(Possibilistic C-Means,PCM)相比于模糊C均值聚类算法(Fuzzy C-Means,FCM),能更好地处理含有噪音和例外点的数据,但在处理数据粘性较强的数据集时,PCM算法的聚类中心趋于一致,从而导致聚类算法直接失效。针对这个问题,提出了中心约束准则与跨域迁移学习准则,并将其应用到可能性C均值算法中,从而提出一种具有中心约束能力的聚类算法,简称中心约束的跨源学习聚类算法,改进后的算法能够利用跨域知识进行辅助聚类,确保类中心相互远离,从而能够保证算法的聚类性能。通过模拟数据集和真实数据集的实验,验证了该算法的上述优点。  相似文献   

14.
SUDBC:一种基于空间单元密度的快速聚类算法   总被引:3,自引:0,他引:3  
随着数据规模越来越大,要求聚类算法有很高的执行效率,很好的扩展性,能发现任意形状的聚类以及对噪音数据的不敏感性.提出了一种基于空间单元密度的快速聚类算法SUDBC,该算法首先将被聚类的数据划分成若干个空间单元,然后基于空间单元密度将密度超过给定阈值的邻居单元合并为一个类.实验结果验证了SUDBC算法具有处理任意形状的数据和对噪音数据不敏感的特点.  相似文献   

15.
数值型和分类型混合数据的模糊K-Prototypes聚类算法   总被引:15,自引:0,他引:15  
陈宁  陈安  周龙骧 《软件学报》2001,12(8):1107-1119
由于数据库经常同时包含数值型和分类型的属性,因此研究能够处理混合型数据的聚类算法无疑是很重要的.讨论了混合型数据的聚类问题,提出了一种模糊K-prototypes算法.该算法融合了K-means和K-modes对数值型和分类型数据的处理方法,能够处理混合类型的数据.模糊技术体现聚类的边界特征,更适合处理含有噪声和缺失数据的数据库.实验结果显示,模糊算法比相应的确定算法得到的结果准确度高.  相似文献   

16.
基于多目标规划的模糊C均值聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
模糊C均值聚类算法(FCM)是一种非常经典的非监督聚类技术,已被广泛地应用到医学图像分割。由于传统的FCM聚类算法在分割图像时仅利用了图像的灰度信息,未利用图像的空间信息,在分割叠加了噪声的磁共振(MR)图像时分割效果不理想。考虑到脑部MR图像真实的灰度值具有分片为常数的特性,按照合理利用图像空间信息的原则,对传统的FCM聚类算法进行了改进,引入多目标规划的概念,提出了一种新的,更加合理的应用图像空间信息的聚类算法。实验结果表明,应用该算法可以有效地分割含有噪声的图像。  相似文献   

17.
Recently, many methods have appeared in the field of cluster analysis. Most existing clustering algorithms have considerable limitations in dealing with local and nonlinear data patterns. Algorithms based on graphs provide good results for this problem. However, some widely used graph-based clustering methods, such as spectral clustering algorithms, are sensitive to noise and outliers. In this paper, a cut-point clustering algorithm (CutPC) based on a natural neighbor graph is proposed. The CutPC method performs noise cutting when a cut-point value is above the critical value. Normally, the method can automatically identify clusters with arbitrary shapes and detect outliers without any prior knowledge or preparatory parameter settings. The user can also adjust a coefficient to adapt clustering solutions for particular problems better. Experimental results on various synthetic and real-world datasets demonstrate the obvious superiority of CutPC compared with k-means, DBSCAN, DPC, SC, and DCore.  相似文献   

18.
刘贝贝  马儒宁  丁军娣 《软件学报》2015,26(11):2820-2835
针对处理大数据时传统聚类算法失效或效果不理想的问题,提出了一种大数据的密度统计合并算法(density-based statistical merging algorithm for large data sets,简称DSML).该算法将数据点的每个特征看作一组独立随机变量,并根据独立有限差分不等式获得统计合并判定准则.首先,使用统计合并判定准则对Leaders算法做出改进,获得代表点集;随后,结合代表点的密度和邻域信息,再次使用统计合并判定准则完成对整个数据集的聚类.理论分析和实验结果表明,DSML算法具有近似线性的时间复杂度,能处理任意形状的数据集,且对噪声具有良好的鲁棒性,非常有利于处理大规模数据集.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号