首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于数据加权策略的模糊聚类改进算法   总被引:2,自引:0,他引:2  
该文提出了一种数据指数加权的模糊均值聚类策略,引入了指数权因子和影响指数,使得可以在聚类过程中差异化处理各个数据。新策略和现有的Gustafson-Kessel(G-K)算法相结合,提出了一种新的模糊聚类算法DWG-K用于提高聚类质量和挖掘离群点。数据试验表明DWG-K在提高聚类质量方面优于现有的G-K;在离群点挖掘方面,DWG-K对离群点的判定是全局的,离群点的物理意义清楚,且计算效率明显高于当前广泛采用的基于密度的离群点挖掘算法。  相似文献   

2.
提出了基于滑动窗口的不确定数据流子空间聚类算法USSC,它应用采样时加权值的方法来选择初始化聚类中心点,采用滑动窗口SW缓存一段时间的元组作为聚类对象,并提出一种新的离群点处理机制来排除离群点Opo为适应不确定数据流元组不确定特性,该算法使用基于隶属度的非分割聚类方法来确定一个元组只能划分到一个簇中.试验结果表明,USSC算法与同类型的算法相比有较好的聚类效果和较快的聚类速度,而且其自身拥有很强的可伸缩性.  相似文献   

3.
针对传统离群点识别方法对数据的分布形状和密度有特定要求,需设定参数的问题,提出了一种自动聚类的离群点识别方法。该方法通过引入相互K近邻数来表示数据对象的离群度,对数据的分布形状、分布密度无要求,可以输出全局离群点、局部离群点和离群簇;通过k次迭代来实现自动聚类,无需人为设定参数。通过合成数据以及UCI数据实验,验证了该方法的有效性、普适性。  相似文献   

4.
针对密度峰值聚类算法需要人工设置参数、时间复杂度高的问题,提出了基于快速密度峰值聚类离群因子的离群点检测算法。首先,使用k近邻算法代替密度峰值聚类中的密度估计,采用KD-Tree索引数据结构计算数据对象的k近邻;然后,采用密度和距离乘积的方式自动选取聚类中心。此外,定义了向心相对距离、快速密度峰值聚类离群因子来刻画数据对象的离群程度。在人工数据集和真实数据集上对所提算法进行实验验证,并与一些经典和新颖的算法进行对比实验,从正确性和时间效率上验证了所提算法的有效性。  相似文献   

5.
孙爱程 《无线电工程》2012,42(6):45-47,51
离群数据检测是找出与正常数据不一致的数据。由于某种原因,会出现一些噪声数据。针对噪声数据的特征,提出了一个有效的离群点检测算法。通过层次k-means算法对数据集进行聚类,从包括离群点可能性最大的簇开始进行检测,在检测过程中提出基于熵值距离来衡量数据点的离群程度,并通过剪枝规则来减少检测次数,从而提高了检测的效率。仿真结果表明该算法对出现的噪声数据具有较好的过滤效果。  相似文献   

6.
基于样本加权的可能性模糊聚类算法   总被引:2,自引:0,他引:2       下载免费PDF全文
刘兵  夏士雄  周勇  韩旭东 《电子学报》2012,40(2):371-375
可能性模糊聚类算法解决了噪音敏感和一致性聚类问题,但算法假定每个待分析样本对聚类的贡献相同,导致离群点或噪声点对算法的干扰较强,算法迭代次数过大.为此,提出一种基于样本加权的可能性模糊聚类算法,新算法具有更快的收敛速度,对标准数据集和人工数据集加噪后的测试结果表明,该算法具有更强的鲁棒性,在有效降低时间复杂度的同时能够...  相似文献   

7.
基于粗糙集理论的序列离群点检测   总被引:3,自引:1,他引:2       下载免费PDF全文
作为数据挖掘的一项重要任务,离群点检测已经引起人们的广泛关注.本文基于粗糙集理论来讨论离群点的定义与检测问题,提出了一种新的离群点定义--粗糙序列离群点以及相应的离群点检测算法RSOD.该算法利用粗糙集理论中的知识熵和属性重要性等概念来构建三种类型的序列,并通过分析序列中元素的变化情况来检测离群点.在UCI标准数据集上...  相似文献   

8.
挖掘隐藏在网络中不同于正常数据对象的离群点是数据挖掘的重要任务之一.目前,针对双类型异质信息网络离群点检测的研究工作相对较少,原本适用于同质网络的离群点检测方法将很难适用于双类型异质网络.为此,提出了异质信息网络中基于排序和聚类的离群点检测方法(RKBOutlier).从异质信息网络中抽取两种类型的对象以及链接两种对象的语义信息,将待检测的数据作为属性对象,将另一类型数据作为目标对象,对目标对象进行聚类来检测属性对象在各个聚类中的分布情况,数据分布异常的对象即为离群点.将排序和聚类相结合来显著提高聚类的准确度.实验结果表明,RKBOutlier可以在双类型异质信息网络中有效地检测出离群点.  相似文献   

9.
提出一种基于改进粒子群优化算法的离群点检测算法,解决高维环境下离群点挖掘效率偏低的问题。新算法能够充分发挥粒子群优化算法全局搜索的优势,并具有k均值算法快速收敛的特点,可避免粒子群优化算法的早熟,减小确定k均值算法聚类中心的计算量等问题。实验表明,该算法在高维环境下可快速有效的挖掘出离群数据的离群支持度,有较好的挖掘效率、准确率和实用性。  相似文献   

10.
塔娜 《现代电子技术》2020,(15):123-126
考虑到传统大规模数据聚类分析算法收敛速度较慢的问题,提出一种基于云计算技术的大规模数据聚类分析算法。定义云空间内的数据变量,计算数据点密度,以计算出的密度数据为基准,整合为两个不同的数据集合,不断循环删除集合内局部密度低于平均密度的离群点,得出聚类中心。筛选远离聚类中心的点,计算数据点与聚类中心的相似系数,将保留下来的数据点划分为聚类区域,采用层次分配方法将聚类数据点分配到聚类区域中,完成大规模数据的聚类分析。实验结果表明,与传统聚类分析方法相比,所提聚类分析算法的收敛速度最高可达10 mm/s,收敛速度更快,说明该算法的收敛效果较好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号