首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 52 毫秒
1.
一种多维不确定性数据流聚类算法   总被引:4,自引:0,他引:4  
目前在很多不确定性数据流聚类方法研究中,存在着聚类模型和数据流的数据模型失配问题,且它们往往假定不确定性数据的概率密度函数、概率分布函数或者概率是已知的,然而这些信息在实际系统中很难获得.鉴于此,本文提出一种基于区间数的多维不确定性数据流聚类算法(UIDMicro).在该算法中,首先利用区间数结合不确定性数据的统计信息表示多维不确定性数据流,然后采用“当前簇”和“候选簇”两层簇窗口对不确定性数据流进行聚类,通过动态调整两层簇窗口实现聚类模型和数据模型的实时匹配.实验结果表明,该方法具有较高的聚类精度和处理效率.  相似文献   

2.
数据挖掘聚类算法研究   总被引:3,自引:0,他引:3  
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术.全面总结了大部分常用聚类算法的主要特点,对一些经典聚类算法进行比较,并提出了相关结论,最后对几种新型的聚类算法进行基本概括.  相似文献   

3.
经典谱聚类算法将数据聚类转为图划分问题,在分析其Normalized Cut函数与传统加权核k-means等价基础上,设计了一种基于抽样改进加权核k-means算法的大规模数据集谱聚类算法,算法通过加权核k-means迭代优化避免Laplacian矩阵特征分解的大量资源占用,通过随机映射得到近似奇异值分解,并由近似奇异...  相似文献   

4.
模糊C-均值(FCM)聚类算法是数据挖掘中常用的方法之一,但往往受到初始聚类中心影响,收敛结果易陷入局部极小值的问题。该文提出了一种基于人工萤火虫(GSO)的模糊聚类算法(GSFM)。该算法引入了全局寻优能力强的人工萤火虫算法来求得最优解作为FCM算法的初始聚类中心,然后利用FCM算法优化初始聚类中心,最后求得全局最优解,从而有效克服了FCM算法的缺点。实验结果表明,新算法与FCM聚类算法相比,提高了算法的寻优能力,并且迭代次数更少,收敛速度更快,聚类效果更好。  相似文献   

5.
Blog是随着科技的发展兴起的一种是一种新型的网络表现形式,如今已成为互联网的又一主体.本文主要是基于链接聚类算法来分析Blog网页,Blog页面具有不稳定性、即时更新性,以常用图聚类算法为基础,根据GMC算法来进行聚类,在此基础上提Blog聚类的图聚类算法.并且本文还对GMC算法制定相应的数学解决方案,以得到较高的算法运行效率.  相似文献   

6.
针对大型风力发电机组高维SCADA时序数据的工况识别问题,结合风电机组运行规律和TICC算法,提出一种自动分割聚类方法。从高维的SCADA数据中选取风速、转速和桨距角等少量特定参数作为初始分割聚类对象,分析特定参数的运行规律,确定风电机组理论的运行工况。选取一段特定参数的历史数据,利用TICC算法进行离线聚类分割,获得聚类的最优特征参数。将最优特征参数作为TICC算法的输入,对新的特定参数时间序列数据进行分类。最后根据特定参数时间序列的聚类结果,对未进行分割的SCADA时序数据进行聚类处理。选取某2.5 MW双馈风电机组的SCADA时间序列数据对方法进行验证,同时将所提出的方法与FCM算法、GMM算法、K-Means算法进行对比研究。实例验证和对比研究表明,所提的聚类方法充分融合理论知识和TICC算法的优点,可高效处理高维SCADA聚类分割问题,同时保证聚类结果与理论分析结果一致性。  相似文献   

7.
目前的挖掘算法单纯考虑了用户的访问频度,而忽略了用户对访问路径的兴趣度。本文通过分析目前用户偏爱路径挖掘算法存在的问题,结合事物聚类算法,将雅克比系数与最长公共路径系数相乘,得到更准确地用户相似集,并基于一个三元组模型构造以页面兴趣度为元素值的网站浏览数据矩阵,采用改进的挖掘算法计算用户偏爱度和访问兴趣度,降低访问页面闲置及链接等因素对数据挖掘的影响;实验结果表明,该算法针对Web日志海量数据进行挖掘,具有较高的效率和准确率。  相似文献   

8.
介绍了提高Web访问效率必要性、数据挖掘的概念、聚类技术的原理、及其实现的步骤。聚类分析技术是根据数据对象的属性信息或对象间的关系,将数据对象分成类簇(Cluster),同一簇中的对象有较高的相似度,不同簇中的对象彼此差别较大。利用聚类技术可以发现一同被访问的Web页面.并把它们编到一个组里,帮助用户更好地访问,提高Web访问效率。可以通过对服务器的访问日志进行数据挖掘,得出网站页面之间共同被访问的频度,使用数据矩阵寻找每个聚类,根据每个聚类创立索引页,通过索引页帮助用户访问,提高访问速度。  相似文献   

9.
经典FCM聚类算法存在的两个方面的问题:一是算法对初始聚类中心的过分依赖性;二是算法需要预先知道实际的聚类数目,而在实际应用中,聚类数目却是未知的。对此提出了一种解决方法,通过仿真实验证实了该方法的可行性与有效性。  相似文献   

10.
订单分批是物流中心提高作业分拣效率的一个有效方法。主要针对“货到人”模式下的订单分批问题,构造了基于聚类算法的数学模型,并以最小化货物搬运次数为目标函数进行求解。通过在不同规模的订单数据下,比较基于聚类算法的分批策略与采用先到先分批策略、不分批策略在拣选作业中的实际效果,表明该算法能有效提高分拣任务的作业效率。  相似文献   

11.
在无线传感器网络定位的距离估计方法研究中,普遍假设到达信号强度(received signal strength indicator,RSSI)与对应通信距离的对数成线性关系,但是该假设在实际无线通信环境下几乎不能满足.针对此问题本文提出一种基于区间数聚类的RSSI-距离(RSSI-D)估计方法(distance estimation method using interval data clustering,DEMIDC),首先利用区间数表示方法结合实际定位环境中RSSI数据的统计信息表示RSSI的分布区域,然后针对不同环境中RSSI不确定性程度不同,分别采用基于区间数软聚类和硬聚类的方法对RSSI-D进行估计.最后采用3种典型通信环境下真实的RSSI测量数据完成的实验结果表明,该方法具有较高的距离估计精度,同时具备一定的实用价值.  相似文献   

12.
网络化测试体系中不确定性数据处理方法浅析   总被引:8,自引:3,他引:8  
随着以LXI和无线传感器网络为代表的新一代网络化测试信息采集体系技术的迅速发展,不确定性数据问题将成为其应用过程中所必需面对的测试信息处理技术的挑战.鉴于此,本文首先介绍了网络化测试体系结构下不确定性数据的概念和来源,并分析了其特点以及对常规数据挖掘方法的挑战.然后,重点分析国内外研究现状、主流的不确定性数据挖掘方法和研究工作.在此基础上,剖析网络化测试体系中不确定性数据挖掘研究工作应关注的主要问题和重点研究内容.  相似文献   

13.
连续属性离散化是数据分析中重要的预处理过程,而基于粗糙集理论的数据分析要求离散化的结果能够最大程度的保持原信息系统的分辨关系。本文提出了一种新的离散化算法,此算法以决策信息系统中决策属性对条件属性集合的依赖度作为评价函数动态调整DBSCAN聚类算法的参数,直至离散化决策属性对条件属性集合的依赖度达到预先指定的阈值为止。算法分析和实验证明,本算法是切实可行的。  相似文献   

14.
利用支持向量机和集群的基本思想,提出一种多类分类算法,并在纸质卷材复合过程中对边缘破损的类别进行了试验测试,具有良好效果。  相似文献   

15.
一种K-均值脸谱图聚类新算法   总被引:2,自引:0,他引:2  
王金甲  洪文学  李昕 《仪器仪表学报》2007,28(10):1916-1920
Chernoff脸谱图简单,类似卡通画,能图形化地表示多元数据。但脸谱图聚类算法具有主观性的巨大的对比工作量,脸谱特征分配困难。因此,本文提出一种新的脸谱图聚类算法,它合并了K均值聚类或模糊G均值聚类算法。IRIS和蔬菜油数据集的实验结果表明新算法优于传统的聚类算法。  相似文献   

16.
Owing to the scattered nature of Denial-of-Service attacks, it is tremendously challenging to detect such malicious behavior using traditional intrusion detection systems in Wireless Sensor Networks (WSNs). In the current paper, a hybrid clustering method is introduced, namely a density-based fuzzy imperialist competitive clustering algorithm (D-FICCA). Hereby, the imperialist competitive algorithm (ICA) is modified with a density-based algorithm and fuzzy logic for optimum clustering in WSNs. A density-based clustering algorithm helps improve the imperialist competitive algorithm for the formation of arbitrary cluster shapes as well as handling noise. The fuzzy logic controller (FLC) assimilates to imperialistic competition by adjusting the fuzzy rules to avoid possible errors of the worst imperialist action selection strategy. The proposed method aims to enhance the accuracy of malicious detection. D-FICCA is evaluated on a publicly available dataset consisting of real measurements collected from sensors deployed at the Intel Berkeley Research Lab. Its performance is compared against existing empirical methods, such as K-MICA, K-mean, and DBSCAN. The results demonstrate that the proposed framework achieves higher detection accuracy 87% and clustering quality 0.99 compared to existing approaches.  相似文献   

17.
动态拓扑环境下无线传感器网络分簇算法研究   总被引:2,自引:4,他引:2  
提出一种适用于动态拓扑环境的无线传感器网络分布式分簇算法,算法根据节点的剩余能量以及与动态变化的簇心之间的距离来挑选簇头,从而使网络能量均匀消耗.与集中式算法不同,该算法只需和部分邻居节点交换阈值信息而无需收集全局节点的位置信息,也不必完成远距离通信等任务.仿真与实际应用表明,动态拓扑环境下,该算法具有良好的负载平衡性能和较小的协议开销,与LEACH算法相比,能有效减少能量消耗,网络生存期可以延长20%~30%.  相似文献   

18.
基于动态聚类的电力变压器故障诊断   总被引:10,自引:0,他引:10  
本文提出了一种新电力变压器故障诊断的动态聚类方法,以人工免疫网络对故障样本进行免疫学习和记忆,提取表征故障样本的有用特征作为核可能性聚类算法的初始聚类中心,再用遗传算法动态选取聚类个数和中心实现故障样本的分类。该诊断方法经大量实例分析,并将其结果与BP神经网络等方法的结果相比,表明该算法具有较高的诊断精度。  相似文献   

19.
总结了目前工程类几何模型分类与聚类问题的研究进展。首先分析了基于k最近邻方法和基于支持向量机的模型分类技术,回顾了传统聚类技术和人工神经网络在模型聚类方面的应用现状;然后探讨了聚类和降维技术在模型分类与聚类的过程可视化和结果可视化方面的应用。最后,通过对已有研究成果的比较分析,预测了工程类几何模型的分类与聚类的研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号