共查询到19条相似文献,搜索用时 52 毫秒
1.
一种多维不确定性数据流聚类算法 总被引:4,自引:0,他引:4
目前在很多不确定性数据流聚类方法研究中,存在着聚类模型和数据流的数据模型失配问题,且它们往往假定不确定性数据的概率密度函数、概率分布函数或者概率是已知的,然而这些信息在实际系统中很难获得.鉴于此,本文提出一种基于区间数的多维不确定性数据流聚类算法(UIDMicro).在该算法中,首先利用区间数结合不确定性数据的统计信息表示多维不确定性数据流,然后采用“当前簇”和“候选簇”两层簇窗口对不确定性数据流进行聚类,通过动态调整两层簇窗口实现聚类模型和数据模型的实时匹配.实验结果表明,该方法具有较高的聚类精度和处理效率. 相似文献
2.
3.
经典谱聚类算法将数据聚类转为图划分问题,在分析其Normalized Cut函数与传统加权核k-means等价基础上,设计了一种基于抽样改进加权核k-means算法的大规模数据集谱聚类算法,算法通过加权核k-means迭代优化避免Laplacian矩阵特征分解的大量资源占用,通过随机映射得到近似奇异值分解,并由近似奇异... 相似文献
4.
模糊C-均值(FCM)聚类算法是数据挖掘中常用的方法之一,但往往受到初始聚类中心影响,收敛结果易陷入局部极小值的问题。该文提出了一种基于人工萤火虫(GSO)的模糊聚类算法(GSFM)。该算法引入了全局寻优能力强的人工萤火虫算法来求得最优解作为FCM算法的初始聚类中心,然后利用FCM算法优化初始聚类中心,最后求得全局最优解,从而有效克服了FCM算法的缺点。实验结果表明,新算法与FCM聚类算法相比,提高了算法的寻优能力,并且迭代次数更少,收敛速度更快,聚类效果更好。 相似文献
5.
Blog是随着科技的发展兴起的一种是一种新型的网络表现形式,如今已成为互联网的又一主体.本文主要是基于链接聚类算法来分析Blog网页,Blog页面具有不稳定性、即时更新性,以常用图聚类算法为基础,根据GMC算法来进行聚类,在此基础上提Blog聚类的图聚类算法.并且本文还对GMC算法制定相应的数学解决方案,以得到较高的算法运行效率. 相似文献
6.
针对大型风力发电机组高维SCADA时序数据的工况识别问题,结合风电机组运行规律和TICC算法,提出一种自动分割聚类方法。从高维的SCADA数据中选取风速、转速和桨距角等少量特定参数作为初始分割聚类对象,分析特定参数的运行规律,确定风电机组理论的运行工况。选取一段特定参数的历史数据,利用TICC算法进行离线聚类分割,获得聚类的最优特征参数。将最优特征参数作为TICC算法的输入,对新的特定参数时间序列数据进行分类。最后根据特定参数时间序列的聚类结果,对未进行分割的SCADA时序数据进行聚类处理。选取某2.5 MW双馈风电机组的SCADA时间序列数据对方法进行验证,同时将所提出的方法与FCM算法、GMM算法、K-Means算法进行对比研究。实例验证和对比研究表明,所提的聚类方法充分融合理论知识和TICC算法的优点,可高效处理高维SCADA聚类分割问题,同时保证聚类结果与理论分析结果一致性。 相似文献
7.
目前的挖掘算法单纯考虑了用户的访问频度,而忽略了用户对访问路径的兴趣度。本文通过分析目前用户偏爱路径挖掘算法存在的问题,结合事物聚类算法,将雅克比系数与最长公共路径系数相乘,得到更准确地用户相似集,并基于一个三元组模型构造以页面兴趣度为元素值的网站浏览数据矩阵,采用改进的挖掘算法计算用户偏爱度和访问兴趣度,降低访问页面闲置及链接等因素对数据挖掘的影响;实验结果表明,该算法针对Web日志海量数据进行挖掘,具有较高的效率和准确率。 相似文献
8.
介绍了提高Web访问效率必要性、数据挖掘的概念、聚类技术的原理、及其实现的步骤。聚类分析技术是根据数据对象的属性信息或对象间的关系,将数据对象分成类簇(Cluster),同一簇中的对象有较高的相似度,不同簇中的对象彼此差别较大。利用聚类技术可以发现一同被访问的Web页面.并把它们编到一个组里,帮助用户更好地访问,提高Web访问效率。可以通过对服务器的访问日志进行数据挖掘,得出网站页面之间共同被访问的频度,使用数据矩阵寻找每个聚类,根据每个聚类创立索引页,通过索引页帮助用户访问,提高访问速度。 相似文献
9.
10.
11.
在无线传感器网络定位的距离估计方法研究中,普遍假设到达信号强度(received signal strength indicator,RSSI)与对应通信距离的对数成线性关系,但是该假设在实际无线通信环境下几乎不能满足.针对此问题本文提出一种基于区间数聚类的RSSI-距离(RSSI-D)估计方法(distance estimation method using interval data clustering,DEMIDC),首先利用区间数表示方法结合实际定位环境中RSSI数据的统计信息表示RSSI的分布区域,然后针对不同环境中RSSI不确定性程度不同,分别采用基于区间数软聚类和硬聚类的方法对RSSI-D进行估计.最后采用3种典型通信环境下真实的RSSI测量数据完成的实验结果表明,该方法具有较高的距离估计精度,同时具备一定的实用价值. 相似文献
12.
13.
14.
15.
16.
《Measurement》2014
Owing to the scattered nature of Denial-of-Service attacks, it is tremendously challenging to detect such malicious behavior using traditional intrusion detection systems in Wireless Sensor Networks (WSNs). In the current paper, a hybrid clustering method is introduced, namely a density-based fuzzy imperialist competitive clustering algorithm (D-FICCA). Hereby, the imperialist competitive algorithm (ICA) is modified with a density-based algorithm and fuzzy logic for optimum clustering in WSNs. A density-based clustering algorithm helps improve the imperialist competitive algorithm for the formation of arbitrary cluster shapes as well as handling noise. The fuzzy logic controller (FLC) assimilates to imperialistic competition by adjusting the fuzzy rules to avoid possible errors of the worst imperialist action selection strategy. The proposed method aims to enhance the accuracy of malicious detection. D-FICCA is evaluated on a publicly available dataset consisting of real measurements collected from sensors deployed at the Intel Berkeley Research Lab. Its performance is compared against existing empirical methods, such as K-MICA, K-mean, and DBSCAN. The results demonstrate that the proposed framework achieves higher detection accuracy 87% and clustering quality 0.99 compared to existing approaches. 相似文献
17.
18.
19.
总结了目前工程类几何模型分类与聚类问题的研究进展。首先分析了基于k最近邻方法和基于支持向量机的模型分类技术,回顾了传统聚类技术和人工神经网络在模型聚类方面的应用现状;然后探讨了聚类和降维技术在模型分类与聚类的过程可视化和结果可视化方面的应用。最后,通过对已有研究成果的比较分析,预测了工程类几何模型的分类与聚类的研究方向。 相似文献