首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
Anomaly detection and recognition are of prime importance in process industries.Faults are usually rare,and, therefore,predicting them is difficult.In this paper,a new greedy initialization method for the K-means algorithm is proposed to improve traditional K-means clustering techniques.The new initialization method tries to choose suitable initial points,which are well separated and have the potential to form high-quality clusters.Based on the clustering result of historical disqualification product data in manufacturing process which generated by the Improved-K-means algorithm,a prediction model which is used to detect and recognize the abnormal trend of the quality problems is constructed.This simple and robust alarm-system architecture for predicting incoming faults realizes the transition of quality problems from diagnosis afterward to prevention beforehand indeed.In the end,the alarm model was applied for prediction and avoidance of gear-wheel assembly faults at a gear-plant.  相似文献   

2.
在各种聚类算法中,基于目标函数的K-均值聚类算法应用最为广泛,然而,K-均值算法对初始聚类中心特别敏感,聚类结果易收敛于局部最优。为此,提出基于加权处罚的K-均值优化算法。每次迭代过程中,根据簇的平均误差的大小为簇分配权值,构造加权准则函数,把样本分给加权距离最小的簇中。限制簇集中出现平均误差较大的簇,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在含有噪音的数据集中,表现出更好的抗噪性能,聚类效果更好。  相似文献   

3.
判断聚类结果中是否存在误分类的簇,即簇中包含的样本不属于同一类。若存在,则在已有聚类结果上使用加权方案,处罚误分类的簇,输出新的聚类结果。若不存在,则输出已有聚类结果。限制簇集中存在误分类的簇,消除初始聚类中心对K-均值算法的影响,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在坏的初始化条件下,表现出更好的鲁棒性;在含有噪音的数据集中,表现出更好的抗噪性能;聚类效果更好。  相似文献   

4.
基于K-均值聚类算法RBF神经网络交通流预测   总被引:1,自引:0,他引:1  
针对目前道路拥堵等交通问题,本文采用K-均值聚类算法对径向基函数(radial basis function,RBF)网络进行优化,通过K-均值聚类算法把所有的输入样本进行统一聚类,求得所有隐含层节点的RBF中心值Ci,并用最小二乘法(LMS)进行RBF网络的权值调整,同时在一定的时间和路段内对车流量进行数据采集,通过建立RBF神经网络模型,运用Matlab软件把采集的数据、图像进行计算机仿真,仿真结果表明,未加入K-均值聚类的RBF神经网络,其预测输出曲线大致可以和实际输出曲线拟合,但在数据波动较大的时刻,预测曲线的收敛速度偏慢且效率偏低;而采用K-均值聚类算法的RBF神经网络,在实际输出波动较大时,预测输出的曲线收敛速度和准确度都较高,因此,本研究相对于普通的BP神经网络,有更高的预测精度和较好的收敛性。该研究适用于市区内的交通流预测。  相似文献   

5.
K-均值算法对初始聚类中心敏感,聚类结果随不同初始聚类中心波动。针对以上问题,提出一种基于最小方差的自适应K-均值初始化方法,使初始聚类中心分布在K个不同样本密集区域,聚类结果收敛到全局最优。首先,根据样本空间分布信息,计算样本方差得到样本紧密度信息,并基于样本紧密度选出满足条件的候选初始聚类中心;然后,对候选初始聚类中心进行处理,筛选出K个初始聚类中心。实验证明,算法具有较高的聚类性能,对噪声和孤立点具有较好的鲁棒性,且适合对大规模数据集聚类。  相似文献   

6.
传统K-means聚类算法的性能依赖于初始聚类中心的选择。本文将复杂网络节点的属性值作为节点的度、聚集度与聚集系数的加权值,通过计算所有节点的加权综合聚集特征值,选取综合聚集特征值高,并且彼此之间无高聚集性特征的个节点作为聚类的初始聚类中心,然后进行聚类迭代过程。实验结果表明,新算法对初始聚类中心的选取更迅速有效,避免了传统K-means算法初始聚类节点选取的敏感性,进而提高K-means算法的聚类质量。  相似文献   

7.
随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因初始中心点的不确定性,易陷入局部最优解的问题。本算法在Canopy(罩盖)中完成K-means聚类,并在Canopy间完成簇的合并,聚类效果稳定,迭代次数少。同时,结合MapReduce分布式计算模型,给出改进后算法的并行化设计方法和策略,进一步通过改进相似度度量方法,将该方法用于文本聚类中。实验结果证明该算法具有良好的准确率和扩展性。  相似文献   

8.
K-均值(K-means)聚类算法是学术与工业领域的经典算法。然而,它却具有两个明显缺陷:1) 需要预先知道聚类的数量;2) 对算法的随机初始化非常敏感。为了解决这两个问题,首先归纳了K-均值算法的基本步骤,并对聚类有效性进行了分析;然后以数据样本点的欧几里德距离为基础,定义了以聚类数量k为自变量的类间质心距离之和以及类内距离之和,由此构造了聚类有效性评价函数;最后根据经验规则,在聚类数量的可能范围内通过求解聚类有效性评价函数的最小值以确定数据集的最优聚类数量。对UCI的3个数据集Iris、Seeds和Wine的仿真结果说明,提出的聚类有效性评价函数不仅能够准确地反映数据的真实聚类结构,还能有效地抑制算法对随机初始化的敏感性,通过对K-均值算法的多次运行,其结果也验证了聚类有效性评价函数的鲁棒性。  相似文献   

9.
一种优化初始化中心的k均值web信息聚类算法   总被引:1,自引:0,他引:1  
k-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用。由于k-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果。针对k-means算法所存在的问题,构造了文本集合的相似度矩阵,基于平均相似度集合通过排序迭代优选出了初始中心点。实验表明此算法可以有效减少迭代次数并提高聚类精度,最终获得较好的聚类效果。  相似文献   

10.
基于动态贝叶斯网络的WSNs链路质量预测   总被引:1,自引:0,他引:1  
无线传感器网络中,链路质量预测为数据可靠传输和上层网络协议性能的提高提供支撑。为进一步提高链路质量预测的准确性,提出基于动态贝叶斯网络(dynamic Bayesian networks,DBN)的链路质量预测机制。为避免单一评价指标的片面性,从链路信号质量、链路稳定性及非对称性3方面综合评价链路质量;采用K-means聚类算法对参数进行离散化预处理,得到各参数的离散区间;采用熵值法确定各参数的权重,以消除参数权重计算中主观因素的干扰;为避免最大隶属原则的缺陷,采用非对称贴近度分析法构建综合性的链路质量等级指标;借助贝叶斯网络(Bayesian networks,BN)处理不确定性问题的优势和BN分类器在分类上的良好性能,确定DBN的初始网络和转移网络,采用EM算法进行DBN模型的参数学习,从而构建了基于DBN的链路质量预测模型。实验结果表明了采用非对称贴近度分析法划分链路质量等级的合理性与DBN链路质量预测模型的合理性;与4C及FLI预测模型相比,本文模型具有更高的预测准确度。采用链路信号质量、链路稳定性及非对称性3个指标评价链路质量,采用DBN构建预测模型,可得到更准确及鲁棒性更好的链路质量预测结果。  相似文献   

11.
针对K-均值聚类算法对初始值敏感和易陷入局部最优的缺点,提出了一类新的聚类算法——基于差分演化的K-均值聚类算法,进而提出了基于自适应差分演化的K-均值聚类算法,并将新算法与传统的K-均值聚类算法和最近提出的几个同类聚类算法进行比较。实验结果表明,该类算法能比较有效地克服传统的K-均值聚类算法的缺点,算法具有较好的全局收敛能力,稳定性强、收敛速度快,且比较研究表明该类算法具有一定的竞争力。  相似文献   

12.
通过对电信业客户流失预测的国内外研究成果的分析,我们发现造成电信业客户流失原因种类比较多、难以用一种通用的划分标准对流失客户的流失特征进行刻画,因此本文提出了将K—means算法与传统的分类算法相结合的方法进行客户流失分析,并进行了应用实验.该实验以中国联通湖南某地区X分公司的客户数据为基础,利用数据挖掘软件Clementine8.1建立了客户流失分类预测模型,模型的应用结果表明:新方法对客户流失预测的命中率高于传统的分类预测算法.  相似文献   

13.
According to the characteristics of sonar image data with manifold feature, the sonar image detection method based on two-phase manifold partner clustering algorithm is proposed. Firstly, K-means block clustering based on euclidean distance is proposed to reduce the data set. Mean value, standard deviation, and gray minimum value are considered as three features based on the relatinship between clustering model and data structure. Then K-means clustering algorithm based on manifold distance is utilized clustering again on the reduced data set to improve the detection efficiency. In K-means clustering algorithm based on manifold distance, line segment length on the manifold is analyzed, and a new power function line segment length is proposed to decrease the computational complexity. In order to quickly calculate the manifold distance, new all-source shortest path as the pretreatment of efficient algorithm is proposed. Based on this, the spatial feature of the image block is added in the three features to get the final precise partner clustering algorithm. The comparison with the other typical clustering algorithms demonstrates that the proposed algorithm gets good detection result. And it has better adaptability by experiments of the different real sonar images.  相似文献   

14.
针对电价变化模式的复杂性,提出了一种基于聚类分析的电价预测模型。该模型将复杂的电价预测问题分解为更简单的子问题求解,首先通过聚类技术将输入空间划分为若干特征更明显的子空间,然后在子空间内分别使用支持向量机进行建模和预测。聚类分析中先应用减聚类算法自动确定聚类数并获取较优的初始聚类中心,然后采用K-均值算法进一步优化。采用美国PJM电力市场历史边际电价数据进行的仿真研究表明,电价预测模型能有效、稳定地提高电价预测精度。  相似文献   

15.
大规模人脸聚类不仅要求高效的人脸特征,还要求聚类算法在保持高准确率的同时耗时短.本文通过构建卷积神经网络高效提取人脸特征,并采用经典K-means算法和现阶段新颖的CFSFDP(Clustering by Fast Search and Find of Density Peaks)算法进行大规模人脸聚类.实验在聚类数目递增的情况下进行,并通过随机指标(Rand Index,RI)、信息熵、F1-measure和混淆矩阵可视化来综合评估聚类的质量.结果表明,在大规模人脸聚类的情况下,卷积神经网络特征融合K-means的人脸聚类算法速度和准确率均优于CFSFDP算法.这一结论对大规模人脸聚类的实际应用具有重要的指导意义.  相似文献   

16.
17.
在基于高斯混合模型(GMM)的声纹识别算法中,K-means聚类算法是GMM模型参数初始化常用的方法之一。传统K-means算法在聚类过程中采用几何距离进行分类,忽略了类中各矢量的分布不同对聚类结果的影响,常常得不到令人满意的识别结果。文中对传统K-means算法进行了改进,并将改进后的K-means算法与GMM结合应用到声纹识别系统中。实验结果表明,改进的K-means算法与传统的算法相比具有更好的识别效果。  相似文献   

18.
为了实现在网络资源中为网络用户提供针对兴趣爱好的推荐项目,提出了一种基于K-means聚类的应用于动态多维社会网络的个性化推荐算法.首先根据用户评分数据对用户进行建模,并根据评分数据集构建多维用户网络,再加入局域世界演化理论形成动态多维网络;然后根据改进的K-means算法对用户聚类;最后根据最近邻居得到目标用户的预测评分作出推荐,从而形成一种应用于动态多维社会网络中的个性化推荐算法.实验表明,相比协同过滤个性化推荐系统,新推荐策略的预测值和真实值之间的误差较小,个性化推荐水平得到了一定程度的提高.  相似文献   

19.
K-均值算法因其简单和高效性, 在文本聚类中占有重要地位. 针对传统的K-均值算法对初始点敏感、易陷入局部最优的问题, 结合遗传算法已经成为一种趋势. 在充分发挥K-均值算法的高效性的同时, 该文利用遗传算法的全局自适应优化特点克服了对初始点敏感的问题. 同时, 以余弦度量评价对象间的相似性并以此构造新的遗传算法适应度函数、收敛准则以及遗传算法种群更新方式, 提高了K-均值和遗传算法这种结合方式的聚类精度, 并增强了该结合算法的稳定性.  相似文献   

20.
免疫克隆优化聚类技术   总被引:4,自引:0,他引:4  
将人工免疫系统中的克隆选择优化应用于无监督分类与识别问题,提出了一种新的免疫克隆聚类算法.该算法利用克隆算子能够同时在同一父代抗体周围的多个方向进行全局或局部搜索,促使种群中抗体快速进化,从而在特征空间内快速获得聚类问题的全局最优聚类中心,有效克服了经典聚类算法易陷入局部极值的缺点,并从理论上证明了该算法具有全局收敛性.对7个人工数据集的聚类实验和两幅纹理图像的分割实验表明:新算法比常用的K均值算法的平均分类精度高20.9%,比另一种基于遗传算法的聚类方法的平均分类精度高20.3%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号