共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
因集中供热建筑结构、住户行为习惯等差异,末端住户供暖数据具有特征差异大、非线性强、数据量大、响应时间长等特征,在原数据空间中利用聚类分析进行异常检测造成类间数据交叉,精确性无法保证。本文提出高维高斯混合聚类算法,将数据集映射到高维空间进行聚类,利用核函数映射、内积运算与高维特征空间分解等计算方法,提高精确度,规避维数灾难。搭建工业大数据分析平台,对比K-Means、高斯混合、恒虚警率、高维高斯混合算法聚类结果与异常检测精确度,本文所提算法将准确性提高到90.72%,误报率降低到5.92%,结合该算法完成4类异常用热数据集的解释与辨识。高维高斯混合聚类可以有效分析用户用热特征、检测异常数据,辅助降低采暖能耗,实现建筑节能。 相似文献
3.
基于聚类和距离的大数据集离群点检测算法 总被引:1,自引:0,他引:1
针对已有的基于距离的离群点检测算法在大数据集上扩展性差的问题,提出了基于聚类和距离混合的大数据集离群检测算法.算法第一阶段采用层次聚类和k-means混合的层次k-means算法对数据进行聚类,并按照一个启发式规则对其进行排序.第二阶段在聚类的结果上采用嵌套循环算法进行离群检测,并通过两个剪枝规则进行高效舅枝,减少了离群检测时数据点之间距离计算的次数.理论分析和实验结果证明了算法的可行性和效率. 相似文献
4.
5.
针对综合传动装置运行过程中,工况变化及装置故障状态引起的数据异常、难以有效区分这一问题,提出了一种适用于复杂工况下综合传动装置状态监测数据异常检测的方法。首先,采用基于密度的聚类方法(DBSCAN)对状态监测数据进行了关联变量聚类,以排除非关联数据对数据重构准确度的干扰;然后,利用深度降噪自编码网络构建了状态监测数据重构模型,获取了对异常数据敏感的偏差特征;最后,利用支持向量数据描述(SVDD)算法构建了正常状态监测数据偏差特征的超球体,完成了复杂工况下对综合传动装置状态监测数据异常的检测;为了验证该方法对综合传动装置状态监测数据异常检测的有效性,以某型综合传动装置为研究对象,在多组综合传动装置漏油实验数据上进行异常检测验证分析。实验结果表明:该方法实现了在综合传动装置不同程度漏油故障条件下对状态监测数据异常进行检测的目的,且其准确度整体高于92%。研究结果表明:该方法可以有效检测出综合传动装置早期异常运行状态,为综合传动装置健康管理与劣化评估奠定基础。 相似文献
6.
距离聚类方法是航天器等复杂系统实现遥测参数异常检测的常用方法之一,但在面对高维遥测数据进行异常检测任务时,往往会暴露出效率低下、精度劣化等严重问题。针对基于高维遥测数据的航天器异常检测难题,提出了一种基于耦合自适应的改进距离定义,并针对归纳监视系统(IMS)算法这一经典距离聚类算法进行了改进。该方法利用历史数据的分布特征,在进行聚类的同时,对于参数耦合性进行动态挖掘,并将挖掘到的知识高效地投入到异常检测任务。最后,采用运载火箭电源系统的真实高维遥测数据对所提方法进行了应用验证。在与多种传统基于IMS的异常检测方法的对比实验中,该改进算法检测效率与准确率较另两类IMS算法中的最优方法分别提升了41.83%和69.03%,验证了运用该距离定义的检测方法在效率与精确率上的优越性。 相似文献
7.
8.
针对大多基于聚类的离群点检测算法往往需要人工输入参数,对于不同的数据集很难选择一个合适参数的问题,将无参数的基于自然邻居的离群点检测算法的自然邻居搜索算法和密度峰值聚类算法相结合,提出一种基于聚类离群因子和相互密度的离群点检测算法。该算法使用相互密度和γ密度构造决策图,将γ密度异常大的样本点作为聚类中心进行聚类,最后根据聚类的离群因子找出离群聚类边界检测离群点,该算法不需要人工输入参数。在模拟数据集和真实数据集下进行了实验,证明了所提算法能很好地进行聚类和离群数据的挖掘。 相似文献
9.
农田水利灌溉分流机械运行中未对运行数据进行处理,导致其存在检测性能差和检测率低等问题。为此,提出基于支持向量机的农田水利灌溉分流机械运行异常检测方法。采用组织映射算法聚类处理灌溉分流机械的运行数据,通过尺度不变特征变换 SIFT 方法获取运行数据特征,把免疫算法引入支持向量机中,将获取的运行数据特征输入支持向量机中,完成农田水利灌溉分流机械运行的异常检测。实验结果表明,该方法提升了农田水利灌溉分流机械检测的有效性。 相似文献
10.
针对大型风力发电机组高维SCADA时序数据的工况识别问题,结合风电机组运行规律和TICC算法,提出一种自动分割聚类方法。从高维的SCADA数据中选取风速、转速和桨距角等少量特定参数作为初始分割聚类对象,分析特定参数的运行规律,确定风电机组理论的运行工况。选取一段特定参数的历史数据,利用TICC算法进行离线聚类分割,获得聚类的最优特征参数。将最优特征参数作为TICC算法的输入,对新的特定参数时间序列数据进行分类。最后根据特定参数时间序列的聚类结果,对未进行分割的SCADA时序数据进行聚类处理。选取某2.5 MW双馈风电机组的SCADA时间序列数据对方法进行验证,同时将所提出的方法与FCM算法、GMM算法、K-Means算法进行对比研究。实例验证和对比研究表明,所提的聚类方法充分融合理论知识和TICC算法的优点,可高效处理高维SCADA聚类分割问题,同时保证聚类结果与理论分析结果一致性。 相似文献
11.
基于历史数据聚类的火电机组工况划分 总被引:2,自引:0,他引:2
针对调峰背景下火电机组非稳态工况增多,以及常见运行工况偏离设计工况等问题,提出了基于历史运行数据聚类的工况划分模型。首先,考虑到运行数据中非稳态工况与稳态工况并存的情况,以功率作为特征变量,提出基于功率差值期望区间估计的稳态判别算法,筛选出历史数据中的非稳态工况;其次,由于稳态工况下外部边界条件变量的分布差异性,提出改进的多步K-均值聚类算法进行稳态工况的划分,并利用silhouette评价准则确定每步条件下的最佳聚类数;最后,采用某实际发电用重型燃气轮机的历史运行数据进行模型验证。通过与传统K-均值聚类算法比较,所提出的模型能够有效解决工况分类数目较少以及样本分布不均的问题。 相似文献
12.
13.
14.
《计算机集成制造系统》2017,(9)
针对网格聚类算法不可避免产生的网格量化问题,提出一种基于双网格校正小波聚类算法。该算法以最大密集网格规则下获得的网格划分k值进行原始网格小波聚类,以均匀分布假设规则下获得的网格划分k值进行校正网格小波聚类,通过校正算法得到最佳聚类结果。通过基于双网格校正小波聚类的转子故障诊断实例表明:双网格小波聚类降低了网格划分和网格密度阈值对聚类质量的影响,提高了精度;双网格聚类的并行校正处理缓和了一种尺寸下网格均匀划分与数据对象非均匀分布之间的矛盾,为网格量化问题提供了一种解决思路。 相似文献
15.
16.
17.
为获得具有模糊规则自适应约简性能和较好的泛化性能的TSK分类器,本文提出了一种结合模糊(C+P)均值聚类(FCPM)算法和SP-V-支持向量机(SVM)分类算法来构建TSK(Takagi-Sugeno-Kang)分类器的方法。该方法首先用FCPM聚类算法对训练数据进行聚类;然后根据聚类结果确定TSK分类器的模糊规则前件中的高斯隶属度函数的中心和宽度参数;最后采用成组稀疏约束SP-V-SVM算法对模糊规则后件参数进行学习,该算法不仅改善了系统的泛化性能,还使系统具有模糊规则自适应约简功能,使得系统更为紧凑。与相关算法在UCI和IDA标准数据集分类实验中的模糊规则数和分类性能对比表明:用提出的分类算法所构造的TSK分类器不仅具有较好的分类性能,而且模糊规则数少,有利于构建更为紧凑的模糊分类系统。 相似文献
18.
为使桥式抓斗卸船机安全稳定运行,针对大量监测数据利用率低、故障诊断不及时等问题,提出了基于兴趣度关联规则的卸船机故障预测模型方法。采用传感器监测和时域分析方法获取卸船机运行参数空间,利用聚类离散算法将监测数据根据其属性值域离散为非线性聚类区间,获取卸船机关联规则组,提取状态数据关联维的权重系数,构建状态监测数据关联规则指向性特征约束函数模型,通过预测模型中关联规则状态的改变实现故障预测。实验结果表明,该方法能有效表征卸船机运行状态监测的关联内部特征信息,实现对卸船机故障类别的预测,降低卸船机故障发生的频率。 相似文献
19.
随着传感技术和智能交通的快速发展,利用机器学习、人工智能的先进算法对高速公路的车辆通过视频采集进行车辆检测的应用成为研究的热点,通过利用谱聚类算法对车辆检测进行特征选择,探讨了谱聚类算法与K-means聚类算法和LSVM聚类算法的区别,并通过实验数据进行了对比分析。经实践证明,该方法在车辆检测中特征选择时具有较好的效果,能满足实际的要求。 相似文献
20.
针对传统聚类算法处理混合属性数据聚类质量不高且聚类结果可视化差的问题,提出了基于异构值差度量的自组织映射混合属性数据聚类算法。该算法以自组织映射神经网络为框架,采用基于样本概率的异构值差度量混合属性数据的相异性。利用分类特征项在Voronoi集合中出现频率作为分类属性数据参考向量更新规则的基础,通过混合更新规则实现数值属性和分类属性数据规则的更新。利用UCI公共数据库中的分类属性和混合属性数据集来测试所提出的聚类算法,并与SOM算法和kprototypes、SBAC、KL-FCM-GM算法进行比较。最后将所提出的聚类算法应用于轮式移动机器人的运动状态分析,获得了较好的聚类效果。 相似文献