首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
为了挖掘隐藏在惯性仪器测试数据背后的信息知识,运用数据挖掘技术,以Clementine12.0为平台建立模型并实现对惯性仪器故障诊断的过程。提出一种基于两阶段聚类并做改进的BP算法,与传统BP算法相比,提高了预测精度和普适能力。  相似文献   

2.
信息社会的发展,使数据量以前所未有的速度在增长,因此从海量数据中获取有用的知识和信息就变得越来越重要。数据挖掘是一种综合多领域知识而形成的数据分析技术,能够从大量数据中获取有价值的知识并为决策提供支持。聚类分析算法是数据挖掘中的一个核心内容,也是目前研究的一个热点。该文首先讲述了基于划分的聚类算法、基于分层的聚类算法、基于密度的聚类算法和基于网格的聚类算法等常用的聚类分析算法,并分析了其特点;然后通过举例详细描述了最近邻聚类算法的操作过程。聚类算法的总结,对聚类的研究和发展具有积极意义。  相似文献   

3.
数据挖掘常用聚类算法研究   总被引:2,自引:0,他引:2  
信息社会的发展,使数据量以前所未有的速度在增长,因此从海量数据中获取有用的知识和信息就变得越来越重要。数据挖掘是一种综合多领域知识而形成的数据分析技术,能够从大量数据中获取有价值的知识并为决策提供支持。聚类分析算法是数据挖掘中的一个核心内容,也是目前研究的一个热点。该文首先讲述了基于划分的聚类算法、基于分层的聚类算法、基于密度的聚类算法和基于网格的聚类算法等常用的聚类分析算法,并分析了其特点;然后通过举例详细描述了最近邻聚类算法的操作过程。聚类算法的总结,对聚类的研究和发展具有积极意义。  相似文献   

4.
聚类是数据挖掘领域的重要研究内容之一。参考基于元胞自动机距离变换算法模型,构建了基于CA模型的凝固聚类算法,该算法在CA模型演化的过程中,可以产生完整的层次聚类结果,同时对簇间的距离实现了度量,能够处理形状复杂的聚类对象,具有较好的向高维空间的推广能力以及并行计算的特性。最后通过两组聚类数据进行了实证研究,验证了该算法的有效性。  相似文献   

5.
滑动窗口模型下的优化数据流聚类算法   总被引:2,自引:0,他引:2  
胡彧  闫巧梅 《计算机应用》2008,28(6):1414-1416
为提高对进化数据流的聚类质量及效率,采用聚类特征指数直方图支持数据处理,减少直方图结构的维护数,改进滑动窗口下的流数据聚类算法。实验表明,与传统基于界标模型的聚类算法相比,优化算法可获得较好的工作效率、较小的内存开销和快速的数据处理能力,拓展了流数据挖掘技术的应用领域。  相似文献   

6.
聚类分析技术是数据挖据中的一种重要技术。本文介绍了数据挖掘对聚类的典型要求和聚类方法的分类,研究分析了聚类的主要算法.并从多个方面对这些算法的性能进行比较。  相似文献   

7.
针对现代电子数据迅速膨胀,传统的审计方式已经无法应对海量的业务数据,试图将数据挖掘中的聚类和关联规则算法引入审计领域.在研究聚类与关联规则算法的含义及相关算法—K-Means和Apriori算法的基础上,提出了一种基于聚类与关联规则的审计模型,并以某市城镇医疗保险的审计为例,首先利用聚类分析进行数据筛选,然后利用关联规则挖掘海量数据之间潜在的关系,为审计提供线索.文章通过案例分析为数据挖掘在信息舞弊识别领域的应用提供参考.  相似文献   

8.
为了使区间值算法的理论与研究成果应用到具体实践中,在企业数据信息的挖掘和分析中发现更有价值的知识,提出了区间值聚类的数据挖掘模型。与传统的数据挖掘方法相比较,区间值聚类的数据挖掘模型更加高效、准确、符合实际。  相似文献   

9.
从数据挖掘的概念入手, 以数据结构的角度看待数据挖掘的研究对象, 对数据挖掘的重要工具——聚类做了深入的论述, 把聚类分为基于数据元素的Q 型聚类和基于属性的R 型聚类, 着重讨论了R 型聚类, 论述了相关的概念、技术和算法。最后介绍了一个实际应用系统———医生医疗质量评价系统, 提出了一些新的观点及算法设计思路。  相似文献   

10.
一种基于概念的数据聚类模型   总被引:2,自引:0,他引:2  
张明卫  刘莹  张斌  朱志良 《软件学报》2009,20(9):2387-2396
在数据挖掘研究领域,现有的大多数聚类算法都受到数据可伸缩性和结果可解释性的限制.为了解决这一难题,提出了一种基于概念的数据聚类模型.该模型从描述数据样本的数据本身出发,首先在预处理后的数据集上提取基本概念,再对这些概念进行概化,形成表示聚类结果的高层概念,最后基于这些高层概念进行样本划分,从而完成整个聚类过程.该模型能够在保证聚类准确性的基础上,很大程度地减少要处理的数据量,提高原算法的可伸缩性.另外,该模型基于概念进行知识的发现与分析,能够提高聚类结果的可解释性,便于与用户交互.实验结果表明,该模型对于聚类结果较好且复杂度较高的算法尤为有效.  相似文献   

11.
为了解决惯性领域内“数据丰富知识贫乏”的问题,建立一个基于数据挖掘的智能故障诊断系统,并重点围绕其中的数据挖掘环节展开研究.以金姿态组合陀螺TQZ-1A为研究对象,运用Clementine12.0工具,借鉴CRISP-DM行业标准,构建了基于两阶段聚类并做改进的C5.0模型.经过模型评价指标的综合评估验证了模型良好的预测性能,说明所建立的模型是科学的,适用于工程实践.  相似文献   

12.
李婉婉  李国宁 《控制工程》2021,28(3):429-434
当前道岔故障诊断系统大多采用BP神经网络,但由于BP神经网络结构特点,在训练样本大且诊断系统精度要求比较高时,网络常常会呈现出以下不足:不收敛且容易陷入局部最优、常用的数据挖掘方法如小波分析等对数据的利用度不高、从时域或频域角度分析时不够全面和采用数据降维使用的LLE方法会丢失部分有用数据等.采用GMM聚类方法对兰州车...  相似文献   

13.
为提高海量数据挖掘和聚类的效率和精度,以应用于压缩机机械故障智能诊断中.将遗传算法与K均值聚类算法进行互补,提出基于倾斜分类K均值优化数据聚类算法.算法引入倾斜因子,避免较小类数据产生次优解的现象发生.在传统的K均值数据聚类算法基础上,通过倾斜因子排除了少数类局部最优解的干扰,提高遗传算法的收敛速度,也可以避免过早收敛到局部最优解中.仿真实验中以某天然气压气站采集的故障状态下的压缩机振动信号提取的特征量数据作为研究对象,进行数据聚类分析.仿真实验表明,通过改进的数据聚类算法对故障信号关联维特征量进行分类识别,能有效对四类天然气压缩机故障进行诊断分类,准确率能提高18.7%,研究结果在数据优化聚类及在机械故障诊断中的应用中具有良好的指导意义和实践价值.  相似文献   

14.
基于粗糙集与K-均值聚类的故障知识挖掘   总被引:1,自引:0,他引:1  
徐袭  祝力  范学鑫 《微计算机信息》2007,23(15):141-143
针对连续数据故障诊断知识挖掘,提出了一种将粗糙集理论与K-均值聚类算法相结合的故障诊断知识挖掘方法。该方法在提取设备状态参数数据的基础上,应用K-均值聚类算法将各状态参数下的连续数据离散化为有限类别,再应用粗糙集对所获得的离散数据表进行约简,获得由状态数据出发的故障诊断知识表格。应用于柴油机故障诊断数据知识挖掘,可以快速准确地获得故障诊断知识,方法简单易用。  相似文献   

15.
为提高故障诊断模式分类的实时性和准确性,采用阈值化类内距离的方法,研究了一种新型SFCM聚类算法,数据验证了此算法较传统FCM算法在收敛速度和聚类精度方面的较好表现,以机载武器控制系统信息通道为诊断对象,采用该方法对通道进行了样本无监督分类验证和故障模式识别诊断试验,结果表明新型的SFCM聚类算法能对信息通道故障模式进行正确的分类识别。  相似文献   

16.
数据挖掘技术能够从大量、不完全、有噪声、模糊、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的本质的规律。为了有效地发现旋转机械故障诊断过程中的故障征兆知识,引入数据挖掘技术和方法。针对旋转机械,构建了基于重复增量修枝算法RIPPER(Repeated Incremental Pruning to Produce Error Reduction)的故障诊断知识获取系统。通过收集故障现象并整理成由故障征兆、故障类型等组成的故障信息样本,应用RIPPER算法对故障进行分析得到故障诊断规则集文件,实现故障诊断系统知识的获取和自动更新,并能对旋转机械的常见故障进行诊断,验证了算法的合理性。  相似文献   

17.
随着智能电网建设的发展,传统的基于检测技术的配电低电压原因诊断已变成基于数据挖掘的电力大数据分类技术,而着眼于低电压故障原因的数据分类研究在国内尚处于起步阶段,为此该文提出一种采用改进聚类算法和支持向量机分类算法的配电网低电压诊断模型。该模型首先采用Canopy-Kmeans的聚类算法基于配电网历史运行数据进行低电压原因的聚类分析并得出可能存在的低电压原因,然后采用经粒子群算法对支持向量机数据分类算法进行参数优化,最后使用结果参数优化的支持向量机算法对智能电表所采集的配电网实时运行数据进行低电压原因分类并最终输出低压故障原因的诊断结果。实验表明,采样基于粒子群优化的支持向量机诊断模型能够实现90%的低电压原因诊断准确度。  相似文献   

18.
In the construction of a smart marine, marine big data mining has a significant impact on the growing maritime industry in the Beibu Gulf. Clustering is the key technology of marine big data mining, but the conventional clustering algorithm cannot achieve the efficient clustering of marine data. According to the characteristics of marine big data, a marine big data clustering scheme based on self-organizing neural network (SOM) algorithm is proposed. First, the working principle of SOM algorithm is analyzed, and the algorithm's two-dimensional network model, similarity model and competitive learning model are focused. Secondly, combining with the working principle of algorithm, the marine big data clustering process and algorithm achievement based on SOM algorithm are developed; finally, experiments show that all vectors in marine big data clustering are stable, and the neurons in the output layer of clustering result have obvious consistency with the data itself, which shows the effectiveness of SOM algorithm in marine big data clustering.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号