首页 | 本学科首页   官方微博 | 高级检索  
 共查询到15条相似文献,搜索用时 46 毫秒
基于聚类和距离的大数据集离群点检测算法   总被引:1,自引:0,他引:1  
针对已有的基于距离的离群点检测算法在大数据集上扩展性差的问题,提出了基于聚类和距离混合的大数据集离群检测算法.算法第一阶段采用层次聚类和k-means混合的层次k-means算法对数据进行聚类,并按照一个启发式规则对其进行排序.第二阶段在聚类的结果上采用嵌套循环算法进行离群检测,并通过两个剪枝规则进行高效舅枝,减少了离群检测时数据点之间距离计算的次数.理论分析和实验结果证明了算法的可行性和效率.  相似文献   

以多元统计分析技术为核心的间歇过程建模、在线监测逐渐成为过程工业的关注焦点,然而过程数据中存在的大量离群点将直接影响上述方法的可靠性,为此提出了一种基于鲁棒M估计的间歇过程离群点检测方法.该方法首先通过积分方程离散化将模型参数估计问题转化为最小二乘优化问题;分别利用Tikhonov正则化方法及鲁棒M估计消除噪声和离群点对模型参数估计的影响;最后通过分析各个样本点的权值,实现过程数据的离群点检测.将所提出的方法应用于半间歇反应过程,实验结果验证了方法的可行性与有效性.  相似文献   

针对现有的局部离群点检测算法对数据对象不加分区,致使计算复杂度高的问题,提出了一种基于偏离的局部离群点检测算法.该算法首先对数据集进行分区,将可能存在的局部离群点与其紧邻的簇划分到一个数据块中,然后在每个数据块内,根据离散系数刻画各个数据对象的偏离度,从而求得每个数据对象在其所属的数据块内的局部偏离因子,发现可能存在的局部离群点.理论分析和实验结果表明,该算法具有良好的识别局部离群点的能力,检测的准确率和时间效率均优于经典的LOF算法.  相似文献   

点云数据的曲面建模是反求建模的核心技术之一。针对三坐标测量的点云数据,利用VC强大的数据处理能力和UG出色的曲面造型功能,开发了基于UG/Open API的曲面造型插件。该插件集中了数据预处理功能和曲线曲面建模功能,数据预处理主要包括噪声处理、曲面扩展及数据平滑。经验证,该方法建模速度快、精度高、适应性好。  相似文献   

点云数据的曲面建模是反求建模的核心技术之一。针对三坐标测量的点云数据,利用VC强大的数据处理能力和UG出色的曲面造型功能,开发了基于UG/OpenAPI的曲面造型插件。该插件集中了数据预处理功能和曲线曲面建模功能,数据预处理主要包括噪声处理、曲面扩展及数据平滑。经验证,该方法建模速度快、精度高、适应性好。  相似文献   

针对累积互信息方法存在的最佳聚类子空间选择不稳定和计算复杂的问题,给出累积熵的链式法则、累积全相关、累积全熵的计算方法,采用累积全熵在连续数据集上挖掘最佳聚类子空间,并在最佳聚类子空间中进行离群点挖掘,提出基于累积全熵的子空间聚类离群点检测算法。分别在真实数据集和虚拟数据集上验证了所提算法的有效性和可伸缩性。实验表明,所提算法进一步提高了子空间离群点的挖掘效率。  相似文献   

基于模糊自回归隐马尔可夫模型的控制过程异常数据检测   总被引:2,自引:2,他引:0  
在工业过程控制系统中,利用智能方法建立被控对象模型已经受到越来越多的关注。模型的准确与否对于控制器的设计以及控制的准确性至关重要,而准确的建模数据是建立准确被控对象模型的必要条件。本文针对控制过程对于建模数据异常定义的特殊性,提出一种适合于控制过程建模数据异常检测的方法:基于模糊自回归隐马尔可夫模型(ARHMM)的控制过程异常数据检测方法。该方法分别通过三部分检测将数据分成正确数据集和异常数据集,并确定正确数据集的隶属度函数,最后根据三个集合的隶属度函数来判断数据是否异常。针对控制过程数据量大,实时性强等特点,模糊ARHMM采用在线更新参数的办法,保证了该方法能够适用于控制过程的数据检测及建模的要求。试验结果和实际应用表明,基于模糊ARHMM的异常数据检测方法具有很好检测效果和实际应用价值。  相似文献   

This paper proposes a novel B-spline interpolation based on CL points preprocessing algorithm and on u-S modeling, aiming to overcome the shortages of linear and circular interpolations. A B-spline toolpath trajectory is generated by fitting a given set of CL points. CL points are preprocessed by chord distance to reduce computation load, thus using fewer feature CL points to generate a B-spline toolpath trajectory. As for disadvantages due to parameter updating for B-spline interpolation, a fifth order polynomial based on u-S modeling is constructed to map the desired curve length S to the corresponding spline parameter u, cutting the real-time computation load. Simulation results are provided to verify the feasibility and effectiveness of the proposed interpolation algorithm.  相似文献   

导管三维快速建模及模型预处理技术研究   总被引:2,自引:0,他引:2  
导管设计制造之间主要采用模拟量实样进行传递,严重影响信息传递精度和效率,本文基于CAA-RADE研究开发了导管三维快速建模与模型预处理系统,实现了导管零件的快速设计及特征参数的快速提取,可以极大的提高导管的设计速度、信息传递精度和效率,进而提高导管零件的成形质量和设计制造效率。本文的研究对导管的设计制造有较大的工程应用价值,对推进导管设计制造的全数字化有重要意义。  相似文献   

Using the expected detection delay (EDD) index to measure the performance of multivariate statistical process monitoring (MSPM) methods for constant additive faults have been recently developed. This paper, based on a statistical investigation of the T2- and Q-test statistics, extends the EDD index to the multiplicative and drift fault cases. As well, it is used to assess the performance of common MSPM methods that adopt these two test statistics. Based on how to use the measurement space, these methods can be divided into two groups, those which consider the complete measurement space, for example, principal component analysis-based methods, and those which only consider some subspace that reflects changes in key performance indicators, such as partial least squares-based methods. Furthermore, a generic form for them to use T2- and Q-test statistics are given. With the extended EDD index, the performance of these methods to detect drift and multiplicative faults is assessed using both numerical simulations and the Tennessee Eastman process.  相似文献   


For analyzing the statistical performance of physical systems, statistical characteristics of physical parameters such as material properties need to be estimated by collecting experimental data. For accurate statistical modeling, many such experiments may be required, but data are usually quite limited owing to the cost and time constraints of experiments. In this study, a new method for determining a reasonable number of experimental data is proposed using an area metric, after obtaining statistical models using the information on the underlying distribution, the Sequential statistical modeling (SSM) approach, and the Kernel density estimation (KDE) approach. The area metric is used as a convergence criterion to determine the necessary and sufficient number of experimental data to be acquired. The proposed method is validated in simulations, using different statistical modeling methods, different true models, and different convergence criteria. An example data set with 29 data describing the fatigue strength coefficient of SAE 950X is used for demonstrating the performance of the obtained statistical models that use a pre-determined number of experimental data in predicting the probability of failure for a target fatigue life.


雷电监测系统可以实时监测雷电区域并给出雷电定位信息。文章介绍了雷电监测系统技术的发展状况,主要对系统雷电定位技术进行了阐述和分析,并对雷电监测系统的探测性能动态试验方法进行了探讨研究。  相似文献   

基于50%交叠的均匀数字信道化结构,提出了一种快速高效的数字信道化硬件实现结构和相应的信道检测方案。该结构采用滤波器组排列方式为奇型和偶型的两路并行信道化,利用二者在频带划分时存在的频带互补特性,并结合信号的实际带宽,制定奇/偶信道化的联合检测机制,不仅能够有效的克服信道化检测中遇到的"跨道"现象并且能较好的处理滤波器组交叠设计对检测有效性降低的问题。  相似文献   

结合DSP并行处理的结构特征,研究了常见的数字图像预处理算法的共同特点。以及预处理算法的C语言级代码优化方法,包括设置编译选项、循环展开、减少循环嵌套、使用内联函数、使用关键字等。并对应用各种优化技术后的代码执行效率进行对比分析,结果表明优化后的代码执行效率有明显提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号