首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
提出了基于主成分分析(Principal Component Analysis,PCA)的K近邻(K Nearest Neighbor,KNN)分类原理,并将其应用于胎心率与宫缩描记图分类。主要思想是:对训练样本和测试样本进行降维,并对降维后的测试样本使用KNN分类技术分类。选择2 120组胎心率与宫缩描记图数据,使用该方法进行分类测试。实验结果表明,使用该类模型,分类结果稳定,分类准确率高,并且能够降低高维空间搜索K近邻的复杂性,减轻计算负担。  相似文献   

2.
为实现对高维混合、不平衡信贷数据中的不良贷款者的准确预测,从降维预处理和分类算法两方面进行优化,提出一种基于混合数据主成分分析(Principal Component Analysis of Mixed Data,PCAmix)预处理的单类[K]近邻[(K]-Nearest Neighbor,[KNN)]计算均值算法。针对传统的主成分分析(Principal Component Analysis,PCA)不能直接处理定性变量的问题,使用PCAmix降维预处理数据,为规避不平衡数据在二分类模型中性能较差的缺点,采用单类分类和[K]近邻算法邻居计算的思想,仅采用多数类训练模型。利用Bootstrap方法找到最佳的决策边界,使得正负样本最大限度地分离,最终准确预测客户的违约风险。采用UCI数据库中的German和Default个人信用评分数据集进行验证,实验结果表明该算法在处理高维混合、不平衡的信贷数据上具有较好的分类效果。  相似文献   

3.
工业过程数据变量呈现非线性、非高斯性与变量之间分布不均等问题。针对数据变量分布不均等问题,提出利用高斯混合模型GMM(Gaussian mixture model),将马氏距离(Mahalanobis distance)与kNN(k nearest neighbors)相结合的故障检测方法,即:基于GMM的马氏距离kNN故障检测方法(GMM—MDkNN)。首先利用高斯混合模型GMM将训练样本数据分为K类,然后利用相应数据类的变量协方差信息计算样本间的马氏距离,得到样本的k近邻样本马氏距离和,并将其作为故障检测的指标。将此方法应用到TE连续工业过程监测实例中,结果表明了该方法的有效性。  相似文献   

4.
KNN算法是数据挖掘技术中比较常用的分类算法。但是,当样本容量较大以及特征属性较多时,KNN算法分类精度和效率将大大降低。该文将主分量分析(PCA)与粗糙集理论(RS)应用于样本特征提取中,首先采用PCA对输入向量进行甄别,应用粗糙集理论约简与分类无关或关系不大的向量。然后利用模拟退火算法实现随机属性子集选择,组合K近邻分类器,最后利用简单投票方法,对多重K近邻分类器进行组合输出,有效地改进了K近邻法的分类精度和效率。  相似文献   

5.
张成  郭青秀  冯立伟  李元 《计算机应用》2018,38(9):2730-2734
针对工业过程的动态和多模态特性,提出一种基于局部近邻标准化(LNS)和动态主元分析(DPCA)相结合的故障检测方法(LNS-DPCA)。首先,在训练数据集中寻找样本的K近邻集;然后,应用K近邻集的均值与标准差对当前样本进行标准化处理;最后,在新的数据集中应用DPCA方法确定T2和SPE控制限进行故障检测。LNS方法能够消除过程的多模态特征,使得标准化后数据近似服从多元高斯分布,且保持过程离群点偏离正常样本轨迹;而结合DPCA方法则能够提高对具有动态特性过程的监视性能。利用数值例子和青霉素发酵过程进行仿真,并将测试结果与主元分析法(PCA)、DPCA、K近邻故障检测(FD-KNN)等方法进行对比分析,验证了LNS-DPCA方法的有效性。  相似文献   

6.
基于GMM的多工况过程监测方法   总被引:1,自引:0,他引:1  
传统基于主元分析的故障检测方法大多假设工业过程只运行在1个稳定工况,数据服从单一的高斯分布。若这些方法直接用于多工况过程则将会产生大量的误检。为此,本文提出了1种基于高斯混合模型的多工况过程监测方法。首先利用PCA变换对过程数据集进行降维,在主元空间建立高斯混合模型对过程数据进行聚类,自动获取工况数和相关分布特性。然后对每个工况建立主元分析(principal component analysis,PCA)模型来描述整个运行过程数据分布的统计特性。最后在过程监测中,根据监测样本属于各个工况的概率构造综合统计量,实现对多工况过程的故障检测。TE过程的仿真结果表明,本文提出的方法与传统的PCA方法相比,能自动获取工况和精确估计各个工况的统计特性,从而能更准确及时地检测出多工况过程的各种故障。  相似文献   

7.
半导体生产过程是典型的间歇过程,针对其过程数据的多模态、多阶段、模态结构不同和批次不等长等特点,提出了基于统计模量的局部近邻标准化和k近邻相结合的故障检测方法(SP-LNS-kNN)。首先计算样本的统计模量,其次对样本的统计模量使用其局部K近邻集进行标准化,最后计算样本与其前k近邻距离,得到平均累积距离D作为检测指标,进而对工业过程故障进行在线检测。统计模量保留了数据的主要信息,将二维样本数据简化为一维数据。局部近邻标准化可以有效降低中心漂移、模态结构差异明显的影响。SP-LNS-kNN不仅能够对大故障实现检测,并且能够提高对小模态的微弱故障的检测能力。使用SP-LNS-kNN对一个实际半导体生产过程数据进行故障检测实验,并将实验结果与PCA、kPCA、LOF和FD-kNN方法的结果进行对比分析,验证了本文方法的有效性。  相似文献   

8.
针对复杂工业过程混合分布的问题,提出了鲁棒ICA-PCA(Independent Component Analysis-Principal Component Analysis, ICA-PCA)的故障诊断的新方法。由于实际工业过程数据不可避免的带有大量干扰,为降低数据粗差的影响,首先采用小波去噪算法提高建模数据质量,然后利用鲁棒ICA-PCA算法提取过程的非高斯和高斯信息,并构建了三个统计量进行故障的监控。最后把上述方法应用到田纳西-伊斯曼(Tennessee Eastman,TE)化工过程。仿真结果表明,相比于传统PCA算法、ICA-PCA等算法,鲁棒ICA-PCA方法能够有效的检测故障的发生,该方法具有较好的鲁棒性和灵敏性。  相似文献   

9.
对于复杂的工业过程,采集到的过程数据能反映出生产过程的内在变化和运行状况。本文提出一种新的多变量统计过程监测策略,数据建模过程包含主元分析(Principal Component Aanlysis,PCA)与正交局部保持投影(Orthogonal Locality PreservingProjection,OLPP)两步。首先利用PCA在不丢失任何信息的前提下将原始数据旋转成不相关的潜变量,然后再作OLPP以提取能表征过程正常数据内在局部近邻结构的特征用于故障检测。利用T~2和SPE(或Q)统计量以及核密度估计方法确定的控制限进行化工过程的在线监测,TE过程仿真实验验证了该混合方法的有效性和优越性。  相似文献   

10.
针对多模态间歇过程存在数据维度高且方差差异较大的特征,提出一种基于局部保持嵌入–K近邻比率密度(NPE–KRD)规则的故障检测方法.首先,利用局部保持嵌入(NPE)方法将原始的高维数据投影到低维空间;其次,在低维空间通过计算样本的密度及其前K近邻密度的均值来建立K近邻比率密度(KRD);最后,根据核密度估计法确定统计量控制限并进行故障诊断. NPE方法既能够在低维空间保持数据局部近邻结构,又能够降低故障检测过程的计算复杂度.通过引入比率密度, NPE–KRD可以降低多模态方差结构差异对故障检测的影响,提高过程故障检测率.通过数值例子和半导体工业过程的仿真实验,并与主元分析、K近邻、局部保持嵌入等方法进行比较,验证了本文方法的有效性.  相似文献   

11.
12.
交通流数据分析是交通规划、控制、管理等工作实施的基础。交通流数据异常会给交通状态辨识及交通管理和控制带来困扰,不利于交通领域各方面研究及工作的开展。因此,对异常数据进行修复具有必要性。为了提高交通流异常数据修复精度,进一步改善交通数据质量,构建了基于改进K近邻(K-Nearest Neighbor,KNN)算法的交通流异常数据修复模型。通过对KNN基础模型中k值和状态向量进行优选、提出距离占比的近邻值权重选取方式,实现对其模型的改进。为了验证模型的有效性,采用实测交通流数据进行实验分析。实验结果表明,改进的KNN数据修复模型具有更高的修复精度,其平均相对误差为9.88%,能够有效改善数据质量,为智能交通控制体系提供基础数据支持。  相似文献   

13.
王健  韩志艳 《微机发展》2013,(6):79-81,85
在故障诊断过程中,传统的主元分析(Principal Component Analysis,PCA)算法,假设建模使用的历史数据为正常模式下采集的纯净数据,而在工业现场这一假设难以满足。针对传统PCA算法的这一缺陷,文中提出一种鲁棒PCA算法。该算法利用流形学习的思想,通过构造数据间近邻图的方式,计算各数据点的能量密度函数,并以此为依据去除历史数据中混杂的噪声和故障数据,增强PCA算法的鲁棒性。同时在文中给出了鲁棒PCA算法在故障诊断中的应用步骤,并通过对Tennessee Eastman过程的仿真研究,验证了鲁棒PCA算法在故障诊断中的可行性和有效性。  相似文献   

14.
k近邻故障检测(fault detection based on k nearest neighbors,FD–k NN)方法能够提高具有非线性和多模态特征过程的故障检测率.由于系统故障通常由潜隐变量异常变化引起,而该类型故障并不能被观测数据直观表现,因此直接在观测变量上执行FD–k NN方法,其故障检测率降低.本文旨在提高FD–k NN方法针对潜隐变量故障的检测能力,提出基于独立元的k近邻故障检测方法.首先,通过对观测数据应用独立元分析(independent component analysis,ICA)方法,获得独立元矩阵;接下来在独立元矩阵中应用FD–k NN方法进行故障检测.这等同于直接监控过程潜隐变量的变化,可以提高过程故障检测率.通过非线性实例仿真实验,证明本文方法检测潜隐变量故障是有效的;同时,在半导体蚀刻工艺过程的仿真实验中,与主元分析(principal component analysis,PCA)方法、核主元分析(kernel principal component analysis,KPCA)方法、基于主元分析的k近邻故障检测(principal component–based k nearest neighbor rule for fault detection,PC–k NN)方法和FD–k NN方法进行对比,实验结果进一步验证了本文方法的有效性.  相似文献   

15.
邱强 《数字社区&智能家居》2014,(12):2825-2827,2844
针对传统K-近邻(K-Nearest Neighbor,K-NN)分类方法不能高校处理大规模训练数据的分类问题,该文提出一种并行的改进K-NN(Improved Parallel K-Nearest Neighbor,IPK-NN)分类方法。该方法首先将大规模训练样本随机划分为多个独立同分布的工作集,对于任意一个新来的待检测样本,在每个工作集上采用标准K-NN方法对该样本进行标记,然后综合各训练集的标记结果,得到该样本的最终标记。实验结果表明,在大规模数据集的分类问题中,IPK-NN方法能够在保持较高分类精度的同时提高模型的学习效率。  相似文献   

16.
由于基于主元分析(Principal Component Analysis,PCA)的统计监控方法没有利用过程机理模型(First Principle Model)信息,因此在一定程度上限制了其故障诊断能力的发展。本文基于PCA的框架,采用故障子空间对故障进行描述,在PCA监测模型的基础之上,分析了主元空间和残差空间的故障可检测性问题,获得了故障可检测性的必要充分理论条件。通过对双效蒸发过程的仿真监测,证实了所获理论结果的有效性,表明了通过计算临界故障幅值就可事先对故障集内各故障的检测结果作定量的分析,从而事先了解各故障在PCA下的检测结果。  相似文献   

17.
传统光伏发电功率预测存在因气象因素特征提取不综合不精确而导致预测精度不高的问题. 为了充分挖掘气象因素对光伏出力的影响, 并有效利用深度学习技术在非线性拟合方面的优势, 本文提出了一种基于气象因素充分挖掘的双向长短期记忆(Bi-directional Long Short Term Memory, BiLSTM)网络光伏发电短期功率预测方法. 在对原始数据进行异常值及标准化处理的基础上, 采用K近邻算法(K-Nearest Neighbor, KNN)在外界温度、湿度、压强等诸多气象因素中充分挖掘影响光伏出力的关键因素, 重构多元数据序列, 并在探索输入层时间步长、模型层数及每层维数等超参数的合理设置方案的基础上, 构建BiLSTM网络模型, 实现光伏发电短期功率的高精度预测. 仿真结果表明, 与KNN、深度信念网络(DBN)、BiLSTM、PCA-LSTM等经典方法比较, 所提KNN-BiLSTM方法具有更高的预测精度.  相似文献   

18.
提出一种基于邻域保持嵌和标准距离K近邻(neighborhood preserving embedding-standard distance k nearest neighbor rule, NPE-SDKNN)的故障检测方法来解决非线性和多模态问题。首先,使用邻域保持嵌入方法提取数据中的流形结构,对数据进行降维;其次,在低维空间计算每个样本的标准距离,将各模态间的数据调整到同一尺度;最后使用标准距离的统计量对故障进行检测。邻域保持嵌入能够解决非线性问题和降低计算复杂度,标准距离K近邻通过用标准距离替代原始距离,消除了数据的多模态特征,使用NPE-SDKNN方法进行故障检测,能够提高多模态数据的故障检测率。在田纳西伊斯曼过程运用NPE-SDKNN方法,结果表明,相对于K近邻、主元分析、邻域保持嵌入、标准距离K近邻方法,NPE-SDKNN具有更高的故障检测率。  相似文献   

19.
基于主元分析(PCA)的统计过程控制方法通常假设数据的生成过程是独立同分布的.当数据存在多模态结构或过程变量非线性相关时, PCA方法的故障检测性能将受到影响.针对上述问题,本文提出一种基于PCA得分重构差分的故障检测策略.首先,应用PCA将输入空间分解为主元子空间和残差子空间;接下来,应用k近邻(k NN)规则重构当前样本得分向量并计算样本的得分重构差分向量;最后,计算得分重构差分向量的统计值并进行故障检测.本文方法不仅可以降低数据多模态和变量非线性相关等特征对过程故障检测的影响,同时可以降低统计量的自相关性、提高过程故障检测率.将本文方法在两个模拟例子和田纳西–伊斯曼(TE)过程中进行测试,并与PCA、核主元分析(KPCA)、动态主元分析(DPCA)和k最近邻故障检测(FD–k NN)方法进行对比分析,测试结果证明了本文方法的有效性.  相似文献   

20.
针对现有的基于WiFi的位置指纹定位方法精度低、计算复杂度高的问题,提出了一种基于 CSI和RSSI的混合位置指纹定位方法MixedFi(A Mixed Fingerprint Localization Based on CSI and RSSI)。该方法在离线阶段结合了传统的接收信号强度RSSI(Received Signal Strength Indication)与细粒度的信道状态信息CSI(Channel State Information)并将其作为原始位置指纹,有效利用各个接入点AP(Access Point)的信号特征信息,在线阶段引入空间聚类划分的思想对RSSI指纹地图进行合理划分,降低指纹空间的搜索时间。再通过主成分分析法PCA(Principal Component Analysis)提取CSI指纹特征,最后利用Kendall阶次相关系数自主选择近邻进行加权估计得到最终节点定位结果,解决了传统K近邻KNN(K Nearest Neighbors)方法定位精度低的问题。实验表明,与现有的基于单一指纹的定位方法相比,本文提出的方法有效降低了计算的复杂度?提高了定位精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号