首页 | 本学科首页   官方微博 | 高级检索  
     

统计监控建模离群点检测数据预处理高效算法
引用本文:肖应旺,杨军,张承忠,杜瑛.统计监控建模离群点检测数据预处理高效算法[J].仪器仪表学报,2012,33(12).
作者姓名:肖应旺  杨军  张承忠  杜瑛
作者单位:华南师范大学南海校区信息工程与技术系 佛山528225
基金项目:国家自然科学基金,广东省自然科学基金
摘    要:基于多向主元分析(multi-way principal component analysis,MPCA)(包括主元分析(principal component analysis,PCA))的统计监控模型易受建模数据中离群点影响,将数据点的k-最近邻(k-nearest neighbor,k-NN)距离dk作为离群度指标能有效地发现非线性数据集中的离群点,但现有的基于该定义的鲁棒离群点检测算法对不同尺度的中心化和标准化方法非常敏感,且需要计算每个数据点的dk,引起巨大的计算开销.提出一种改进尺度的近邻修剪(modified scale neighborhood pruning,MSNHP)高效鲁棒离群点检测算法用于对统计监控建模数据集的预处理.该算法利用改进尺度得到离线建模正常数据的均值和标准差,并对数据进行中心化和标准化处理;在每次dk查询过程中计算出其他点的dk上界用于直接修剪非离群点,以减少dk查询的次数;并通过优化搜索次序提高修剪效果和减少每次dk查询的计算开销.将该算法应用于β-甘露聚糖酶发酵间歇过程离群点检测,与其他鲁棒离群点检测算法相比,应用结果表明该算法明显减少了计算开销,对数据集数据个数和算法参数都具有更好的伸缩性.

关 键 词:改进尺度的近邻修剪  高效鲁棒离群点检测  统计监控建模  数据预处理

Outlier detection data high performance preprocessing algorithm of statistical monitoring modeling
Xiao Yingwang , Yang Jun , Zhang Chengzhong , Du Ying.Outlier detection data high performance preprocessing algorithm of statistical monitoring modeling[J].Chinese Journal of Scientific Instrument,2012,33(12).
Authors:Xiao Yingwang  Yang Jun  Zhang Chengzhong  Du Ying
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号