首页 | 本学科首页   官方微博 | 高级检索  
     

基于方差聚类的时序数据野值识别算法
引用本文:史椸,赵静,鲍军鹏,齐勇,林秦颖.基于方差聚类的时序数据野值识别算法[J].计算机应用,2012,32(Z2):22-25.
作者姓名:史椸  赵静  鲍军鹏  齐勇  林秦颖
作者单位:1. 西安交通大学电子与信息工程学院,西安,710049
2. 空军工程大学工程学院,西安,710051
摘    要:时序数据中的野值会直接影响数据挖掘算法的结果,甚至造成算法失效。传统的基于密度的带有噪声的空间聚类(DBSCAN)算法可以用来识别野值,但是却存在算法对参数敏感、时间复杂度高、精度不高等问题。针对时序数据的特点,提出了一种可自动进行多次识别的基于方差聚类的野值识别算法。该方法通过将传统的邻域密度转换为方差和均值、将密度阈值转换为时间窗口内的方差和阈值,在定义野值数据、野簇数据和异常簇数据的基础上,给出野值识别方法的判断规则。同时,针对一次野值识别不能将全部野值剔除的问题,通过定义多次野值识别的结束条件将算法扩展为多次野值识别算法。通过在某航天数据挖掘项目中的应用,验证了该算法具有较好的通用性、低的时间复杂度、可进行多次识别以提高精度等特点。

关 键 词:时序数据  野值识别  聚类挖掘  DBSCAN算法

Variance clustering based outlier identification algorithm for time series data
SHI Yi , ZHAO Jing , BAO Jun-peng , QI Yong , LIN Qin-ying.Variance clustering based outlier identification algorithm for time series data[J].journal of Computer Applications,2012,32(Z2):22-25.
Authors:SHI Yi  ZHAO Jing  BAO Jun-peng  QI Yong  LIN Qin-ying
Affiliation:1.School of Electronic and Information Engineering,Xi’an Jiaotong University,Xi’an Shaanxi 710049,China; 2.School of Engineering,Air Force Engineering University,Xi’an Shaanxi 710051,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号