首页 | 本学科首页   官方微博 | 高级检索  
     

基于SAX方法的时间序列分类问题的多阶段改进研究
引用本文:宋伟,张帆,叶阳东,韩鹏,范明.基于SAX方法的时间序列分类问题的多阶段改进研究[J].计算机工程与科学,2016,38(5):988-996.
作者姓名:宋伟  张帆  叶阳东  韩鹏  范明
作者单位:;1.郑州大学信息工程学院;2.华北水利水电大学信息工程学院;3.河南省国家税务局
基金项目:国家自然科学基金(61170223);河南省基础与前沿技术研究计划(142300410229);河南省教育厅科学技术研究重点项目(13A520453)
摘    要:分类问题是数据挖掘中的基本问题之一,时间序列的特征表示及相似性度量是时间序列数据挖掘中分类、聚类及模式发现等任务的基础。SAX方法是一种典型的时间序列符号化表示方法,在采用该方法的基础上对时间序列进行分类,不仅可以有效地降维、降噪,而且具有简单、直观等特点,但是该方法有可能造成信息损失并影响到分类结果的准确性。为了弥补信息损失对分类结果的影响,采用了集成学习中大多数投票方法来弥补BOP表示后的信息损失,从而提高整个分类器的效率。针对一些样本在BOP表示中都损失了相似的重要信息,以至于大多数投票无法进一步提高分类效率的问题,进一步提出了结合集成学习中AdaBoost算法,通过对训练样本权重的调整,从而达到以提高分类器性能来弥补信息损失的效果。实验结果表明,将BOP方法与集成学习相结合的方法框架,不仅能很好地处理SAX符号化表示中的信息损失问题,而且与已有方法相比,在分类准确度方面也有显著的提高。

关 键 词:时间序列  SAX  分类  集成学习  多阶段
收稿时间:2015-11-26
修稿时间:2016-05-25

A multi phased improvement for time series classification based on symbolic aggregation approximation representation
SONG Wei,ZHANG Fan,YE Yang dong,HAN Peng,FAN Ming.A multi phased improvement for time series classification based on symbolic aggregation approximation representation[J].Computer Engineering & Science,2016,38(5):988-996.
Authors:SONG Wei  ZHANG Fan  YE Yang dong  HAN Peng  FAN Ming
Affiliation:(1.School of Information Engineering,Zhengzhou University,Zhengzhou 450001; 2.School of Information Engineering,North China University of Water Resources and Electric Power,Zhengzhou 450045; 3.State Administration of Taxation,Henan Provincial Office,Zhengzhou 450000,China)
Abstract:Classification is one of the basic tasks in data mining, and feature representation and similarity measurement act as the important basis of time series data mining. The symbolic aggregate approximation (SAX) is a typical symbolic representation method which is straight forward and very simple, and which can efficiently converts time series data to a symbolic representation with dimensionality/ noise reduction. But the potential of information loss can affect the accuracy of the classification results. Focusing on the SAX discretization method coupled with the bag of patterns (BOP) representation in classification task, we propose a multi phased approach framework using the AdaBoost algorithm and voting in ensemble learning to remedy the information loss of the SAX representation. Experimental results show that the proposed method can improve classification accuracy greatly.
Keywords:time series  SAX  classification  ensemble learning  multi phased  
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号