首页 | 本学科首页   官方微博 | 高级检索  
     

RQIC:一种高效时序相似搜索算法
引用本文:蒋涛,冯玉才,朱虹,李国徽.RQIC:一种高效时序相似搜索算法[J].计算机研究与发展,2009,46(5).
作者姓名:蒋涛  冯玉才  朱虹  李国徽
作者单位:华中科技大学计算机科学与技术学院,武汉,430074
基金项目:国家高技术研究发展计划(863计划) 
摘    要:索引大规模时序数据库是高效时序搜索中的关键问题.提出了一种新颖的索引方案RQI, 它包括3种过滤策略: 即first-k过滤、索引低边界和上边界以及三角不等式修剪.基本的思想为首先运用Haar小波变换计算每个时序的小波系数,利用前面的k个小波系数形成一个最小边界矩阵,以利用点过滤方法;然后将预先计算每个时序的低边界特征和上边界特征存放到索引当中;最后采用三角不等式来修剪不相似的序列并确保没有漏报.同时提出了一种新的低边界距离函数SLBS和聚类算法CSA.通过CSA可保持索引良好的聚类特征以提高点过滤方法的效率,从而引入了一种更好的算法RQIC.在合成数据集和实时数据集的大量对比实验表明,RQIC是有效的且具备较高的查询效率.

关 键 词:数据挖掘  算法  索引  聚类  时间序列  相似搜索

RQIC:An Efficient Similarity Searching Algorithm on Time Series
Jiang Tao,Feng Yucai,Zhu Hong,Li Guohui.RQIC:An Efficient Similarity Searching Algorithm on Time Series[J].Journal of Computer Research and Development,2009,46(5).
Authors:Jiang Tao  Feng Yucai  Zhu Hong  Li Guohui
Affiliation:College of Computer Science & Technology;Huazhong University of Science and Technology;Wuhan 430074
Abstract:Indexing large time series databases is crucial for efficient search of time series queries.An index scheme RQI(range query based on index) is introduced,which includes three filtering methods:first-k filtering,indexing lower bounding and upper bounding as well as triangle inequality pruning.The basic idea is calculating wavelet coefficients for each time series based on Haar wavelet transform.The first k coefficients are used to form a MBR(minimal bounding rectangle).Thus,the point filtering method can be ...
Keywords:data mining  algorithm  indexing  clustering  time series  similarity search  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号