首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进前缀树PStree的最大序列模式挖掘
引用本文:任家东,解玉洁,何海涛,张爱国. 基于改进前缀树PStree的最大序列模式挖掘[J]. 计算机研究与发展, 2010, 47(Z1)
作者姓名:任家东  解玉洁  何海涛  张爱国
作者单位:1. 燕山大学信息科学与工程学院,河北秦皇岛,066004;北京理工大学计算机科学与技术学院,北京,100081
2. 燕山大学信息科学与工程学院,河北秦皇岛,066004
基金项目:河北省自然科学基金项目 
摘    要:对现有最大序列模式挖掘算法候选序列模式过多以及可扩展性差的缺点,提出了一种基于序列匹配的最大序列模式挖掘算法CSMS(compare sequence finding maximal sequential pattern).算法首先为所有频繁1序列构建位置信息表;然后利用纵向、横向结合搜索位置信息表的序列扩展匹配方法找到潜在最大序列模式;在进行序列匹配扩展的同时,把每个找到的潜在最大序列模式存储在改进的前缀树PStree(prefix sequential pattern tree)中,树中每个结点链接到索引Hash表,Hash表中保存了结点的位置信息,对于那些重复的序列可以直接从Hash表中找到其位置信息;最后通过对前缀树PStree进行剪枝,得到由最大序列模式组成的前缀树MPStree(maximal sequential pattern tree).实验结果表明算法CSMS具有较好的时间效率和扩展性.

关 键 词:最大序列模式  位置信息  序列匹配

Mining of the Maximal Sequential Pattern Based on Improved Prefix Tree PStree
Ren Jiadong,Xie Yujie,He Haitao,Zhang Aiguo. Mining of the Maximal Sequential Pattern Based on Improved Prefix Tree PStree[J]. Journal of Computer Research and Development, 2010, 47(Z1)
Authors:Ren Jiadong  Xie Yujie  He Haitao  Zhang Aiguo
Abstract:
Keywords:PStree
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号