首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于大项集重用的序列模式挖掘算法
引用本文:宋世杰,胡华平,周嘉伟,金士尧.一种基于大项集重用的序列模式挖掘算法[J].计算机研究与发展,2006,43(1):68-74.
作者姓名:宋世杰  胡华平  周嘉伟  金士尧
作者单位:国防科学技术大学计算机学院,长沙,410073
基金项目:中国科学院资助项目;国家科技攻关项目
摘    要:在重新定义序列模式的长度、增加了序列模式的挖掘粒度的基础上,提出一种基于大项集重用的序列模式挖掘算法HVSM.该算法采用垂直位图法表示数据库,先横向扩展项集,将挖掘出的所有大项集组成一大序列项集,再纵向扩展序列,将每个一大序列项集作为“集成块”,在挖掘k大序列时重用大项集.并以兄弟节点为种子生成候选大序列,利用1st—TID对支持度进行计数.实验表明,对于大规模事务数据库,该算法有效地提高了挖掘效率.

关 键 词:序列模式挖掘  位图表示法  项集扩展  序列扩展
收稿时间:07 1 2004 12:00AM
修稿时间:2004-07-012005-05-16

A Sequential Pattern Mining Algorithm Based on Large-Itemset Reuse
Song Shijie,Hu Huaping,Zhou Jiawei,Jin Shiyao.A Sequential Pattern Mining Algorithm Based on Large-Itemset Reuse[J].Journal of Computer Research and Development,2006,43(1):68-74.
Authors:Song Shijie  Hu Huaping  Zhou Jiawei  Jin Shiyao
Affiliation:School of Computer Science, National University of Defense Technology, Changsha 410073
Abstract:
Keywords:sequential pattern mining  bitmap representation  itemset-extended  sequence-extended
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号