首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于SFP树的快速关联规则挖掘算法
引用本文:李龙澍,王永,魏博诚.一种基于SFP树的快速关联规则挖掘算法[J].计算机技术与发展,2011,21(5).
作者姓名:李龙澍  王永  魏博诚
作者单位:安徽大学,计算机智能与信号处理教育部重点实验室,安徽,合肥,230039
摘    要:对于传统的FP-Growth算法而言,当事务数据库D很大时,构造基于内存的FP树可能是不现实的.针对此问题,提出了一种基于样本事务数据库的SFP算法.该方法对事务数据库D进行随机抽样,得到样本数据库S,此时以比指定的支持度min_sup小的支持度(min_sup')在S中挖掘频繁项集L',根据求得的频繁项集L',在剩余的数据库D-S中求得L'中各事务的支持数,这在大多数情况下就可以求得所有的频繁项集,但是有时可能会漏掉一些.这时可以对D进行二次扫描以发现漏掉的频繁项集.该算法大多数情况下只需要对数据库进行一次扫描,最坏情况下也只需要对数据库进行二次扫描.当把效率放在首位时,比如计算密集事务数据库的频繁项集时,SFP算法尤其合适.

关 键 词:关联规则  频繁项集  FP树  样本事务数据库

A Fast Association Rule Mining Algorithm Based on SFP Tree
LI Long-shu,WANG Yong,WEI Bo-cheng.A Fast Association Rule Mining Algorithm Based on SFP Tree[J].Computer Technology and Development,2011,21(5).
Authors:LI Long-shu  WANG Yong  WEI Bo-cheng
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号