首页 | 本学科首页   官方微博 | 高级检索  
     

基于磁盘存储1项集计数的增量FP_GROWTH算法
引用本文:申彦,朱玉全,刘春华.基于磁盘存储1项集计数的增量FP_GROWTH算法[J].计算机研究与发展,2015(3):569-578.
作者姓名:申彦  朱玉全  刘春华
作者单位:1. 江苏大学信息管理与信息系统系江苏镇江 212013; 江苏大学计算机科学与通信工程学院江苏镇江 212013
2. 江苏大学计算机科学与通信工程学院江苏镇江 212013
基金项目:国家自然科学基金项目(70971067);国家科技支撑计划基金项目(2010BAI88B00);全国统计科学研究计划项目(2012LY160);江苏省自然科学基础研究计划基金项目(BK2010331);江苏省博士研究生创新计划基金项目(CX10B_016X);江苏大学高级人才基金项目(13JDG127);江苏省博士后科研资助计划项目(1401056C)
摘    要:随着数据集规模的不断增大,提高频繁项集的挖掘效率成为数据挖掘领域的研究重点。频繁项集的增量更新挖掘算法因其可以利用已挖掘发现的信息提高对新数据集的挖掘效率,成为重要的研究方向。但现有频繁项集增量更新算法大多基于APRIORI算法框架,性能提高有限。最近出现的建立在FP‐T REE等树形结构上的增量更新算法又往往存在树形结构调整困难、已发现频繁项集及树形结构保存效率较低等问题,算法性能有待进一步地提高。对此,通过分析增量挖掘过程中的关键信息,提出了一种基于磁盘存储1项集计数的增量FP_GROWTH算法(IU_FPGROWTH_1COUNTING)。该算法无需保存临时树形结构及临时挖掘结果,可以在原数据集及支持度均发生变化时,减少FP_GROWT H算法对数据集的扫描,提高频繁项集的挖掘效率。在生成以及真实数据集上进行了验证实验以及性能分析,结果表明IU_FPGROWTH_1COUNTING是一种有效的频繁项集增量更新挖掘算法。

关 键 词:关联规则  频繁项集  大规模数据  FP_GROWT  H算法  增量更新

Incremental FP_GROWTH Algorithm Based on Disk-resident 1-itemsets Counting
Shen Yan , Zhu Yuquan , Liu Chunhua.Incremental FP_GROWTH Algorithm Based on Disk-resident 1-itemsets Counting[J].Journal of Computer Research and Development,2015(3):569-578.
Authors:Shen Yan  Zhu Yuquan  Liu Chunhua
Affiliation:Shen Yan;Zhu Yuquan;Liu Chunhua;Department of Information Management and Information System,Jiangsu University;School of Computer Science and Communication Engineering,Jiangsu University;
Abstract:
Keywords:association rules  frequent itemsets  massive data  FP_GROWT H algorithm  incremental update
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号