首页 | 本学科首页   官方微博 | 高级检索  
     

基于邻接表存储与哈希表的频繁项集挖掘算法
作者姓名:吴昊  刘钊  顾进广
作者单位:1. 武汉科技大学计算机科学与技术学院;2. 武汉科技大学大数据科学与工程研究院;3. 湖北省智能信息处理与实时工业系统重点实验室
基金项目:国家自然科学基金项目(61673304);;国家社会科学基金重大计划项目(11&ZD189);
摘    要:针对Apriori算法从数据中挖掘频繁项集的计算时间效率较低和空间内存占用较高的问题提出一种ATSAHT-Apriori(Adjacency Table Storage and Hash Table-Apriori)算法。该算法利用哈希表来存储数据,极大地提高了项集支持度频数的计算效率,结合图存储的思想利用邻接表来存储候选项集,极大地优化了内存空间占用,同时将候选项集构建大根堆,通过堆排序的思想与动态剪枝算法思想优化了频繁项集的计算速度和候选项集存储的内存空间,有效地优化了传统Apriori算法的计算时间效率和内存空间占用方面的不足。一系列对比实验表明,ATSAHT-Apriori算法在时间效率和空间效率都有一定的提高。

关 键 词:时间复杂度  空间复杂度  动态剪枝  哈希表存储  邻接表存储
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号