首页 | 本学科首页   官方微博 | 高级检索  
     

基于Hash表的关联规则挖掘算法的改进
引用本文:卢云彬,曹汉强.基于Hash表的关联规则挖掘算法的改进[J].微机发展,2007,17(6):12-14.
作者姓名:卢云彬  曹汉强
作者单位:华中科技大学电子与信息工程系 湖北武汉430074
基金项目:国家科技攻关项目(2004BA811B06)
摘    要:经典的Apriori算法在大项目集的挖掘过程中因为重复搜索导致效率低下。提出一种改进的Hash表结构应用于DHP算法中的项目集存放,定义新的Hash函数确定项目集的存放地址,并基于新的Hash表结构,以并行挖掘的方式优化关联规则算法的剪枝过程。实验结果表明,与Apriori算法相比,文中的方法可以更好地节省存储空间,提高挖掘效率。

关 键 词:数据挖掘  关联规则  Apriori算法  DHP算法  Hash表
文章编号:1673-629(2007)06-0012-03
修稿时间:2006年9月11日

Improvement of Association Rules Mining Algorithm Based on Hash Table
LU Yun-bin,CAO Han-qiang.Improvement of Association Rules Mining Algorithm Based on Hash Table[J].Microcomputer Development,2007,17(6):12-14.
Authors:LU Yun-bin  CAO Han-qiang
Abstract:With classical Apriori algorithm,mining large itemsets is inefficient because of repeated scanning.In this paper,develop an algorithm DHP with improved Hash table for efficient large itemset generation.The stored address of itemsets is determined by a new Hash function.Based on the new Hash table,can use parallel mining to improve pruning process in association rules algorithm.From the experiment results,the method in this paper can save more storing space and enhance mining efficiency compared with Apriori algorithm.
Keywords:data mining  association rules  Apriori algorithm  DHP algorithm  Hash table
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号