首页 | 本学科首页   官方微博 | 高级检索  
     

基于HASH表的多谓词约束下频繁项集挖掘
引用本文:张婕,张燕,李广水.基于HASH表的多谓词约束下频繁项集挖掘[J].微电子学与计算机,2011,28(10):56-59.
作者姓名:张婕  张燕  李广水
作者单位:1. 金陵科技学院信息技术学院,江苏南京,211169
2. 金陵科技学院信息技术学院,江苏南京211169/江苏省信息分析工程实验室,江苏南京211169
基金项目:金陵科技学院学生科技创新立项课题;金陵科技学院博士启动资金(JIT-B-201101)
摘    要:针对在交易数据库中挖掘出指定顾客相关属性的频繁项集这一问题,提出了基于维约束进行求解的构想.采用模式增长的挖掘方法,但与传统的模式树不同的是将原先每一节点频繁计数值设为在所有可能的谓词约束下该项的计数形成的向量,并利用HASH表进行向量值及项所在层的位置映射,因此,在不同的约束组合下的频繁项集挖掘将不再需要扫描数据库.仿真实验表明该挖掘算法的完备性,通过与先筛选再挖掘的算法进行比较,证明该挖掘算法具有更高的效率.

关 键 词:多谓词约束  频繁项集  模式增长  HASH表

Multi-predicate Constrained Frequent Itemsets Mining Based on Hash Table
ZHANG Jie,ZHANG Yan,LI Guang-shui.Multi-predicate Constrained Frequent Itemsets Mining Based on Hash Table[J].Microelectronics & Computer,2011,28(10):56-59.
Authors:ZHANG Jie  ZHANG Yan    LI Guang-shui
Affiliation:ZHANG Jie1,ZHANG Yan1,2,LI Guang-shui1,2(1 School of IT,Jinling Institute of Technology,Nanjing 211169,China,2 Jiangsu Information Analysis Engineering Laboratory,China)
Abstract:Aiming at how to mine frequent itemsets from affair database after specifying customer characters,the conception of mining with multidimensional constrained is brought forward.The FP_Growth algorithm is employed,but the way for constructing FP_Tree is different in every item-node,it's not the count of the item occurring in the database,but using a vector that makes of counts of the item under every constructing,the node vector and level structure are saved in HASH table,it can support mining the frequent it...
Keywords:Multi-predicate constraints  frequent itemsets  FP_Growth  hash table  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号