首页 | 本学科首页   官方微博 | 高级检索  
     

基于排序索引矩阵的频繁项集挖掘算法
引用本文:荀娇,徐连诚,杨仁华.基于排序索引矩阵的频繁项集挖掘算法[J].计算机工程,2012,38(19):41-44,48.
作者姓名:荀娇  徐连诚  杨仁华
作者单位:1. 山东师范大学信息科学与工程学院,济南250014;山东省分布式计算机软件新技术重点实验室,济南250014
2. 山东省信息中心,济南,250013
基金项目:国家自然科学基金资助项目(60873247); 山东省自然科学基金资助项目(ZR2011FM030,ZR2012FM038); 山东省社会科学规划研究基金资助项目(10BSHJ03); 山东省教育厅科技计划基金资助项目(J09LG52)
摘    要:针对Apriori算法产生候选项集的问题,提出一种基于排序索引矩阵(SIM)的频繁项集挖掘算法.将频繁1-项集形成的1-项集向量依次与对应矩阵相乘,生成频繁2-项集.从频繁3-项集开始,对每次生成的频繁k-项集建立SIM,借助SIM结构实现项集的跨越式搜索和连接.整个过程只需扫描一次数据库,不会产生候选项集.实验结果表明,该算法能提高频繁项集的挖掘效率.

关 键 词:关联规则  排序索引矩阵  候选项集  频繁项集  跨越式搜索  数据挖掘
收稿时间:2011-12-06

Frequent Itemsets Mining Algorithm Based on Sorting Index Matrix
XUN Jiao , XU Lian-cheng , YANG Ren-hua.Frequent Itemsets Mining Algorithm Based on Sorting Index Matrix[J].Computer Engineering,2012,38(19):41-44,48.
Authors:XUN Jiao  XU Lian-cheng  YANG Ren-hua
Affiliation:1.School of Information Science and Engineering,Shandong Normal University,Jinan 250014,China;2.Shandong Provincial Key Laboratory for Distributed Computer Software Novel Technology,Jinan 250014,China;3.Shandong Province Information Center,Jinan 250013,China)
Abstract:Aiming at the problem that Apriori algorithm generates candidate itemsets,this paper presents a frequent itemsets mining algorithm based on Sorting Index Matrix(SIM).The algorithm directly generates frequent 2-itemset through 1-itemset vector and the corresponding matrix multiplication sequentially.From the frequent 3-itemset,it establishes simple SIM for the frequent k-item sets to realize itemsets' spanning search and connection with the SIM.The whole process just scans the database once,and does not produce candidate itemsets.Experimental result shows that the algorithm improves the efficiency of mining frequent itemsets.
Keywords:association rule  Sorting Index Matrix(SIM)  candidate itemsets  frequent itemsets  spanning search  data mining
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号