首页 | 本学科首页   官方微博 | 高级检索  
     

Web使用挖掘中Apriori算法的改进研究
引用本文:许晓东,李柯,朱士瑞. Web使用挖掘中Apriori算法的改进研究[J]. 计算机工程与设计, 2010, 31(3)
作者姓名:许晓东  李柯  朱士瑞
作者单位:1. 江苏大学,网络中心,江苏,镇江,212013;江苏大学,计算机科学与通信工程学院,江苏,镇江,212013
2. 江苏大学,计算机科学与通信工程学院,江苏,镇江,212013
3. 江苏大学,网络中心,江苏,镇江,212013
基金项目:江苏省教育厅高校科学研究基金项目 
摘    要:分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BI_Apriori算法.改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间.将项集有序性引入到该数组上,减少了候选项集的个数.并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率.试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式.

关 键 词:Web挖掘  不规则数组  项集有序性  二进制  访问模式

Improvement research of Apriori algorithm on web using mining
XU Xiao-dong,LI Ke,ZHU Shi-rui. Improvement research of Apriori algorithm on web using mining[J]. Computer Engineering and Design, 2010, 31(3)
Authors:XU Xiao-dong  LI Ke  ZHU Shi-rui
Affiliation:XU Xiao-dong 1,2,LI Ke 2,ZHU Shi-rui 1 (1.Network Center,Jiangsu University,Zhenjiang 212013,China,2.School of Computer Science , Communication Engineering,China)
Abstract:The process of discovering user frequent access pattern and the defect of Apriori algorithm are analyzed,and a improved algorithm called.BI_Apriori algorithm is proposed.The ragged array is used to store itemset information and reduce a mass of time by scanning database.The ordering of itemset is used to the array and reduce the number of candidate itemset.And the one frequent pattern is expressed by Binary,so the efficiency of pattern matching and connecting is improved.The experimental result show that th...
Keywords:web mining  ragged array  ordering of itemset  binary  access pattern
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号