首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的PrefixSpan算法及其在Web用户行为模式挖掘中的应用
引用本文:姬浩博,王俊红.一种改进的PrefixSpan算法及其在Web用户行为模式挖掘中的应用[J].计算机科学,2016,43(1):25-29.
作者姓名:姬浩博  王俊红
作者单位:山西大学计算机与信息技术学院 太原030006,山西大学计算机与信息技术学院 太原030006;山西大学计算机智能与中文信息处理教育部重点实验室 太原030006
基金项目:本文受国家自然科学基金(61202018,7,61303008),山西省青年科技基金(2013021018-1),山西省高等学校科技创新项目(2013102)资助
摘    要:序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接递归局部频繁项等方式进行改进,并将改进方法应用于Web用户行为模式挖掘中,对日志记录中的规律进行分析和研究。实验分析表明,相比PrefixSpan算法,该改进算法在算法效率方面有一定的提高。

关 键 词:序列模式挖掘  Web日志挖掘  PrefixSpan算法
收稿时间:2015/4/30 0:00:00
修稿时间:2015/6/26 0:00:00

Research on Improved PrefixSpan Algorithm and its Application in Web User Behavior Patterns Mining
JI Hao-bo and WANG Jun-hong.Research on Improved PrefixSpan Algorithm and its Application in Web User Behavior Patterns Mining[J].Computer Science,2016,43(1):25-29.
Authors:JI Hao-bo and WANG Jun-hong
Affiliation:School of Computer & Information Technology,Shanxi University,Taiyuan 030006,China and School of Computer & Information Technology,Shanxi University,Taiyuan 030006,China;Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education, Shanxi University,Taiyuan 030006,China
Abstract:
Keywords:Sequence pattern mining  Web log mining  PrefixSpan algorithm
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号