首页 | 本学科首页   官方微博 | 高级检索  
     

一种分布式Web使用模式挖掘模型及算法
引用本文:张克君, 杨炳儒, 赵耿, 曲文龙, 李欣. 一种分布式Web使用模式挖掘模型及算法[J]. 工程科学学报, 2006, 28(9): 896-901. DOI: 10.13374/j.issn1001-053x.2006.09.020
作者姓名:张克君  杨炳儒  赵耿  曲文龙  李欣
作者单位:北京电子科技学院计算机科学与技术系,北京,100070;北京科技大学信息工程学院,北京,100083;北京科技大学信息工程学院,北京,100083;北京电子科技学院计算机科学与技术系,北京,100070
基金项目:国家自然科学基金;教学改革项目
摘    要:给出了一种分布式Web日志挖掘模型DWLMS.根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难.在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性.

关 键 词:分布式数据挖掘  WEB使用模式挖掘  WEB日志挖掘  频繁路径
收稿时间:2005-07-20
修稿时间:2005-09-09

Construction and algorithms of distributed web usage pattern mining
ZHANG Kejun, YANG Bingru, ZHAO Geng, QU Wenlong, LI Xin. Construction and algorithms of distributed web usage pattern mining[J]. Chinese Journal of Engineering, 2006, 28(9): 896-901. DOI: 10.13374/j.issn1001-053x.2006.09.020
Authors:ZHANG Kejun  YANG Bingru  ZHAO Geng  QU Wenlong  LI Xin
Abstract:A distributed Web log mining system model (DWLMS) is presented. Based on the analysis on the procedure and algorithm of Web frequent access pattern mining, the more general incremental updating algorithms of local frequent paths (LFP) and global frequent paths (GFP) in a distributed database system based on DWLMS are proposed for discovering the frequent access paths. Some troubles produced by real time incremental distributed Web access information and more communication data are solved better by the algorithms. The method was realized simply and tested with real world Web log information in laboratory, and the results show that the algorithms are valid.
Keywords:distributed data mining  Web access pattern mining  Web log mining  frequent path
本文献已被 万方数据 等数据库收录!
点击此处可从《工程科学学报》浏览原始摘要信息
点击此处可从《工程科学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号