首页 | 本学科首页   官方微博 | 高级检索  
     

Web日志挖掘中的数据预处理技术
引用本文:李燕,冯博琴,鲁晓锋.Web日志挖掘中的数据预处理技术[J].计算机工程,2009,35(22):44-46.
作者姓名:李燕  冯博琴  鲁晓锋
作者单位:1. 西安交通大学电子与信息工程学院,西安,710049;西安理工大学计算机科学与工程学院,西安,710048
2. 西安交通大学电子与信息工程学院,西安,710049
3. 西安理工大学计算机科学与工程学院,西安,710048
基金项目:国家"863"计划基金资助项目 
摘    要:数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。

关 键 词:Web日志挖掘  数据预处理  用户会话识别  路径补充
修稿时间: 

Data Preprocessing Technique in Web Log Mining
LI Yan,FENG Bo-qin,LU Xiao-feng.Data Preprocessing Technique in Web Log Mining[J].Computer Engineering,2009,35(22):44-46.
Authors:LI Yan  FENG Bo-qin  LU Xiao-feng
Affiliation:(1. School of Electronics and Information Engineering, Xi’an Jiaotong University, Xi’an 710049; 2. School of Computer Science and Engineering, Xi’an University of Technology, Xi’an 710048)
Abstract:Data preprocessing is the important step in Web log mining. It consists of four sub-steps, i.e. data cleaning, user identification, session identification and path completion. The referer-based method is adopted for user session identification and path completion, in order to avoid the problems introduced by using proxy servers, firewall, local caching, and so on. Experimental results reveal that the technique can obtain the user access path efficiently if accurate referer information is available in Web access log.
Keywords:Web log mining  data preprocessing  user-session identification  path completion
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号