首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的Web访问日志数据预处理算法
引用本文:林源泽,林世平. 一种改进的Web访问日志数据预处理算法[J]. 计算机工程与应用, 2006, 0(Z1)
作者姓名:林源泽  林世平
作者单位:福州大学 数学与计算机科学学院,福州大学 数学与计算机科学学院 福州 350002,福州 350002
摘    要:数据预处理是Web使用挖掘的一个关键环节,其结果直接影响到后续的事务识别、路径分析、关联规则挖掘和序列模式挖掘的结果。提出了一种用户识别的通用算法、路径补充的启发式策略和基于主题规约的方法,并用实验证明了其高效性。

关 键 词:Web使用挖掘  数据预处理  用户识别  会话识别  路径补充  主题规约

Advanced Data Preprocessing Algorithm for Web Access Log
LIN Yuan-ze,LIN Shi-ping. Advanced Data Preprocessing Algorithm for Web Access Log[J]. Computer Engineering and Applications, 2006, 0(Z1)
Authors:LIN Yuan-ze  LIN Shi-ping
Abstract:Data Preprocessing is a critical step in web usage mining.The results of Data Preprocessing is relevant to the next steps,such as transaction identification,path analysis,association rules mining,sequential patterns mining,and so forth.This text presents a currency algorithm for user identification、an heuristic rule for path completion and a method based theme statute.It is experimentally evaluated that not only its efficiency is high,but also it can identify user and session exactly.
Keywords:Web Usage Mining  data preprocessing  user identification  session identification  path completion  theme statute
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号