首页 | 本学科首页   官方微博 | 高级检索  
     

Web日志挖掘中的数据预处理研究
作者单位:中国矿业大学计算机学院 江苏徐州221008
摘    要:Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础和实施有效挖掘算法的前提,在Web日志挖掘中起着重要的作用,也是工作量较大的一部分。数据预处理的基本技术,包括数据清理、数据集成和转换、数据归约等。本文介绍了数据预处理中涉及到的数据清理、用户识别、会话识别、路径补充、事务识别等过程,并提出了一种路径补充算法。

关 键 词:Web日志  数据预处理  用户会话  路径补充  事务识别

Research of Data Preprocessing in Web Log Mining
LI Peng,ZHANG Yong-ping. Research of Data Preprocessing in Web Log Mining[J]. Digital Community & Smart Home, 2008, 0(14)
Authors:LI Peng  ZHANG Yong-ping
Abstract:The preprocessing of web logs plays a key role in web mining;it also needs a lot of workloads.The basic technology of data item preprocessing includes data cleaning,data integration,data transition.In this paper,the author presents the main processes in data item preprocessing including data cleaning,user identifying,session identifying,path supplement and transaction identifying and puts forward a new algorithm for identifying transactions.
Keywords:Web logs mining  Data item preprocessing  User session  Path supplement  Transaction identifying
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号