首页 | 本学科首页   官方微博 | 高级检索  
     

Web使用数据挖掘中数据预处理的研究
引用本文:易敏昕,汪胜,张有仁,陈宝树.Web使用数据挖掘中数据预处理的研究[J].计算机工程与应用,2003,39(24):154-157.
作者姓名:易敏昕  汪胜  张有仁  陈宝树
作者单位:华东理工大学计算机科学与工程系,上海,200237
摘    要:Web使用数据挖掘是为网站经营管理和结构调整提供决策支持的主要手段。其中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出了一个预处理工具模型WUMPA。并针对预处理过程中动态页面跟踪、站点结构表示和会话管理等难点问题进行了进一步分析,提出了一个网站结构数据模型SITEDM和一个高效的会话管理算法session_manager。

关 键 词:Web使用数据挖掘  数据预处理  会话  网站结构数据模型
文章编号:1002-8331-(2003)24-0154-04
修稿时间:2002年9月1日

Data Preparation in Web Usage Mining
Yi,Minxin Wang Sheng Zhang Youren Chen Baoshu.Data Preparation in Web Usage Mining[J].Computer Engineering and Applications,2003,39(24):154-157.
Authors:Yi  Minxin Wang Sheng Zhang Youren Chen Baoshu
Abstract:Web usage mining is the main method for management and structure adjustment of Web site.This paper studies the data preprocessing phase of Web usage mining,which is the key to get good results.Also,it presents a well-designed preprocessing model named WUMPA.Besides,this paper takes a deep insight into those hard problems such as trading of dynamic pages,presentation of site structure and management of sessions.As a result,it also presents a site structure data model—SITEDM and an efficient algorithm—session_manager.
Keywords:Web usage mining  Data preparation  Session  Site structure data model
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号