首页 | 本学科首页   官方微博 | 高级检索  
     

Web使用挖掘的数据预处理
引用本文:刘立军,周军,梅红岩.Web使用挖掘的数据预处理[J].计算机科学,2007,34(5):200-201.
作者姓名:刘立军  周军  梅红岩
作者单位:辽宁工学院计算机科学与工程学院,辽宁,锦州,121001
基金项目:辽宁省优秀青年骨干教师选拔工程基金 , 辽宁省教育厅资助项目
摘    要:Web使用挖掘的基本思想是将数据挖掘技术应用于Web使用数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web使用挖掘的数据源最主要的是Web日志,介绍了Web日志的具体内容,针对Web日志的特点,介绍预处理过程中一些特殊情况的处理方法,并在事务的识别阶段给出了一种新的最大向前引用序列挖掘算法——剪枝算法。

关 键 词:Web使用挖掘  数据预处理  剪枝算法  最大向前引用  事务识别

The Pre-processing of Web Usage Mining
LIU Li-Jun,ZHOU Jun,MEI Hong-Yan.The Pre-processing of Web Usage Mining[J].Computer Science,2007,34(5):200-201.
Authors:LIU Li-Jun  ZHOU Jun  MEI Hong-Yan
Affiliation:Department of Computer Science, Liaoning Institute of Technology, Jinzhou121001
Abstract:The basic idea of Web usage mining is to apply the technology of data mining to the data source of Web usage. Data preprocessing plays an important role in the field of Web usage mining. The data source of Web usage mining is mainly composed of Web logs. This paper introduces detailed content of Web logs. In the light of features of Web logs, some special processing methods of preprocessing are introduced. At the same time, a newly algorithm of maximal forward references-pruning algorithm is proposed at the stage of transaction recognition.
Keywords:Web usage mining  Preprocessing  Pruning algorithm  Maximal forward references  Transaction recognition
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号