首页 | 本学科首页   官方微博 | 高级检索  
     

Web日志挖掘预处理研究
引用本文:孔昊,周长胜.Web日志挖掘预处理研究[J].北京机械工业学院学报,2005,20(4):28-31.
作者姓名:孔昊  周长胜
作者单位:北京机械工业学院计算机及自动化系,北京100085
摘    要:Web日志挖掘是为网站经营和策略调整提供数据支持的重要手段,但原始的日志数据往往杂乱不完整,非结构化,因此预处理结果的好坏极大影响到挖掘的质量,通过对预处理过程中几个主要步骤进行深入讨论,总结已有的各种处理手段并提出新的改进方法.针对现有预处理方法的局限和不足,对分析网页内嵌元素尤其是图像元素进行了深入研究,提出了相应的处理手段.

关 键 词:Web日志挖掘  焦点  会话  事务
文章编号:1008-1658(2005)04-0028-04
收稿时间:2005-10-28
修稿时间:2005年10月28日

Data preprocess in Web log mining
KONG Hao,ZHOU Chang-sheng.Data preprocess in Web log mining[J].Journal of Beijing Institute of Machinery,2005,20(4):28-31.
Authors:KONG Hao  ZHOU Chang-sheng
Abstract:Web log mining is one of the most important means of data supporting for Web site management and strategy regulation.The original Web log data are always rough,uncomplete and unstructured,then the quality of preprocessing outcome may greatly affect the quality of mining.Through discussion on the main steps of data preprocessing in Web Usage Mining(WUM),methods of improvement are proposed and the ways of analyzing the information of pictures contained in Web pages are researched.
Keywords:Web log mining  focus  session  transaction
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号