首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的Web日志会话识别方法
引用本文:方元康,胡学钢,夏启寿. 一种改进的Web日志会话识别方法[J]. 计算机技术与发展, 2008, 18(11)
作者姓名:方元康  胡学钢  夏启寿
作者单位:1. 合肥工业大学,计算机信息学院,安徽,合肥,230009;池州学院,计算机中心,安徽,池州,247000
2. 合肥工业大学,计算机信息学院,安徽,合肥,230009
3. 池州学院,计算机中心,安徽,池州,247000
基金项目:安徽省自然科学基金,安徽省自然科学基金
摘    要:会话识别是Web日志挖掘中的数据预处理中的一个重要步骤.文中提出了一种改进的会话识别方法.首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整.通过实验证明,相对于传统的对所有页面使用单一的先验阈值进行会话识别的方法,该方法所得到的会话集更具有真实性.

关 键 词:Web挖掘  数据预处理  阈值  Frame页面  会话识别

An Improved Method for Transaction Session Identification in Web Usage Mining
FANG Yuan-kang,HU Xue-gang,XIA Qi-shou. An Improved Method for Transaction Session Identification in Web Usage Mining[J]. Computer Technology and Development, 2008, 18(11)
Authors:FANG Yuan-kang  HU Xue-gang  XIA Qi-shou
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号