首页 | 本学科首页   官方微博 | 高级检索  
     

Web日志挖掘中的会话识别算法
引用本文:蔡浩,贾宇波,黄成伟,黄志强.Web日志挖掘中的会话识别算法[J].计算机工程与设计,2009,30(6).
作者姓名:蔡浩  贾宇波  黄成伟  黄志强
作者单位:浙江理工大学信息电子学院,浙江,杭州,310018
基金项目:浙江省教育厅科研计划,浙江理工大学科学基金 
摘    要:会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确.针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法.通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的对所有用户页面使用单一的先验阈值,该方法能够更准确地识别出长对话.最后对生成的侯选会话集进行二次识别,使识别出的会话更为合理有效.实验结果表明,会话质量得到了提高.

关 键 词:Web挖掘  数据预处理  会话识别  时间阁值

Improved method for session identification in web log mining
CAI Hao,JIA Yu-bo,HUANG Cheng-wei,HUANG Zhi-qiang.Improved method for session identification in web log mining[J].Computer Engineering and Design,2009,30(6).
Authors:CAI Hao  JIA Yu-bo  HUANG Cheng-wei  HUANG Zhi-qiang
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号