Web日志挖掘中的会话识别算法 Improved method for session identification in web log mining期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

Web日志挖掘中的会话识别算法

引用本文：	蔡浩,贾宇波,黄成伟,黄志强.Web日志挖掘中的会话识别算法[J].计算机工程与设计,2009,30(6).

作者姓名：	蔡浩贾宇波黄成伟黄志强

作者单位：	浙江理工大学信息电子学院,浙江,杭州,310018

基金项目：	浙江省教育厅科研计划，浙江理工大学科学基金

摘要：	会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确.针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法.通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的对所有用户页面使用单一的先验阈值,该方法能够更准确地识别出长对话.最后对生成的侯选会话集进行二次识别,使识别出的会话更为合理有效.实验结果表明,会话质量得到了提高.
关键词：	Web挖掘数据预处理会话识别时间阁值
Improved method for session identification in web log mining

CAI Hao,JIA Yu-bo,HUANG Cheng-wei,HUANG Zhi-qiang.Improved method for session identification in web log mining[J].Computer Engineering and Design,2009,30(6).

Authors:	CAI Hao JIA Yu-bo HUANG Cheng-wei HUANG Zhi-qiang

Abstract:

Keywords:
本文献已被维普万方数据等数据库收录！