Web 日志挖掘中的会话识别方法研究 |
| |
引用本文: | 顾兆军,李晓红,王伟,黄杰培.Web 日志挖掘中的会话识别方法研究[J].计算机技术与发展,2012(4). |
| |
作者姓名: | 顾兆军 李晓红 王伟 黄杰培 |
| |
作者单位: | 中国民航大学计算机学院,天津300300 |
| |
摘 要: | 数据预处理是 Web 日志挖掘的首要环节,而会话识别是数据预处理中的关键步骤之一.为了更好地实现会话识别、提高会话识别的真实度,从而为后续的模式挖掘工作提供精确的挖掘数据,文中在分析了现有常用的会话识别方法后,提出了优化初始会话集的方法.在该方法中,首先初始会话集的产生采用传统的基于访问时间的方法,然后对初始会话集进行合并和断开操作,生成优化的会话集.最后,采用实验实现了该方法.实验结果表明会话质量得到了提高
|
关 键 词: | Web 日志挖掘 数据预处理 会话识别 会话重组 访问时间 |
本文献已被 万方数据 等数据库收录! |
|