基于支持向量机的Web日志用户标志修正算法 |
| |
引用本文: | 邹根,闻立杰. 基于支持向量机的Web日志用户标志修正算法[J]. 计算机集成制造系统, 2011, 17(8) |
| |
作者姓名: | 邹根 闻立杰 |
| |
作者单位: | 清华大学计算机科学与技术系,北京100084/清华大学软件学院,北京100084/清华大学信息系统安全教育部重点实验室,北京100084/清华大学信息科学与技术国家实验室(筹),北京100084 |
| |
基金项目: | 国家自然科学基金资助项目,国家973计划资助项目,国家863计划资助项目,核高基专项资助项目 |
| |
摘 要: | 针对用户删除Cookie导致的Web日志用户标志不准确的情况,提出了一种基于支持向量机的用户标志修正算法。首先训练一个分类器判断两个会话是否属于同一个用户,然后计算两个不同标志用户之间的相似度,最后将日志进行分组,发现所有删除Cookie的用户并进行标志的修正。通过实验验证了算法的有效性。
|
关 键 词: | Web日志 数据预处理 用户识别 支持向量机 数据挖掘 |
User identifier correction algorithm in Web logs based on support vector machine |
| |
Abstract: | |
| |
Keywords: | Web logs data preprocessing user identification support vector machine data mining |
本文献已被 万方数据 等数据库收录! |
|