基于网站日志挖掘的频繁遍历主干子网发现 |
| |
引用本文: | 鲍 钰. 基于网站日志挖掘的频繁遍历主干子网发现[J]. 计算机系统应用, 2009, 18(4): 22-25 |
| |
作者姓名: | 鲍 钰 |
| |
作者单位: | 华东师范大学软件学院上海200062 |
| |
基金项目: | 国家973 计划项目(2005CB321904) |
| |
摘 要: | WWW 上用户的访问路径信息会被记录在WEB 服务器的日志记录中,分析这些日志并挖掘出用户的主要行为模式,可以提取出WEB 网站被频繁访问的主干部分。本文首先将原始日志信息整理成目标页前向访问路径集TUPD(Target Pages User Forward Access Path Dataset),然后在TUPD 上生成加权网站结构多维树WWSSMT(Weighted Web Site Structure Multi-Tree),最后引入决策频度阀值S,删除所有WWSSMT 中weight
|
关 键 词: | Web 日志 目标页前向访问路径集 加权网站结构多维树 主干子网 访问模式 |
收稿时间: | 2008-09-24 |
Mining Web Logs to Discover Major Web Site Structure |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机系统应用》浏览原始摘要信息 |
|
点击此处可从《计算机系统应用》下载全文 |
|