首页 | 本学科首页   官方微博 | 高级检索  
     

基于网站日志挖掘的频繁遍历主干子网发现
引用本文:鲍 钰. 基于网站日志挖掘的频繁遍历主干子网发现[J]. 计算机系统应用, 2009, 18(4): 22-25
作者姓名:鲍 钰
作者单位:华东师范大学软件学院上海200062
基金项目:国家973 计划项目(2005CB321904)
摘    要:WWW 上用户的访问路径信息会被记录在WEB 服务器的日志记录中,分析这些日志并挖掘出用户的主要行为模式,可以提取出WEB 网站被频繁访问的主干部分。本文首先将原始日志信息整理成目标页前向访问路径集TUPD(Target Pages User Forward Access Path Dataset),然后在TUPD 上生成加权网站结构多维树WWSSMT(Weighted Web Site Structure Multi-Tree),最后引入决策频度阀值S,删除所有WWSSMT 中weight
关 键 词:Web 日志 目标页前向访问路径集 加权网站结构多维树 主干子网 访问模式
收稿时间:2008-09-24

Mining Web Logs to Discover Major Web Site Structure
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号