首页 | 本学科首页   官方微博 | 高级检索  
     

基于访问日志的网页内容监控挖掘系统
引用本文:丘海澜,文翰,肖南峰.基于访问日志的网页内容监控挖掘系统[J].计算机工程,2011,37(4):70-72.
作者姓名:丘海澜  文翰  肖南峰
作者单位:1. 北京城市热点资讯有限公司研发部,广州,510630
2. 华南理工大学计算机科学与工程学院,广州,510006
基金项目:国家自然科学基金与中国民用航空总局联合基金资助项目,广东省自然科学基金资助重点项目
摘    要:URL是用于完整描述Internet上网页和其他资源地址的一种标识方法,URL访问日志能记录用户的上网痕迹。针对该特点,提出一种基于访问日志的网页内容监控挖掘系统,实现网页内容抓取、监控、分析、报表生成等一系列过程的自动化。系统运行测试结果表明,该系统的准确率较高,能有效解决运营商和互联网监管部门的网络监管问题。

关 键 词:用户访问日志  网页内容挖掘  网页分类

Webpage Content Monitoring and Mining System Based on Visiting Log
QIU Hai-lan,WEN Han,XIAO Nan-feng.Webpage Content Monitoring and Mining System Based on Visiting Log[J].Computer Engineering,2011,37(4):70-72.
Authors:QIU Hai-lan  WEN Han  XIAO Nan-feng
Affiliation:1.Research and Development Department,City Hotspot Information Co.,Ltd.,Guangzhou 510630,China;2.School of Computer Science & Engineering,South China University of Technology,Guangzhou 510006,China)
Abstract:URL is the global address of documents and other resources in Internet. For the function that URL visiting logs record the traces of users on Internet, the paper discusses key techniques of Web monitoring and mining system based on users visiting log. This system can automatically grasp webpage, monitor, analyze contents and generate tables. Test results show that the system has high accuracy rate and it can satisfy design demands and effectively settle the network supervision problems for Internet operators and government supervision departments.
Keywords:user visiting log  webpage content mining  webpage classification
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号