首页 | 本学科首页   官方微博 | 高级检索  
     

基于结构信息和时域信息的垃圾网页检测技术
引用本文:武磊,高斌,李京.基于结构信息和时域信息的垃圾网页检测技术[J].计算机应用研究,2008,25(4):1243-1246.
作者姓名:武磊  高斌  李京
作者单位:1. 中国科学院,软件研究所,软件工程技术中心,北京,100080
2. 微软亚洲研究院,互联网搜索与数据挖掘组,北京,100080
摘    要:提出一种将结构信息和时域信息综合运用来检测Spam技术的方法,并针对目前流行的Spam技术,从四个月的网络链接图中提取大量的结构和时域信息特征,训练一组检测Spam技术的网页分类器,取得了很好的实验结果。

关 键 词:Spam技术  搜索引擎优化  PageRank
文章编号:1001-3695(2008)04-1243-04
修稿时间:2007年1月22日

Web Spam detection based on structural and temporal information
WU Lei,GAO Bin,LI Jing.Web Spam detection based on structural and temporal information[J].Application Research of Computers,2008,25(4):1243-1246.
Authors:WU Lei  GAO Bin  LI Jing
Abstract:A novel framework was proposed to combine structural information and temporal information together for Spam detection.Targeting at detecting some popularity spamming technologies,a group of well-designed structural and temporal features was extracted from a series of link graphs of four successive months,and train a set of classifiers to distinguish normal websites from spam websites.Experiments on a real-world dataset show that the proposed method is quite effective for Web Spam detection.
Keywords:Spam technology  SEO  PageRank
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号