首页 | 本学科首页   官方微博 | 高级检索  
     

基于内容的搜索引擎垃圾网页检测
引用本文:贾志洋,李伟伟,张海燕.基于内容的搜索引擎垃圾网页检测[J].计算机应用与软件,2009,26(11):165-167.
作者姓名:贾志洋  李伟伟  张海燕
作者单位:1. 云南师范大学计算机科学与信息技术学院,云南,昆明,650092
2. 中国石油大庆石化公司信息中心,辽宁,大庆,163714
摘    要:有些网页为了增加访问量,通过欺骗搜索引擎,提高在搜索引擎的搜索结果中的排名,这些网页被称为"搜索引擎垃圾网页"或"垃圾网页"。将搜索引擎垃圾网页的检测看成一个分类问题,采用C4.5分类算法建立决策树分类模型,将网页分成正常网页和垃圾网页两类。实验表明我们的分类模型可以有效地检测搜索引擎垃圾网页。

关 键 词:搜索引擎  垃圾网页  垃圾网页检测  决策树  C4.5分类算法

CONTENT-BASED SPAM WEB PAGE DETECTION IN SEARCH ENGINE
Jia Zhiyang,Li Weiwei,Zhang Haiyan.CONTENT-BASED SPAM WEB PAGE DETECTION IN SEARCH ENGINE[J].Computer Applications and Software,2009,26(11):165-167.
Authors:Jia Zhiyang  Li Weiwei  Zhang Haiyan
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号