首页 | 本学科首页   官方微博 | 高级检索  
     

基于目的分析的作弊页面分类
引用本文:余慧佳,刘奕群,张敏,马少平,茹立云.基于目的分析的作弊页面分类[J].中文信息学报,2009,23(2):95-101.
作者姓名:余慧佳  刘奕群  张敏  马少平  茹立云
作者单位:智能技术与系统国家重点实验室,清华信息科学与技术国家实验室筹,清华大学计算机系,北京 100084
基金项目:国家重点基础研究发展规划(973计划),国家自然科学基金,国家高技术研究发展计划(863计划) 
摘    要:随着互联网的飞速发展,因网络作弊而产生的垃圾页面越来越多,严重影响了搜索引擎的检索效率和用户体验。反作弊已经成为搜索引擎所面临的最重要挑战之一。但目前的反作弊研究大都是基于页面内容或链接特征的,没有一个通用可行的识别方法。本文主要基于作弊目的的分析,给出作弊页面另一种体系的分类,为基于目的的作弊页面识别起到良好的导向作用。

关 键 词:计算机应用  中文信息处理  命名实体识别  命名实体排歧  命名实体跨语言关联  

Web Spam Taxonomy via Spam Intention Analysis
YU Hui-jia,LIU Yi-qun,ZHANG Min,MA Shao-ping,RU Li-yun.Web Spam Taxonomy via Spam Intention Analysis[J].Journal of Chinese Information Processing,2009,23(2):95-101.
Authors:YU Hui-jia  LIU Yi-qun  ZHANG Min  MA Shao-ping  RU Li-yun
Affiliation:State Key Lab of Intelligent Technology & Systems,
Tsinghua National Laboratory for Information Science and TechnologyTo Be Established,
CS&T Department, Tsinghua University, Beijing, 100084, China
Abstract:Along with the rapid development of the Internet,the spam pages which produced by web spam are prevailing and seriously impacts the retrieval efficiency of the search engine and the user experience.Anti-spam has become one of the most important challenges for the search engines.State-of-the-art anti-spam techniques usually make use of Web page features,either content-based or hyper-link structure based,to construct Web spam classifiers,which can't deal with different spam techniques simultaneously.This pape...
Keywords:computer application  Chinese information processing  Web spam  intention analysis  spam pages taxonomy  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号