首页 | 本学科首页   官方微博 | 高级检索  
     

基于元搜索引擎的个性化Web信息采集
引用本文:王忠,程磊.基于元搜索引擎的个性化Web信息采集[J].计算机工程与设计,2009,30(13).
作者姓名:王忠  程磊
作者单位:1. 武汉工程大学,计算机科学与工程学院,湖北,武汉,430073
2. 支付宝,中国,网络技术有限公司,浙江,杭州,310099
摘    要:为了减少传统Web采集系统网络资源的耗费,并增强其个性化支持,结合用户兴趣向量模型,将元搜索引擎技术应用到Web信息采集领域中,设计一个基于元搜索引擎的个性化Web信息采集系统.该系统通过调用成员搜索引擎发现与用户兴趣相关的目标Web站点,通过爬虫程序采集目标站点上的Web页面内容.在发现兴趣站点方面更具有针对性,能有效减少爬虫的数量.重点研究了系统的体系结构、个性化Web采集的工作流程,最后给出了该系统的应用场合.

关 键 词:元搜索引擎  个性化  Web信息采集  兴趣向量  体系结构

Customized web crawling based on meta search engine
WANG Zhong,CHENG Lei.Customized web crawling based on meta search engine[J].Computer Engineering and Design,2009,30(13).
Authors:WANG Zhong  CHENG Lei
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号