首页 | 本学科首页   官方微博 | 高级检索  
     

基于规则引擎的个性化主题网页爬虫的研究
引用本文:赵思佳,尹婷.基于规则引擎的个性化主题网页爬虫的研究[J].计算机技术与发展,2011,21(3).
作者姓名:赵思佳  尹婷
作者单位:中南大学,信息科学与工程学院,湖南,长沙,410083
基金项目:信息产业部电子发展基金项目
摘    要:目前互联网上的信息正在飞速的增长,人们主要依靠搜索引擎查找信息,随着专业化不断加强,垂直搜索引擎成为人们新的工具,但构建专业化搜索引擎过程比较复杂.为了解决垂直搜索引擎中主题爬虫配置不灵活的问题,采用在爬虫上集成规则引擎的方法,通过规则库来控制爬虫运行,并且使用可扩展度较高的开源爬虫项目Heritrix和开源规则引擎项目Drools,构建配置方便、灵活度高的个性化爬虫,从而将原先主题爬虫的设置从紧耦合转变成了松耦合,降低了用户配置难度.

关 键 词:规则引擎  主题爬虫  搜索引擎

Research of Personalization Theme Crawler Based on Rule Engine
ZHAO Si-jia,YIN Ting.Research of Personalization Theme Crawler Based on Rule Engine[J].Computer Technology and Development,2011,21(3).
Authors:ZHAO Si-jia  YIN Ting
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号