首页 | 本学科首页   官方微博 | 高级检索  
     

自适应遗传算法在主题爬虫搜索策略中的应用研究
引用本文:荆文鹏,王育坚,董伟伟. 自适应遗传算法在主题爬虫搜索策略中的应用研究[J]. 计算机科学, 2016, 43(8): 254-257
作者姓名:荆文鹏  王育坚  董伟伟
作者单位:北京联合大学信息学院 北京100101,北京联合大学信息学院 北京100101,北京联合大学信息学院 北京100101
基金项目:本文受国家自然科学基金项目:基于超图形XGML的图像半结构化研究(61271369)资助
摘    要:如何提高爬虫覆盖率和准确率是主题爬虫的研究热点之一。目前大多采用最佳优先搜索策略,针对该类主题爬虫易陷入局部最优的不足,设计结合遗传算法的主题爬虫搜索策略,并设计动态适应度函数和遗传算子使得爬虫具有一定的自适应性。与其他搜索策略以及结合非自适应遗传算法的搜索策略进行了比较,结果表明该算法能够在一定程度上提高爬虫性能。

关 键 词:主题爬虫  重要度  遗传算法  遗传算子  适应度函数
收稿时间:2015-05-21
修稿时间:2015-08-21

Research on Adaptive Genetic Algorithm in Application of Focused Crawler Search Strategy
JING Wen-peng,WANG Yu-jian and DONG Wei-wei. Research on Adaptive Genetic Algorithm in Application of Focused Crawler Search Strategy[J]. Computer Science, 2016, 43(8): 254-257
Authors:JING Wen-peng  WANG Yu-jian  DONG Wei-wei
Affiliation:College of Information Technology,Beijing Union University,Beijing 100101,China,College of Information Technology,Beijing Union University,Beijing 100101,China and College of Information Technology,Beijing Union University,Beijing 100101,China
Abstract:
Keywords:Focused crawler  Important degree  Genetic algorithm  Genetic operators  Fitness function
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号