首页 | 本学科首页   官方微博 | 高级检索  
     

遗传算法在主题Web信息采集中的应用研究
引用本文:唐志,王成良.遗传算法在主题Web信息采集中的应用研究[J].计算机科学,2006,33(7):71-74.
作者姓名:唐志  王成良
作者单位:1. 重庆大学计算机学院,重庆400044
2. 重庆大学软件学院,重庆400044
摘    要:传统的基于本地搜索算法的信息采集系统存在诸如主题漂移和采集结果局部最优等问题。在深入研究Web拓扑结构基础上,利用网络蜘蛛的在线状态,提出了基于全局信息的、动态综合了链接的立即回报价值和未来回报价值的遗传算法。通过此算法,利用元搜索技术可进一步提高网络蜘蛛的性能,具有更高的查全率和查准率,能够较好地解决现存问题。

关 键 词:网络蜘蛛  遗传算法  Web社区  信息采集

Research of a Focused Crawler Using Genetic Algorithm
TANG Zhi,WANG Cheng-Liang.Research of a Focused Crawler Using Genetic Algorithm[J].Computer Science,2006,33(7):71-74.
Authors:TANG Zhi  WANG Cheng-Liang
Affiliation:1.College of Computer Science, Chongqing University, Chongqing 400044;2.School of Computer Software, Chongqing University, Chongqing 400044
Abstract:
Keywords:Genetic algorithm  Web spider  Web community  Information retrieve
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号