首页 | 本学科首页   官方微博 | 高级检索  
     

基于遗传算法的主题爬行技术研究
引用本文:关慧芬,师军,马继红.基于遗传算法的主题爬行技术研究[J].计算机与数字工程,2008,36(10).
作者姓名:关慧芬  师军  马继红
作者单位:陕西师范大学计算机科学学院,西安,710062
摘    要:针对目前主题搜索策略的不足,提出了基于遗传箅法的主题爬行策略,提高了链接于内容相似度不高的网页之后的页面被搜索的机会,扩大了相关网页的搜索范围.同时,在网页相关度分析方面,引入了基于本体语义的主题过滤策略.实验结果表明,基于遗传算法的主题爬虫抓取网页中的主题相关网页数量多,在合理选择种子集合时,能够抓取大量的主题相关度高的网页.

关 键 词:主题爬虫  遗传算法  主题相关度  本体语义

Focused Crawling Technology Research Based on Genetic Algorithm
Guan Huifen,Shi Jun,Ma Jihong.Focused Crawling Technology Research Based on Genetic Algorithm[J].Computer and Digital Engineering,2008,36(10).
Authors:Guan Huifen  Shi Jun  Ma Jihong
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号