首页 | 本学科首页   官方微博 | 高级检索  
     

基于领域本体的网络爬虫
引用本文:林春杰,金苗娟.基于领域本体的网络爬虫[J].电脑编程技巧与维护,2020(5):20-22.
作者姓名:林春杰  金苗娟
作者单位:洛阳师范学院信息技术学院;洛阳师范学院公共外语教研部
摘    要:主题爬虫能够高效的获取特定主题的网页,是垂直搜索引擎核心技术之一。提出了一个基于领域本体的主题爬虫框架,借助基于领域本体的相关度计算方法预测链接主题的相关度和网页内容与主题的相关度,决定爬虫的下一步爬行路径,以便于尽可能缩小搜索路径。对比实验表明,提出的方法能够有效提高主题爬虫网页抓取的准确率和查全率。

关 键 词:领域本体  主题爬虫  链接分析  主题相关度
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号