首页 | 本学科首页   官方微博 | 高级检索  
     

基于Context Graphs的主题爬虫的研究与实现
引用本文:陈星.基于Context Graphs的主题爬虫的研究与实现[J].计算机工程与设计,2011,32(3):914-917.
作者姓名:陈星
作者单位:中国科学院软件研究所,北京,100190;中国科学院研究生院,北京,100049
摘    要:为了解决传统主题爬虫对主题网页搜索效率偏低的问题,分析了基于网络拓扑结构建模的Context Graphs的爬行策略。考虑了以往ContextGraphs方法存在的不足,即没有区分网页不同部分文本的重要程度,通过将锚文字、页面标题和页面内容做综合考虑,对原算法进行了改进。将改进前后的算法进行实验对比,实验结果表明,在提高主题爬行质量方面,改进后的算法达到了更好的效果。

关 键 词:主题爬虫  Context  Graphs模型  层次建模  链接分析  内容分析

Research and implementation of focused crawler using Context Graphs
CHEN Xing.Research and implementation of focused crawler using Context Graphs[J].Computer Engineering and Design,2011,32(3):914-917.
Authors:CHEN Xing
Affiliation:CHEN Xing1,2(1.Institute of Software,Chinese Academy of Sciences,Beijing 100190,China;2.Graduate University,Chinese Academy of Sciences,Beijing 100049,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号