首页 | 本学科首页   官方微博 | 高级检索  
     

面向Blog的爬行算法
引用本文:李卫疆,赵铁军. 面向Blog的爬行算法[J]. 计算机工程与应用, 2008, 44(31): 1-3. DOI: 10.3778/j.issn.1002-8331.2008.31.001
作者姓名:李卫疆  赵铁军
作者单位:昆明理工大学,云南省计算机应用重点实验室,昆明,650051;哈尔滨工业大学,计算机科学与技术学院,哈尔滨,150001
摘    要:由于通用搜索引擎的综合性,不具备面向专业的特点,所以在准确性和速度等方面存在不足。因此针对Blog这个全新领域,提出了一个面向Blog的网络爬行器算法,为Blog语料搜集以及相关Blog研究提供了方便。

关 键 词:博客(Blog)  爬行器  算法
收稿时间:2008-05-19
修稿时间:2008-6-30 

New algorithm of Blog-oriented crawler
LI Wei-jiang,ZHAO Tie-jun. New algorithm of Blog-oriented crawler[J]. Computer Engineering and Applications, 2008, 44(31): 1-3. DOI: 10.3778/j.issn.1002-8331.2008.31.001
Authors:LI Wei-jiang  ZHAO Tie-jun
Affiliation:1.Computer Application Key Lab. of Yunnan Province,Kunming University of Science and Technology,Kunming 650051,China 2.School of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China
Abstract:The general crawler provides a great many help to people for finding information in Web.However,it has some drawback in terms of precision and efficiency because of it’s generality and no specialty.Blog,as an emerging phenomenon of the Internet,has been concerned by more and more people.The authors propose a new algorithm of Blog-oriented Web crawler through considering “Blog” as a special “subject”.
Keywords:Blog  crawler  algorithm
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号