首页 | 本学科首页   官方微博 | 高级检索  
     

一种垂直搜索引擎主题相关性改进算法
引用本文:陈丽萍.一种垂直搜索引擎主题相关性改进算法[J].数字社区&智能家居,2009(29).
作者姓名:陈丽萍
作者单位:安徽省巢湖学院计算机系;
基金项目:陕西省自然科学基础研究计划项目(2007F52)
摘    要:迅速发展的Web给传统的搜索引擎带来了前所未有的挑战,面向特定主题或特定领域采集相关信息的垂直搜索引擎应运而生。在垂直搜索引擎中,网络蜘蛛的爬行策略和主题相关性判定算法是其核心。该文详细介绍了一种主题相关性判定算法-Hits算法,并在此基础上提出了一个改进的主题相关性判定算法,实验表明,改进的Hits算法提高了爬取网页的主题相关度,有助于网络蜘蛛爬取特定主题的信息。

关 键 词:垂直搜索引擎  网络蜘蛛  主题相关性  hits算法  

An Improved Topic Relevance Algorithm for Vertical Search Engines
CHEN Li-ping.An Improved Topic Relevance Algorithm for Vertical Search Engines[J].Digital Community & Smart Home,2009(29).
Authors:CHEN Li-ping
Affiliation:CHEN Li-ping(Department of Computer Science , Engineering,Chaohu College,Chaohu 238000,China)
Abstract:The tremendous growth of web has posed unprecedented challenges for the traditional search engines. Vertical search engines which collect relevant page information of specific topic emerged consequently.The crawling strategy and topic relevance algorithm of web spider is the core for vertical search engines.The article introduce the Hits algorithm detailedly and a new improved HITS algorithm is proposed. Experiments show that the proposed HITS algorithm can improve relevance ratio.It is helpful for crawling...
Keywords:vertical search engine  Web spider  topic relevance  hits algorithm  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号