首页 | 本学科首页   官方微博 | 高级检索  
     

基于网页内容和链接价值的相关度方法的实现
引用本文:郑国良,叶飞跃,张滨,林国俊.基于网页内容和链接价值的相关度方法的实现[J].计算机工程与设计,2008,29(23).
作者姓名:郑国良  叶飞跃  张滨  林国俊
作者单位:上海大学,计算机工程与科学学院,上海200072
摘    要:专业搜索引擎提供特定主题的信息检索服务,是新一代搜索引擎的发展方向之一,而网页主题相关度分析是专业搜索引擎的核心技术,它指导着robot进行有价值的搜索,专门搜索与主题相关的页面;提出_种综合的网页主题相关度分析方法,方法同时对网页内容价值和链接价值进行了考察,从而保证了robot搜索的网页与主题有着较高的相关度;在网页内容价值评价时,对传统的方法进行了改进,新的方法能高好的实现.该方法也用于服装行业的搜索引擎,效果明显.

关 键 词:主题爬虫  专业搜索  网页内容分析  链接分析  特征词

Realization of method of related subject based on page content value and link value
ZHENG Guo-liang,YE Fei-yue,ZHANG Bin,LIN Guo-jun.Realization of method of related subject based on page content value and link value[J].Computer Engineering and Design,2008,29(23).
Authors:ZHENG Guo-liang  YE Fei-yue  ZHANG Bin  LIN Guo-jun
Affiliation:ZHENG Guo-liang,YE Fei-yue,ZHANG Bin,LIN Guo-jun(School of Computer Engineering , Science,Shanghai University,Shanghai 200072,China)
Abstract:Special search engine provides service of informational retrieval in special area, and this technology is one of the hot topic in search engine recent years.And the analysis of related subject is the key of the special search engine, it conducts the net robot search valuable pages, only search the related subjectpage.A methods of integrated page related subjectevaluation is proposed, whichconsider the page content value and page link value in the same time, and guarantee the web robot do a value search.When...
Keywords:focused robot  special search  web-text evaluation  link analysis  special words  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号