首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于主题相关度的网页排序算法
引用本文:吴炜,梁昆,李瑞轩,辜希武,卢正鼎. 一种基于主题相关度的网页排序算法[J]. 微电子学与计算机, 2008, 25(9)
作者姓名:吴炜  梁昆  李瑞轩  辜希武  卢正鼎
作者单位:华中科技大学,计算机科学与技术学院,湖北,武汉,430074
基金项目:国家自然科学基金,国家高技术研究发展计划(863计划)
摘    要:针对现有基于链接结构的PageRank算法的不足,提出了基于网页主题相关度的改进PageRank算法.通过分析网页内容,提取出网页中的链接及其对应的锚文本,建立网页链接库,利用向量空间模型(VSM)计算链接锚文本和网页内容的相关度,在此基础上实现离线计算改进后的PageRank算法.理论分析和仿真实验表明,改进的PageRank算法使用户能方便地找到所需网页,提高了网页查询效率.

关 键 词:网页排序  主题相关度  链接分析  向量空间模型

A Page Ranking Algorithm Based on Topic Similarity
WU Wei,LIANG Kun,LI Rui-xuan,GU Xiwu,LU Zheng-ding. A Page Ranking Algorithm Based on Topic Similarity[J]. Microelectronics & Computer, 2008, 25(9)
Authors:WU Wei  LIANG Kun  LI Rui-xuan  GU Xiwu  LU Zheng-ding
Abstract:Taking the shortages of the PageRank algorithm into account,this paper proposes an improved PageRank algorithm based on the anchor text and relevance to the web pages.Through analyzing the contents of web pages,it can extract the links and its corresponding anchor texts in the pages and create page link library.The vector space model(VSM) is used to calculate the similarity of the anchor texts and the relevant pages,and achieve the improved offline PageRank algorithm.The theoretical analysis and numerical simulation illustrate that the improved PageRank algorithm not only guides users to find out useful information easily,but also gets better performance of query efficiency.
Keywords:page ranking  topic similarity  hyperlink analysis  vector space model
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号