首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 93 毫秒
1.
搜索引擎PageRank算法研究   总被引:5,自引:0,他引:5  
在研究搜索引擎关键技术的基础上,深入细致地剖析了著名搜索引擎Google的链接分析排名算法PageRank算法,解说其运行原理并给出改进算法.在此基础上指出PageRank算法存在的缺陷,从而针对性地提出了优化方案,实验结果表明,改进的算法有利于提高算法的运行效率,提高用户对检索结果的查准率.  相似文献   

2.
领域相关自适应的PageRank算法搜索策略   总被引:1,自引:0,他引:1  
潘昊  谭龙远 《计算机应用》2008,28(9):2192-2194
针对Web链接结构模型的特点,提出了一种新的基于领域相关可自适应的PageRank算法。实验结果表明,改进后的算法有效节约了CPU资源,缩短了计算时间,同时较好地解决了主题漂移现象。  相似文献   

3.
PageRank算法研究   总被引:17,自引:0,他引:17  
黄德才  戚华春 《计算机工程》2006,32(4):145-146,162
深入剖析了著名搜索引擎Google的关键技术PageRank算法,介绍分析了该算法的当前发展现状。并针对PageRank算法容易出现主题漂移现象,利用提出的二阶相似度改进算法。实验表明,改进的算法有利于减少主题漂移现象,提高用户对检索结果的满意度。  相似文献   

4.
搜索引擎技术的发展是随着电子技术不断进步而形成的信息数字化和数据网络化的必然产物。Google搜索引擎依靠其PageRank机制及收敛算法一直处于该领域的领先地位。本文介绍了PageR- ank算法的起源和发展。对其概念与方法进行了阐述,并讨论了它的应用情况。  相似文献   

5.
基于网页链接和内容分析的改进PageRank算法   总被引:9,自引:0,他引:9       下载免费PDF全文
结合网页链接分析和网页内容相关性分析提出一种改进的PageRank算法EPR(Extended PageRank),从分析网页内容相似性的角度解决相关性需求,从网页链接分析的角度解决权威性需求。算法为扩展PageRank提供了广阔的空间,并且实验证明,通过选择合适的参数EPR算法可以获得优于传统PageRank算法的排序结果。  相似文献   

6.
现有PageRank算法的多种改进研究,对新网页歧视、语言差异歧视、主题漂移、忽视用户浏览兴趣等问题仍然没有给出较好的解决方案。本文提出改进算法TWPR(PageRank based on Three Weights)。该算法将时间特性分析、语言链接结构分析和用户行为相结合,旨在提升更新较快、链接行为优良、用户感兴趣度高的中文网页PR值。实验证明,改进算法可有效提高网页检索的命中率,改善搜索质量。  相似文献   

7.
研究了现有的基于链接结构的PageRank算法。结合网页链接分析和网页内容相关性分析提出了一种改进的PageRank算法,从分析网页内容相关性的角度解决相关性需求,从网页链接分析的角度解决权威性需求,并且实验证明,改进的PageRank算法优于传统的PageRank算法的排序结果。  相似文献   

8.
为了克服PageRank在搜索过程中重复性地把当前受欢迎的网页放在搜索结果的首要位置,而不受欢迎的网页被大多数用户忽略的问题,采用了一种改进的评估函数及有效的用户模型,获得了一个新的PageRank优化算法。实验结果表明,该算法达到了较好的公平性。  相似文献   

9.
为了提高PageRank算法的计算效率, 提出了基于块结构划分的方法, 将网页之间的链接关系转换成网络块间的关系, 减少了map和reduce操作的调用次数, 降低了I/O传输造成的开销, 提高计算的效率。实验证明, 该方法具有一定的优越性。  相似文献   

10.
PageRank算法的优化和改进   总被引:4,自引:2,他引:2       下载免费PDF全文
在PageRank算法中是使用乘幂法对网络链接图的Markov矩阵进行迭代计算,利用迭代矩阵A=[CP+(1-cE]T中Google矩阵P的稀疏性,优化每次迭代的计算量并且减少空间存储量。在乘幂法证明理论基础上,提出了一种修正的外推方法称为线性外推法,并且利用Google矩阵的第二特征值的性质,使得在乘幂法的计算过程中达到快速收敛。从而在不增加空间存储的基础上缩短计算时间。最后结合实际数据测试,说明理论推导的结果达到了良好的实际使用效果。  相似文献   

11.
基于主题特征和时间因子的改进PageRank算法   总被引:2,自引:0,他引:2  
经典PageRank算法单纯地考虑到对网页的链接结构进行分析,而不能考虑到网页在搜索主题方面的相关性和权威性,以及用户对新旧网页的依赖程度的不同.针对经典PageRank算法存在的上述缺陷,综合网页的主题特征和时间特征两个因素,提出了一种改进的PageRank算法WTPR(weighmd topic PageRank).该算法通过网页链接分析和内容分析来解决网页的权威程度和相关程度,通过时间因子实现PageRank值随时间的变动而浮动.仿真结果表明,改进后的算法与PageRank算法相比获得了更好的效果.  相似文献   

12.
针对串行PageRank算法在处理海量网页数据时效率低下的问题,提出一种基于网页链接分类的PageRank并行算法.首先,将网页按照网页所属网站分类,为来自不同站点的网页设置不同的权重;其次,利用Hadoop并行计算框架,结合MapReduce分而治之的特点,并行计算网页排名;最后,采用一种包含3层:数据层、预处理层、计算层的数据压缩方法,对并行算法进行优化.实验结果表明,与串行PageRank算法相比,所提算法在最好情况下结果准确率提高了12%,计算效率提高了33%.  相似文献   

13.
应用Web结构挖掘的PageRank算法的改进研究   总被引:1,自引:0,他引:1       下载免费PDF全文
随着Internet技术的发展,Web网页成为人们获取信息的有效途径,Web数据挖掘逐渐成为研究的热点。基于Web结构挖掘的PageRank算法存在不足的情况下,提出了一种改进的算法,实验结果证明改进的算法较原算法具有较好的效果,具有一定的实用价值。  相似文献   

14.
dPageRank--一种改进的分布式PageRank算法   总被引:3,自引:0,他引:3  
陈再良  凌力  周强 《计算机应用》2006,26(1):21-0024
回顾了传统的PageRank计算方式,分析了等级泄漏和悬挂页面问题的解决方法。介绍了分布式PageRank的计算原理和评价原则,在分析两种现有分布式PageRank算法的基础上,提出了一种改进的分布式PageRank算法,通过实验对该算法的性能进行分析评价。  相似文献   

15.
基于PageRank的页面排序改进算法   总被引:2,自引:3,他引:2  
首先对PageRank算法进行了一般性介绍,研究了现有的基于链接结构的改进算法.在此基础上,指出PageRank算法给不同网页分配相同的Pagegank值影响了网页的排序质量,提出了一种基于多层分类技术的改进算法HCPR,并对PageRank和HCPR算法进行了相应测试和比较.实验结果表明,HCPR的排序结果比PageRank提高了约15.3%的相关度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号