首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
一种基于PageRank的页面排序改进算法   总被引:3,自引:0,他引:3  
首先对PageRank算法进行了分析,探讨了国外现有的基于链接结构的改进算法.在此基础上,指出PageRank算法平均分配PageRank值影响了网页的排序质量,提出了一种不平均分配PageRank值的改进算法NPR,并对改进算法进行测试及分析.实验证明,NPR的排序结果比PageRank提高了约11.2%的相关度.  相似文献   

2.
一种基于主题相关度的网页排序算法   总被引:1,自引:0,他引:1  
针对现有基于链接结构的PageRank算法的不足,提出了基于网页主题相关度的改进PageRank算法.通过分析网页内容,提取出网页中的链接及其对应的锚文本,建立网页链接库,利用向量空间模型(VSM)计算链接锚文本和网页内容的相关度,在此基础上实现离线计算改进后的PageRank算法.理论分析和仿真实验表明,改进的PageRank算法使用户能方便地找到所需网页,提高了网页查询效率.  相似文献   

3.
本文介绍了Web结构挖掘的基本概念,分析了HITS和PageRank算法,并对这两种算法进行了比较,最后探讨了基于这两种算法的改进算法.  相似文献   

4.
文中通过对PageRank算法的详细分析,以及对随机冲浪模型的讨论,介绍了基于Google PageRank算法的围棋棋手排名方法,根据棋手的PageRank值对棋手进行排名。从实验的客观性和稳定性上对排名结果进行分析,实验结果表明该算法在围棋棋手排名上具有良好的客观性和稳定性。  相似文献   

5.
在对PageRank算法进行研究的基础上,利用MapReduce编程模型思想对PageRank算法进行改进,设计了在云平台Hadoop环境下运行的基于MapReduce的PageRank分布式并行算法,并在实验中对不同规模的Web图数据集进行了测试,分析不同的Blocksize参数对于算法计算性能的作用以及集群节点数目对于算法运行效率的影响.  相似文献   

6.
《信息技术》2017,(1):76-79
微博用户影响力排名现主要以粉丝数为依据,但这种方法并不公正,针对这一问题,文中基于PageRank算法,提出一种基于PsoRank的评价算法。算法从用户自身质量及其粉丝质量入手,以粉丝数量、粉丝质量、评论率、转发率为因素,计算用户PIR值。最后,算法在Hadoop平台下实现,结果表明该算法相对于粉丝数量排名算法以及PageRank算法更能够反映用户真正的影响力。  相似文献   

7.
本文首先分析搜索引擎的基本原理,然后主要介绍经典的PageRank算法,之后基于该算法对搜索引擎优化方法进行探讨.  相似文献   

8.
为了解决轨道交通选址规划根据静态要素进行选点的问题,提出基于改进PageRank算法来选择城市轨道交通站点。基于移动用户出行数据构建有向带权值的用户出行网络,采用改进PageRank算法识别网络的关键节点,以此作为轨道交通规划的核心站点,根据与核心站点相连的节点的拓扑结构判断轨道交通的"桥接"站点位置,以确定轨道交通的路径走向。实验结果表明,基于改进PageRank算法的城市轨道交通站点选址规划方法能够高效、科学地识别轨道交通规划的核心站点和"中转"站点,提高了城市轨道交通站点选址的准确性。  相似文献   

9.
《信息技术》2016,(6):107-110
为了提高代理缓存的性能,提出了基于PageRank的缓存替换策略。该算法是从用户访问行为对文件对象价值具有影响的角度提出的,该算法首先将用户和文件对象类比为网络中的节点,将用户和文件对象之间的访问关系抽象为网络中的连线,然后采用PageRank算法计算文件和用户的权重值,最后在需要进行缓存替换时,优先替换文件权重值小的文件。仿真实验的结果表明,相对于LFU算法,该算法具有较高的请求命中率和字节命中率。  相似文献   

10.
本文首先介绍了基于超链接结构的网页排序的思想和算法,重点介绍了PageRank算法和HITS算法,比较分析了二者的不同,进而指出了链接分析排序的优缺点.随后,笔者引入了语义网检索排序的原理及模型,认为提出建立面向语义网的搜索引擎技术,可以更好地改进网页排序.  相似文献   

11.
由于PageRank算法在计算过程中没有考虑垃圾页面对网页排序结果的影响,论文对PageRank算法进行了改进,使其在计算过程中为垃圾页面及其链接页面传递较低的Pr值。实验表明,改进后的算法明显降低了垃圾页面对网页排序结果的影响,提高了页面问的相关度和区分度。  相似文献   

12.
Social influence is the key factor to drive information propagation in online social networks and can be modeled and analyzed with social networking data.As a kind of classical personal influence algorithm,two parallel implementation versions of a PageRank based method were introduced.Furthermore,extensive experiments were conducted on a large-scale real dataset to test the performance of these parallel methods in a distributed environment.The results demonstrate that the computational efficiency of the personal influence algorithm can be improved significantly in massive data sets by virtue of existing big data processing framework,and provide an empirical reference for the future research and optimization of the algorithm as well.  相似文献   

13.
文本向量化是将文本转化为向量的代数模型建立过程,在文本处理领域具有重要的应用价值,是文本数据挖掘算法的关键环节。在著名的PageRank算法基础上,提出一种基于句中词语间关系的文本向量化算法。通过引入语义层面的词语关联来克服传统的基于词频统计数据的向量化方法语义敏感度不佳的缺陷。在不同的语料测试集上的实验表明,基于句中词语间关系的文本向量化算法有更高的准确率。  相似文献   

14.
社交网络中用户和用户之间通过关注而产生联系形成社区。因此,文中借鉴PageRank算法,将传统上把影响力平均分配给关注的人的做法加以改进,依据用户间的亲密程度将影响力按比例分配给关注的人,从而生成新的UserRank算法。算法经过多次迭代计算后,社区中每个用户的影响力收敛并趋于稳定,影响力值最大的用户,就是社区领袖。实验表明,本算法能更快更有效地挖掘出社区领袖。  相似文献   

15.
Web超链接分析算法研究   总被引:1,自引:0,他引:1  
随着信息技术的发展,特别是互联网技术的不断普及,网上信息数量呈指数级增长。如何准确有效地从海量信息中检索出所需的信息,成为一个重要而迫切的研究课题。文中分析了两种基本的Web超链接分析算法:PageRank算法和HITS算法,并指出了各自的特点。最后指出了Web超链接分析算法的改进方向和发展趋势。  相似文献   

16.
In the traditional method, the software quality is measured by various metrics of the software, such as decoupling level (DL), which can be used to predict software defect. However, DL, which treats all the ?les equally, has not taken file importance into consideration. Therefore, a novel software quality metric, named as improved decoupling level (IDL), based on the importance of documents was proposed. First, the PageRank algorithm was used to calculate the importance of ?les to obtain the weights of the dependencies, and then defect prediction models was established by combining the software scale, dependencies, scores and software defects to assess the software quality. Compared to most existing module-based software quality evaluation methods, IDL has similar or even superior performance in the prediction of software quality. The results indicate that IDL measures the importance of each ?le in the software more accurately by combining the PageRank algorithm in DL, which indirectly re?ects the quality of software by predicting the bug information in software and improves the accuracy of prediction result of software bug information.  相似文献   

17.
针对ASON网络业务量逐渐增大,而现有的保护机制使得有限的波长资源利用率不高的问题,基于ASON网络的小世界特征和无尺度特征,提出了一个新的保护策略-相对重要性节点(边)优先保护策略,该算法在利用PageRank算法挖掘出ASON网络上相对重要的节点以及边的情况下,对这些重要节点和边进行优先保护的方法,实现了在ASON网络上波长资源高效利用.通过实验仿真,验证了该保护策略可以极大地提高网络的性能,使得网络阻塞率减低,提高网络资源利用率.  相似文献   

18.
The testing industry need to prioritize the limited resources and focus on testing modules whose failure is mostly likely to cause faults.This paper discusses a method that can rank modules in a software package for integrate testing using the PageRank algorithm.In this algorithm,a sequences of random walks iteratively can find a high likelihood of encountering a node,which is interpreted as it being an important performance resource.An experiment result prove that the proposed method actually can be used to prioritize testing of specific modules when testing resource are scarce.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号