首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
网页排序技术在搜索引擎中有着重要作用,它在一定程度上决定了搜索引擎的质量。概括了网页排序算法,详细分析了目前已知的各种排序方法的基本思想和技术特点,并比较了它们的优缺点,最后指出了网页排序技术的发展思路。  相似文献   

2.
该文就搜索引擎中链接结构算法问题进行研究,分析了PageRank和HITS两种不同的算法,并对算法中明显的缺陷提出了改进措施。通过测试,验证使用改进的算法在搜索质量等方面有明显提高。  相似文献   

3.
搜索引擎PageRank算法研究   总被引:5,自引:0,他引:5  
在研究搜索引擎关键技术的基础上,深入细致地剖析了著名搜索引擎Google的链接分析排名算法PageRank算法,解说其运行原理并给出改进算法.在此基础上指出PageRank算法存在的缺陷,从而针对性地提出了优化方案,实验结果表明,改进的算法有利于提高算法的运行效率,提高用户对检索结果的查准率.  相似文献   

4.
搜索引擎技术的发展是随着电子技术不断进步而形成的信息数字化和数据网络化的必然产物。Google搜索引擎依靠其PageRank机制及收敛算法一直处于该领域的领先地位。本文介绍了PageR- ank算法的起源和发展。对其概念与方法进行了阐述,并讨论了它的应用情况。  相似文献   

5.
面向垂直搜索引擎的主题提取算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对HITS算法对所有链接分配相等权重导致产生主题漂移的问题,提出基于计算链接价值度及Web页面语义主题相似度对链接分配合理权重的HITS改进算法,突出链接重要度的差异。实验表明,该算法的主题相关度提高了13%~42%,且较好地避免了主题漂移问题,增强了采集信息的准确性,对垂直搜索引擎的研究有重要的理论和实际应用价值。  相似文献   

6.
结构挖掘中web有向图模型的改进算法   总被引:1,自引:0,他引:1  
倪现君 《微计算机信息》2007,23(36):163-165
本文研究了现有的web结构挖掘系统,并在对其核心算法PageRank和HITS中所存在的问题作了详细分析,主要是对每个网页定义这三个参数:PageRank、Authority,Hub,并进行分析,并提出了自己的改进算法。  相似文献   

7.
基于PageRank算法和HITS算法的期刊评价研究   总被引:1,自引:0,他引:1  
由31种计算机技术类核心期刊形成期刊引文网络,利用PageRank算法和HITS算法分别计算其PageRank值、权威值(authority)和中心值(hub)。通过与影响因子的对比研究,讨论了PageRank值、权威值、中心值和影响因子用于期刊评价的区别和优缺点。实例结果表明期刊影响因子的排名与PageRank算法、HITS算法的结果排名略有差距,说明不同的评价算法反映出不同的期刊评价目的。  相似文献   

8.
白亮  于天元  刘湜  老松杨  杨征 《计算机科学》2016,43(10):220-224
搜索引擎的性能优劣主要由排序结果决定。针对网页文本特性改进了谱聚类方法,提出了一种融合网页内容和链接质量的排序算法。利用改进的谱聚类方法对网页内容进行分类,并与评价链接质量的PageRank值进行加权融合,计算得到排序结果。实验结果表明,相对于传统的PageRank,HITS,TF-IDF等排序算法,所提算法返回的排序结果具有更高的相关性。  相似文献   

9.
随着Internet的迅猛发展,Web成为了人们获取信息的重要途径。但是,网页数量的与日剧增,信息量的爆炸式增长,也为人们的信息查询带来了不便。Web数据挖掘技术的引入提高了检索质量,特别是Web结构挖掘在搜索引擎中的应用,很好地帮助用户快速从搜索结果中锁定对自己真正有用的信息。本文对基于结构挖掘的排序算法进行了大量搜集分析,并进行了归纳总结。  相似文献   

10.
PageRank算法研究   总被引:17,自引:0,他引:17  
黄德才  戚华春 《计算机工程》2006,32(4):145-146,162
深入剖析了著名搜索引擎Google的关键技术PageRank算法,介绍分析了该算法的当前发展现状。并针对PageRank算法容易出现主题漂移现象,利用提出的二阶相似度改进算法。实验表明,改进的算法有利于减少主题漂移现象,提高用户对检索结果的满意度。  相似文献   

11.
HITS算法探究     
随着互联网的快速发展,搜索引擎的应用已经变得非常广泛,但是却很少有人能够对搜索引擎的算法设计知道多少。通过对搜索引擎的算法设计思想及原理的了解,将更加有助于提供高我们的信息检索能力。文章主要就搜索引擎算法中的HITS算法进行简要的分析。  相似文献   

12.
孔德镛  张建军 《计算机工程》2010,36(19):203-204,207
针对元搜索引擎的查准率等问题,分析专业元搜索引擎返回结果的专业相关度问题,提出一种基于遗传算法的网页排序算法,讨论算法的原理及实现过程。在独立搜索引擎返回结果中,挖掘除位置信息以外的其他信息,利用遗传算法建立专业网页相关度模型,对网页的专业相关度进行计算。实验结果表明该算法效果较好。  相似文献   

13.
针对P2P全文搜索网络效率低和搜索等待时间长的问题,提出基于k-高频词主题相关性的搜索路由算法,该算法采用k-高频词表示主题,在主题间建立连接,形成主题相关网络。在该网络中,优先将搜索请求路由到拥有较多资源的节点上,从而用较少的时间和网络通信量搜索到较多资源。结果表明,相对于“简单洪泛”算法,该算法在搜索等待时间、减少网络通信量方面表现更优,具有更高的效率。  相似文献   

14.
Hadoop下的分布式搜索引擎①   总被引:1,自引:0,他引:1  
分析了Hadoop系统结构,提出一种改进的PageRank算法,使用Map/Reduce模式设计系统模块。实验证明,使用Hadoop框架能够设计出具有高性能、高可靠性和易扩展性的分布式搜索引擎。  相似文献   

15.
搜索引擎剖析   总被引:8,自引:0,他引:8  
刘琨  郑有才 《微机发展》2004,14(3):19-22
搜索引擎相关技术的研究是目前互联网的热门研究课题。现有搜索引擎利用了大量的计算机研究成果,了解现有搜索引擎的优点和不足同时在实现的搜索引擎中扬长避短,对搜索引擎的剖析是非常必要的。文中指出Google的PageR ank技术在处理超链接双向影响上的不足。在实现搜索引擎的过程中,充分利用分析的结果改进PageRank算法,从而充分利用网页间的超链接信息提高了搜索结果的有效性。  相似文献   

16.
网络结构挖掘是以超链接分析为基础,从链接结构中获取有用的知识,利用这些知识,重新组织结构,使内容逻辑结构更加合理.深入研究现有的网络结构挖掘系统,并在对其核心算法PageRank和HITS中所存在的问题作了详细分析的基础上提出了自己的改进算法,主要是对每个网页定义这三个参数:PageRank,Authority,Hub,并进行分析与优化,以便得到更好的查询结果,最后设计了一个改进网络结构挖掘系统原型,根据实验结果进行分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号