首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
基于Lucene 网页排序算法的改进   总被引:2,自引:1,他引:2  
在分析现有的词频位置加权排序法、Direct Hit算法、PageRank算法和Lucene的网页排序算法后,将这三种著名的算法思想运用到Lucene的网页排序算法中,并设计了一个基于Lucene的糖业专业搜索引擎,重点介绍该搜索引擎的检索功能。最后,通过在所设计好的糖业专业搜索引擎进行实验,验证改进后Lucene的网页排序算法,实验结果表明改进后的排序算法能够提高检索结果的质量,能够更准确地将结果信息反馈给用户。  相似文献   

2.
网页排序技术在搜索引擎中有着重要作用,它在一定程度上决定了搜索引擎的质量。概括了网页排序算法,详细分析了目前已知的各种排序方法的基本思想和技术特点,并比较了它们的优缺点,最后指出了网页排序技术的发展思路。  相似文献   

3.
传统的网页排序算法有多种,比如PageRank算法、HITS算法等,这些算法虽然在评价网页权威性方面体现出一定的优势,但也存在不足,要么对网页更新率的利用不够充分,要么对用户对网页的回复、转载等客观因素有所忽略。因此本文就提出一种以网站影响力与用户满意度为基础的网而排序算法。  相似文献   

4.
通过对网页用户角色的分析发现,传统的基于PageRank算法的搜索引擎结果排序欠佳,是因为其没有兼顾所有角色对网页重要性的评价。为此,提出一种结合了所有角色评价的综合网页排序算法——ComPageRank(CPR)算法和一种基于点击量分析的Click- throughRank(CTR)算法。实验结果表明,相比PageRank为代表的网页排序算法,CPR算法更全面、合理。  相似文献   

5.
谢蕙 《福建电脑》2012,28(5):85-86
主要对现有主流搜索引擎结果排序技术进行了研究,分析了对其各自的优缺点,并在此基础上总结了搜索引擎结果排序算法的研究趋势。  相似文献   

6.
经典的基于链接结构的PageRank算法,它主要是依据页面之间的链接关系进行排序,容易出现主题漂移、忽视专业站点、偏重旧网页等缺点。针对这些问题,从超文本相关性、基于网站权威性权重因子和时间权重方面提出改进。实验结果表明,与传统的PageRank排序算法相比,改进算法能有效提高查准率,提高用户对排序结果的满意度。  相似文献   

7.
展开了对互联网搜索引擎结果集的智能排序研究,提出了一种基于扩展网页质量和VIPS分块算法的智能网页排序算法,并对结果进行净化处理以及查询优化。实验结果表明研究提出的新算法提高了推荐精度。  相似文献   

8.
一种基于社会性标注的网页排序算法   总被引:2,自引:0,他引:2  
社会性标注作为一种新的资源管理和共享方式,吸引为数众多的用户参与其中,由此产生的大量社会性标注数据成为网页质量评价的一个新维度.文中研究如何利用社会性标注改进网页检索性能,提出一种有机结合网页和用户的查询相关性与互增强关系的网页排序算法.首先利用统计主题模型,使用相关标签为网页和用户建模,并计算查询相关性.然后利用二部图模型刻画网页和用户间的互增强关系,并使用相关标签与用户兴趣和网页内容的匹配度为互增强关系赋予权重.最后结合查询相关性和互增强关系,以迭代方式同时计算网页和用户的评分.实验结果表明,文中提出的检索模型和互增强模型能够有效地提高排序算法的性能.与目前的代表性算法相比,该算法在检索性能上有明显提高.  相似文献   

9.
由于网络上信息数量庞大,多元搜索引擎可能会产生一个相当大的结果集,本文借鉴了Web挖掘中聚类算法FCMA和网页排序算法HITS的技术和思想,改进了多元搜索引擎的结构,以提高系统的查询效率.  相似文献   

10.
随着web技术的发展,好的网页排序算法越来越重要.本文主要讨论了网页排序应当考虑的因素如网页更新时间等.在对这些因素进行分析之后,本文提出了一种基于文本分类的网页排序算法.这个算法能很好地优化查询结果,提高搜索引擎的性能.  相似文献   

11.
一种基于用户标记的搜索结果排序算法   总被引:1,自引:0,他引:1  
随着计算机网络的快速发展,网络上的信息量也日益纷繁复杂.如何准确、快速地帮助人们从海量网络数据中获取所需信息,这是目前搜索引擎首要解决的问题,为此,各种搜索排序算法应运而生.但是目前,网页信息的表达形式都十分简单,用户描述查询的形式更是十分简单,这就造成了在判断网页内容与用户查询相关性时十分困难.首先对现有的搜索引擎排序算法进行了分类总结,分析它们的优缺点.然后提出了一种基于用户反馈的语义标记的新方法,最后采用多种评估方法与Google搜索结果进行对比分析.实验结果表明,利用该方法所得到的排序结果比Google的排序结果更接近用户需求.  相似文献   

12.
针对PageRank算法忽略了页面内容的不足,根据用户浏览页面的习惯,将Web内容挖掘的页面相似度引入到算法中,对其进行改进。实验结果表明,改进后的算法可以使页面的PageRank值依据页面相似度发生变化,符合人们的一般期望,效果明显有效。  相似文献   

13.
白亮  于天元  刘湜  老松杨  杨征 《计算机科学》2016,43(10):220-224
搜索引擎的性能优劣主要由排序结果决定。针对网页文本特性改进了谱聚类方法,提出了一种融合网页内容和链接质量的排序算法。利用改进的谱聚类方法对网页内容进行分类,并与评价链接质量的PageRank值进行加权融合,计算得到排序结果。实验结果表明,相对于传统的PageRank,HITS,TF-IDF等排序算法,所提算法返回的排序结果具有更高的相关性。  相似文献   

14.
针对基本和声搜索算法的不足,提出一种改进的和声搜索算法.首先在和声搜索算法的记忆库中加入权重,减少搜索的随机性;其次让扰动方程中的带宽具有自适应性,从而提高原算法的鲁棒性和收敛速度.算法在计算机上予以实现,并通过一系列测试函数求解,验证了改进算法与基本和声搜索算法及其他智能算法相比,能得到更多的最优解和较小的方差.  相似文献   

15.
提出一种新的网页排序方法-ClusterRank方法。该方法先对检索结果进行文本挖掘,然后利用Web网页的链接信息以及用户点击率对网页重要性的影响对挖掘结果进行排序。该算法可以引导用户进一步明确其检索需求。  相似文献   

16.
17.
Pagerank是评定网页等级的一种比较流行、比较重要的方法,但是随着网页数量指数增加,爬行所有的有用的网页变得越来越困难,结果是,网页的等级值的计算仅仅依靠整个网络中的一个子集,这样产生了不正确结果。因为存在不完整的信息(悬挂页面),这个情况是存在于计算当中的,为了克服这个不完整性,文章提出了pagerank算法的一种改进——页面预测分类法,并对此算法进行效率分析。这可以将不同类别的悬挂页面进行特殊的分析以至于整个链接结构能够比较准确的预测,而且,实验结果显示:与先前的pagerank算法相比这个算法达到了令人比较满意的结果。  相似文献   

18.
链状解析算法已经被广泛应用于网络信息检索.然而,当前的链状解析算法通常用于平面链状图,忽略了网络的分层结构.这会导致两个问题的出现:链状结构越来越少和比较偏向于上层网页.文中提出了一个能够解决这两个问题的新排序算法,叫做分层排序,这种算法可以用于网络中的分层结构和链状结构.在实验结果中显示分层排序算法持续超过了其它知名排序算法,其中包括网页排序算法、块排序算法和层次排序算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号