首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
基于Lucene 网页排序算法的改进   总被引:3,自引:1,他引:2  
在分析现有的词频位置加权排序法、Direct Hit算法、PageRank算法和Lucene的网页排序算法后,将这三种著名的算法思想运用到Lucene的网页排序算法中,并设计了一个基于Lucene的糖业专业搜索引擎,重点介绍该搜索引擎的检索功能。最后,通过在所设计好的糖业专业搜索引擎进行实验,验证改进后Lucene的网页排序算法,实验结果表明改进后的排序算法能够提高检索结果的质量,能够更准确地将结果信息反馈给用户。  相似文献   

2.
林欣  温传林  韩立新 《微机发展》2013,(2):41-43,48
元搜索引擎并行地向各个成员搜索引擎发出请求,合并及处理所有成员引擎的返回结果。相对于传统搜索引擎,元搜索引擎具有更好的查全率但在结果相关度排序及查准率方面仍需要改善。就相关度排序及查准率方面的问题元搜索成员引擎对于各个不同主题具有不同的检索质量并就此提出一种基于主题偏好的排序方法。利用Beeferman聚类方法对检索主题划分,通过Borda排序算法对元搜索引擎获得条目进行基于主题的分类排序,以此来提高元搜索查询质量和改善用户体验。  相似文献   

3.
搜索引擎页面排序算法研究综述*   总被引:3,自引:0,他引:3  
系统地分析了现有的页面排序算法,指出了它们各自的优势和存在的不足,并指出不同算法在不同领域和场合所具有的优势。建立专业搜索引擎是提高搜索准确性和性能的有效途径。通过网格技术将各种专业搜索引擎集成在一起,形成一个基于网格的搜索引擎,从而更好地满足不同背景不同偏好的用户需求。  相似文献   

4.
白亮  于天元  刘湜  老松杨  杨征 《计算机科学》2016,43(10):220-224
搜索引擎的性能优劣主要由排序结果决定。针对网页文本特性改进了谱聚类方法,提出了一种融合网页内容和链接质量的排序算法。利用改进的谱聚类方法对网页内容进行分类,并与评价链接质量的PageRank值进行加权融合,计算得到排序结果。实验结果表明,相对于传统的PageRank,HITS,TF-IDF等排序算法,所提算法返回的排序结果具有更高的相关性。  相似文献   

5.
一种改进的搜索引擎网页排序算法   总被引:1,自引:0,他引:1  
本文在分析目前流行的基于链接分析的搜索引擎网页排序算法的基础上,指出基于链接分析网页排序算法未充分考虑网站性能因素.针对这一缺点,本文提出了一种改进的网页排序算法,它考虑了网站的性能等因素,对提高搜索引擎的服务质量有很好的参考价值.  相似文献   

6.
针对经典的PageRank算法存在的偏重历史网页、主题漂移、平分网页链接权重等缺陷,引入了向量空间模型和信息论中的信息熵,提出一种改进的PRKE算法.该算法用表征网页特征的关键词构成的向量来表示网页,用关键词在网页中所占的权重作为向量中各个分量的权值;对已存在的网页采用K-means聚类算法进行聚类,以信息熵的形式表征各个簇的权值,完成对网页的宏观排序;融入了时间因子和主题相关度等参数,完成对网页的微观排序.实验结果表明,改进的PRKE算法相对于经典的PageRank算法在首页命中率、检索准确性等方面获得了较大的提高.  相似文献   

7.
谢蕙 《福建电脑》2012,28(5):85-86
主要对现有主流搜索引擎结果排序技术进行了研究,分析了对其各自的优缺点,并在此基础上总结了搜索引擎结果排序算法的研究趋势。  相似文献   

8.
展开了对互联网搜索引擎结果集的智能排序研究,提出了一种基于扩展网页质量和VIPS分块算法的智能网页排序算法,并对结果进行净化处理以及查询优化。实验结果表明研究提出的新算法提高了推荐精度。  相似文献   

9.
本文介绍了搜索引擎发展过程中出现的一种新技术——多元搜索引擎。分析了多元搜索引擎的现状,并对典型的多元搜索引擎系统进行了介绍。同时提出了多元搜索引擎发展过程中有待改进的一面。  相似文献   

10.
HITS算法探究     
随着互联网的快速发展,搜索引擎的应用已经变得非常广泛,但是却很少有人能够对搜索引擎的算法设计知道多少。通过对搜索引擎的算法设计思想及原理的了解,将更加有助于提供高我们的信息检索能力。文章主要就搜索引擎算法中的HITS算法进行简要的分析。  相似文献   

11.
网页排序技术在搜索引擎中有着重要作用,它在一定程度上决定了搜索引擎的质量。概括了网页排序算法,详细分析了目前已知的各种排序方法的基本思想和技术特点,并比较了它们的优缺点,最后指出了网页排序技术的发展思路。  相似文献   

12.
本文介绍了搜索引擎发展过程中出现的一种新技术——多元搜索引擎。分析了多元搜索引擎的现状,并对典型的多元搜索引擎系统进行了介绍。同时提出了多元搜索引擎发展过程中有待改进的一面。  相似文献   

13.
PageRank算法研究   总被引:17,自引:0,他引:17  
黄德才  戚华春 《计算机工程》2006,32(4):145-146,162
深入剖析了著名搜索引擎Google的关键技术PageRank算法,介绍分析了该算法的当前发展现状。并针对PageRank算法容易出现主题漂移现象,利用提出的二阶相似度改进算法。实验表明,改进的算法有利于减少主题漂移现象,提高用户对检索结果的满意度。  相似文献   

14.
高琪  张永平 《计算机应用》2009,29(11):3100-3102
超链接导向搜索(HITS)算法是比较经典的基于超链接的算法,但它忽视了链接页面的文本信息内容,没有区分链接的重要性,从而导致算法不可避免地发生主题漂移现象。为了解决这一问题,在原HITS算法的基础上,引入了经典的tf-idf算法,通过计算链接页面与查询主题的相关度来区分链接的重要性,以解决主题漂移的问题。改进算法使搜索引擎的排序结果更符合查询条件,相应的查确率也有很大提高。  相似文献   

15.
元搜索引擎排序技术综述*   总被引:5,自引:0,他引:5  
摘要:如何排序是实现元搜索引擎的一项关键技术,排序算法的好坏直接决定着元搜索引擎的性能。对元搜索引擎常用的排序算法根据其发展先后顺序作了介绍,对一些经典的算法进行了分析和评价,归纳出元搜索引擎排序算法适用的不同环境,最后对元搜索引擎排序算法未来发展方向作了技术展望。  相似文献   

16.
搜索引擎中用户查询和网页资源之间的相似度研究一直是页面排序的研究核心。利用 HowNet 对词语的语义层次架构模型,对用户的检索词进行兴趣挖掘,同时对检索词和挖掘出的兴趣关键词的语义相似度计算方法进行改进,用户的检索请求与分块后的网页资源进行相似度迭代计算。实验结果表明,改进的算法使得页面排序的准确率和首页命中率有了较大提高。  相似文献   

17.
元搜索引擎的核心技术是排序算法.在研究元搜索引擎排序算法的基础上,通过合理简化等一系列措施建立数学模型,抽象出元搜索引擎排序算法的基本框架.随后结合各成员搜索引擎的市场份额及各成员搜索引擎的搜索结果,给出了一种新的元搜素引擎排序算法.该算法简单且易于实现.  相似文献   

18.
通过对网页用户角色的分析发现,传统的基于PageRank算法的搜索引擎结果排序欠佳,是因为其没有兼顾所有角色对网页重要性的评价。为此,提出一种结合了所有角色评价的综合网页排序算法——ComPageRank(CPR)算法和一种基于点击量分析的Click- throughRank(CTR)算法。实验结果表明,相比PageRank为代表的网页排序算法,CPR算法更全面、合理。  相似文献   

19.
基于Nutch农业搜索引擎的研究与设计   总被引:3,自引:1,他引:2  
针对目前通用搜索引擎对专门领域及特定主题信息覆盖率较低,在开源的Nutch搜索引擎架构的基础上,通过Hash索引在多语种农业叙词表AGROVOC上进行农业词典的构建,利用已有的空间向量算法进行农业相关度计算,并结合PageRank的改进算法对结果综合排序,搭建了一个面向互联网上农业相关信息资源的搜索引擎.相对于通用搜索引擎来说减少了搜索结果的信息量,提高了搜索速度,同时提高了专业信息搜索的准确率.  相似文献   

20.
一种基于用户标记的搜索结果排序算法   总被引:1,自引:0,他引:1  
随着计算机网络的快速发展,网络上的信息量也日益纷繁复杂.如何准确、快速地帮助人们从海量网络数据中获取所需信息,这是目前搜索引擎首要解决的问题,为此,各种搜索排序算法应运而生.但是目前,网页信息的表达形式都十分简单,用户描述查询的形式更是十分简单,这就造成了在判断网页内容与用户查询相关性时十分困难.首先对现有的搜索引擎排序算法进行了分类总结,分析它们的优缺点.然后提出了一种基于用户反馈的语义标记的新方法,最后采用多种评估方法与Google搜索结果进行对比分析.实验结果表明,利用该方法所得到的排序结果比Google的排序结果更接近用户需求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号