共查询到20条相似文献,搜索用时 46 毫秒
1.
基于Lucene 网页排序算法的改进 总被引:3,自引:1,他引:2
在分析现有的词频位置加权排序法、Direct Hit算法、PageRank算法和Lucene的网页排序算法后,将这三种著名的算法思想运用到Lucene的网页排序算法中,并设计了一个基于Lucene的糖业专业搜索引擎,重点介绍该搜索引擎的检索功能。最后,通过在所设计好的糖业专业搜索引擎进行实验,验证改进后Lucene的网页排序算法,实验结果表明改进后的排序算法能够提高检索结果的质量,能够更准确地将结果信息反馈给用户。 相似文献
2.
3.
搜索引擎页面排序算法研究综述* 总被引:3,自引:0,他引:3
系统地分析了现有的页面排序算法,指出了它们各自的优势和存在的不足,并指出不同算法在不同领域和场合所具有的优势。建立专业搜索引擎是提高搜索准确性和性能的有效途径。通过网格技术将各种专业搜索引擎集成在一起,形成一个基于网格的搜索引擎,从而更好地满足不同背景不同偏好的用户需求。 相似文献
4.
5.
一种改进的搜索引擎网页排序算法 总被引:1,自引:0,他引:1
本文在分析目前流行的基于链接分析的搜索引擎网页排序算法的基础上,指出基于链接分析网页排序算法未充分考虑网站性能因素.针对这一缺点,本文提出了一种改进的网页排序算法,它考虑了网站的性能等因素,对提高搜索引擎的服务质量有很好的参考价值. 相似文献
6.
针对经典的PageRank算法存在的偏重历史网页、主题漂移、平分网页链接权重等缺陷,引入了向量空间模型和信息论中的信息熵,提出一种改进的PRKE算法.该算法用表征网页特征的关键词构成的向量来表示网页,用关键词在网页中所占的权重作为向量中各个分量的权值;对已存在的网页采用K-means聚类算法进行聚类,以信息熵的形式表征各个簇的权值,完成对网页的宏观排序;融入了时间因子和主题相关度等参数,完成对网页的微观排序.实验结果表明,改进的PRKE算法相对于经典的PageRank算法在首页命中率、检索准确性等方面获得了较大的提高. 相似文献
7.
主要对现有主流搜索引擎结果排序技术进行了研究,分析了对其各自的优缺点,并在此基础上总结了搜索引擎结果排序算法的研究趋势。 相似文献
8.
展开了对互联网搜索引擎结果集的智能排序研究,提出了一种基于扩展网页质量和VIPS分块算法的智能网页排序算法,并对结果进行净化处理以及查询优化。实验结果表明研究提出的新算法提高了推荐精度。 相似文献
9.
祝秀芳 《数字社区&智能家居》2007,(3):1218-1219
本文介绍了搜索引擎发展过程中出现的一种新技术——多元搜索引擎。分析了多元搜索引擎的现状,并对典型的多元搜索引擎系统进行了介绍。同时提出了多元搜索引擎发展过程中有待改进的一面。 相似文献
10.
11.
12.
祝秀芳 《数字社区&智能家居》2007,1(5):1218-1219
本文介绍了搜索引擎发展过程中出现的一种新技术——多元搜索引擎。分析了多元搜索引擎的现状,并对典型的多元搜索引擎系统进行了介绍。同时提出了多元搜索引擎发展过程中有待改进的一面。 相似文献
13.
PageRank算法研究 总被引:17,自引:0,他引:17
深入剖析了著名搜索引擎Google的关键技术PageRank算法,介绍分析了该算法的当前发展现状。并针对PageRank算法容易出现主题漂移现象,利用提出的二阶相似度改进算法。实验表明,改进的算法有利于减少主题漂移现象,提高用户对检索结果的满意度。 相似文献
14.
超链接导向搜索(HITS)算法是比较经典的基于超链接的算法,但它忽视了链接页面的文本信息内容,没有区分链接的重要性,从而导致算法不可避免地发生主题漂移现象。为了解决这一问题,在原HITS算法的基础上,引入了经典的tf-idf算法,通过计算链接页面与查询主题的相关度来区分链接的重要性,以解决主题漂移的问题。改进算法使搜索引擎的排序结果更符合查询条件,相应的查确率也有很大提高。 相似文献
15.
16.
朱宝华 《计算机与数字工程》2014,(10)
搜索引擎中用户查询和网页资源之间的相似度研究一直是页面排序的研究核心。利用 HowNet 对词语的语义层次架构模型,对用户的检索词进行兴趣挖掘,同时对检索词和挖掘出的兴趣关键词的语义相似度计算方法进行改进,用户的检索请求与分块后的网页资源进行相似度迭代计算。实验结果表明,改进的算法使得页面排序的准确率和首页命中率有了较大提高。 相似文献
17.
18.
19.
基于Nutch农业搜索引擎的研究与设计 总被引:3,自引:1,他引:2
针对目前通用搜索引擎对专门领域及特定主题信息覆盖率较低,在开源的Nutch搜索引擎架构的基础上,通过Hash索引在多语种农业叙词表AGROVOC上进行农业词典的构建,利用已有的空间向量算法进行农业相关度计算,并结合PageRank的改进算法对结果综合排序,搭建了一个面向互联网上农业相关信息资源的搜索引擎.相对于通用搜索引擎来说减少了搜索结果的信息量,提高了搜索速度,同时提高了专业信息搜索的准确率. 相似文献
20.
一种基于用户标记的搜索结果排序算法 总被引:1,自引:0,他引:1
随着计算机网络的快速发展,网络上的信息量也日益纷繁复杂.如何准确、快速地帮助人们从海量网络数据中获取所需信息,这是目前搜索引擎首要解决的问题,为此,各种搜索排序算法应运而生.但是目前,网页信息的表达形式都十分简单,用户描述查询的形式更是十分简单,这就造成了在判断网页内容与用户查询相关性时十分困难.首先对现有的搜索引擎排序算法进行了分类总结,分析它们的优缺点.然后提出了一种基于用户反馈的语义标记的新方法,最后采用多种评估方法与Google搜索结果进行对比分析.实验结果表明,利用该方法所得到的排序结果比Google的排序结果更接近用户需求. 相似文献