首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
搜索引擎技术的发展是随着电子技术不断进步而形成的信息数字化和数据网络化的必然产物。Google搜索引擎依靠其PageRank机制及收敛算法一直处于该领域的领先地位。本文介绍了PageR- ank算法的起源和发展。对其概念与方法进行了阐述,并讨论了它的应用情况。  相似文献   

2.
PageRank算法研究   总被引:17,自引:0,他引:17  
黄德才  戚华春 《计算机工程》2006,32(4):145-146,162
深入剖析了著名搜索引擎Google的关键技术PageRank算法,介绍分析了该算法的当前发展现状。并针对PageRank算法容易出现主题漂移现象,利用提出的二阶相似度改进算法。实验表明,改进的算法有利于减少主题漂移现象,提高用户对检索结果的满意度。  相似文献   

3.
领域相关自适应的PageRank算法搜索策略   总被引:1,自引:0,他引:1  
潘昊  谭龙远 《计算机应用》2008,28(9):2192-2194
针对Web链接结构模型的特点,提出了一种新的基于领域相关可自适应的PageRank算法。实验结果表明,改进后的算法有效节约了CPU资源,缩短了计算时间,同时较好地解决了主题漂移现象。  相似文献   

4.
通过分析PageRank算法存在的偏重旧网页问题、主题偏移问题及网页欺骗问题,提出一种基于用户反馈的PageRank改进算法,该算法在原算法的基础上添加用户点击次数反馈和点击时间反馈及反馈权重,并结合基于网页内容的排序算法思想,加入网页内容权重,对PR值的计算公式进行改进,从而克服PageRank算法中存在的问题。  相似文献   

5.
基于PageRank的Web挖掘改进算法   总被引:1,自引:0,他引:1       下载免费PDF全文
焦金涛 《计算机工程》2009,35(15):284-284
针对Google使用的PageRank算法,提出一种改进的Web挖掘算法。实现该算法时,将网页使用信息和网页添加日期信息做成点击向量和日期向量,2个向量加权后标准化得到的一个向量作为常数加入到改进的迭代算法。实验结果证明,改进算法可以提高网页重要性判断的准确度。  相似文献   

6.
随着学术网络平台的文献数量不断增长,快速高效的在众多质量参差不齐的文献中找到适合自己研究领域的高质量文献,对学术研究具有重要的意义.文中首先对传统的PageRank算法的原理、基本思想以及其发展历程进行分析;然后在对比了链接网路与引文网络的相似性和差异性后提出将链接网络中的PageRank算法应用到引文网络中;最后对P...  相似文献   

7.
PageRank算法的分析及其改进   总被引:2,自引:0,他引:2       下载免费PDF全文
王德广  周志刚  梁旭 《计算机工程》2010,36(22):291-292
在分析PageRank算法存在偏重旧网页、主题漂移、网页权值均分、忽视用户浏览兴趣现象的基础上,对其进行改进,考虑网页修改日期、网页文本信息、网站权威度、用户兴趣度等重要因素,重新计算网页PR值。实验结果表明,改进算法可提高搜索引擎对网页排序的准确度,以及用户对检索结果的满意度。  相似文献   

8.
为了克服搜索引擎在搜索过程中经常重复性地把当前受欢迎的网页放在搜索结果的首要位置,而忽略那些不受大多数用户欢迎的网页的问题,文中提出一个采用改进受欢迎度的PageRank优化算法.该改进算法首先通过建立网页的真实质量函数来纠正搜索引擎的上述问题,然后再采用一个新的网页受欢迎度来消除内在的网页质量问题从而避免该问题.实验...  相似文献   

9.
融合VSM技术的PageRank算法研究与应用   总被引:1,自引:0,他引:1  
李卫东  陆玲 《计算机与现代化》2011,(7):96-98,101,104
为解决PageRank算法存在的"主题漂移"问题,本文提出一种融合VSM(向量空间模型)技术的改进方法。首先根据网页的链接结构计算PageRank值,然后建立网页的内容特征向量空间,计算主题内容相似度,最后将这两个值按一定的权重系数进行融合计算,产生新的PageRank值。经过对比实验证明,改进后的PageRank算法减少了无关网页的数量,为搜索引擎提供了更好的排序结果。  相似文献   

10.
基于PageRank算法的搜索引擎优化策略   总被引:5,自引:0,他引:5  
张巍  李志蜀 《计算机应用》2005,25(7):1711-1712,1718
在介绍Google等搜索引擎最常用的PageRank搜索结果排名算法的基础上,详细阐述了各种网页链接结构对基于PageRank算法的网站搜索引擎排名结果可能产生的影响,并分析了实际应用中网站针对PageRank算法的各种优化策略,讨论了各自的优点。  相似文献   

11.
从搜索流程的分词和页面排序出发,由于中文分词比较复杂,鉴于正向最大分词算法和逆向最大分词算法的优缺点,提出基于正向最大和逆向最大匹配的双向匹配算法,该算法在一定程度提高了分词的准确性。页面排序也是影响用户搜索效率的一个重要因素,而网页相关度和网页的链接都是直接影响网页权值的重要因素,因而提出一种基于网页相关性的PageRank算法。新的页面排序算法既防治了页面漂移的可能性,也防治了全部依赖网页相关性的排序结果。  相似文献   

12.
通过研究传统的超链接分析算法PageRank及其改进算法TSPR(topic-sensitive PageRank)和MP-PageRank的不足,提出了一种新的改进方法,基于主题聚焦模型的PageRank算法.这种算法研究用户查询行为,建立主题聚焦模型,较好地解决了PageRank主题漂移问题以及其他改进算法依赖查询上下文的缺点.更加准确地反映出页面的重要性,提供更高质量的查询结果集.  相似文献   

13.
SEO技术研究   总被引:4,自引:0,他引:4  
为了利用搜索引擎优化SEO(Search Engine Optimization)技术给网站带来高质量的流量并将其转化为商业利益,理解搜索引擎的算法和排名原理十分必要。通过对网站的结构优化、关键词优化、单页优化、防止被搜索引擎惩罚和挽救被惩罚网站等技术的研究,达到提高网站排名,实现网站的价值目的。  相似文献   

14.
距离寻优中Dijkstra算法的优化   总被引:29,自引:0,他引:29  
Dijkstra算法在求解两指定顶点间最短距离时,对两顶点之间最短路径以外的大量顶点进行了计算,而影响了算法的速度。在对Dijkstra算法分析的基础上,结合网络模型的特点,对Dijkstra算法进行了优化。优化算法基于两点之间直线最短的思想,改变了对顶点处理顺序的规则。在算法流程中只对最短路径上及其附近的顶点做了处理。而与最短路径相距较远的顶点基本不涉及。因此,在优化处中计算的顶点数量大幅减少,提高了算法的速度,给出了优化算法的正确性证明,对优化算法的实用性和效率加以讨论,优化算法在实际中已经得到应用。  相似文献   

15.
隐马尔可夫模型(HMM,Hdden Markov Model)是语音识别中广泛采用的鲁棒性统计方法.本文采用禁止搜索(TS,Tabu Search)算法训练HMM参数,提出了基于禁止搜索的隐马尔可夫模型(TS-HMM)算法.该算法可以使搜索最优模型参数的过程达到全局优化.仿真结果表明与传统的前向-后向算法相比,TS-HMM算法具有更好的性能,且能够达到全局优化.  相似文献   

16.
近年来,随着网络数据挖掘技术的迅猛发展,如何从搜索引擎查询日志中找到有用的信息成为一个重要的研究方向.首先详细讨论了Beeferman提出的针对搜索引擎查询日志的凝聚式聚类算法以及噪声数据对该算法的影响,指出了Chan的改进算法中的一个错误,最后提出一个新的改进算法,并且通过模拟实验对几种不同的算法进行了对比.  相似文献   

17.
元搜索引擎中排序融合算法的优化研究   总被引:1,自引:0,他引:1  
为了提高元搜索引擎的查准率,提出一种改进的排序融合算法.首先,根据搜索返回结果中文档的位序以及包含该文档的成员系统数目计算文档初始评分;其次,引入BM25F算法模型计算文档的相似度;最后,增设域名缓存表统计文档的URL分值;综合上述三项计算值,得到文档的最终评分并作为排序依据.实验结果表明,所提出的优化算法显著提高了元搜索引擎系统的查准率.  相似文献   

18.
基于本体的元搜索引擎结果排序算法研究   总被引:1,自引:1,他引:1  
介绍了本体及元搜索引擎技术,认为将本体概念引入到元搜索引擎系统中,能够实现基于同义词、近义词的查询.给出了一个基于本体的元搜索引擎系统体系结构,介绍了系统的工作原理,提出了一种改进的摘要排序算法,并重点介绍了该算法的实现.  相似文献   

19.
源搜索可定制的元搜索引擎设计技术   总被引:1,自引:0,他引:1  
本文介绍了一种源搜索引擎可以定制的元搜索引擎的实现技术,描述了系统的总体结构,并着重介绍了包装器与抽取器的格式与实现。通过包装器与抽取器实现源搜索引擎的定制,使系统集成的源搜索引擎的增加、更改、删除变得容易。  相似文献   

20.
对L公司两类生产线状况进行分析,建立了描述生产线平衡的数学模型,以最小化生产线工作站数和最小负荷平滑指数为目标,对生产线进行优化。对于简单的生产线,通过遍历搜索算法,首先找出所有可行的作业加工顺序,然后求出最小的工作站数和最小平滑指数及相应的作业加工顺序。对于复杂的生产线,利用遍历搜索得到的结果作为遗传算法的种群,应用遗传算法,求出最小的工作站数和最小平滑指数及相应的作业加工顺序。解决了该公司的生产线平衡问题,也说明了遍历算法和遗传算法在生产线优化中的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号