首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 97 毫秒
1.
针对PageRank算法存在主题漂移以及偏重旧网页的问题,结合锚文本相似度和时间反馈因子提出了一种PageRank改进算法STPR,并对STPR算法进行实验分析。先比较了传统PageRank算法与加入锚文本相似度的PageR-ank算法,结果表明加入锚文本相似度的PageRank算法有利于减少主题漂移现象的发生;其次比较了加入锚文本相似度的PageRank算法与STPR算法,结果表明STPR算法不但减少了主题漂移现象,而且还弥补了新网页的PageRank值。  相似文献   

2.
基于PageRank的页面排序改进算法   总被引:2,自引:3,他引:2  
首先对PageRank算法进行了一般性介绍,研究了现有的基于链接结构的改进算法.在此基础上,指出PageRank算法给不同网页分配相同的Pagegank值影响了网页的排序质量,提出了一种基于多层分类技术的改进算法HCPR,并对PageRank和HCPR算法进行了相应测试和比较.实验结果表明,HCPR的排序结果比PageRank提高了约15.3%的相关度.  相似文献   

3.
针对PageRank算法忽略了页面内容的不足,根据用户浏览页面的习惯,将Web内容挖掘的页面相似度引入到算法中,对其进行改进。实验结果表明,改进后的算法可以使页面的PageRank值依据页面相似度发生变化,符合人们的一般期望,效果明显有效。  相似文献   

4.
Topic PageRank——一种基于主题的搜索引擎   总被引:1,自引:0,他引:1  
通过研究传统的超链分析算法PageRank及其改进算法Hilltop和TSPR的不足,提出了一种新的改进的方法Topic PageRank。这种算法是对每一个页面进行页面分类,然后根据分类的结果分别对每一个主题进行页面等级计算,因此,每一个页面对不同的主题将呈现出不同的页面等级得分,能更加准确地反映出页面的重要性。  相似文献   

5.
为了将PageRank算法更好地应用于APP推荐系统,对PageRank算法在APP搜索系统中的应用模型进行研究,发现PageRank算法运用于APP搜索系统中的一种缺点,即同类APP的独立性较弱,相似性较强。因此针对该缺点本文进行算法改进。最后对Time-PageRank算法得到的TPR值与传统PageRank算法的PR值进行了对比,得出Time-PageRank算法在APP搜索系统中可行性的结论。  相似文献   

6.
传统PageRank算法仅仅通过网页链接结构来确定网页的PageRank值,这通常会导致主题漂移问题,即主题内容不相关的网页PageRank值较高。改进的PageRank算法根据链接的网页之间的内容相关性分配rank值,并且将网页的时间因素考虑在内,提高新的内容相关网页的rank值。实验结果证明,改进后的算法有效解决原算法的主题漂移问题,并使新网页在排序结果中上升。  相似文献   

7.
语义相似的PageRank改进算法   总被引:1,自引:0,他引:1       下载免费PDF全文
PageRank算法是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性。但由于它只考虑网页与网页之间的链接结构,忽略了网页与主题的相关性,容易造成主题漂移现象。在分析了原PageRank算法基础上,给出了一种基于语义相似度的PageRank改进算法。该算法能够按照网页结构和网页主要内容计算出网页的PageRank值,既不会增加算法的时空复杂度,又极大地减少了“主题漂移”现象,从而提高查询效率和质量。  相似文献   

8.
SAX(symbolic aggregate approximation)是一种符号化的时间序列相似性度量方法,该方法在对时间序列划分时,采用了PAA算法的均值划分,但均分点无法有效描述序列的形态变化,导致序列间对应分段均值相似的情况下,SAX无法有效区分序列之间的相似度.在SAX算法的基础上,提出了基于关键点的SAX改进算法(KP_SAX),该算法的相似性度量公式既可描述时间序列自身数值变化的统计规律,又可描述时间序列形态变化.实验结果表明:KP_SAX虽然部分提高了算法的复杂度,但可在SAX算法无法计算序列相似度的情况下,有效计算各序列间的相似度距离,达到了改进的目的.  相似文献   

9.
传统的案例查询算法通过被动响应用户的查询请求为用户返回与查询请求相关的案例,忽略了用户查询行为能够对案例查询过程进行指导。提出了一个基于用户查询行为模型的案例查询算法,通过收集用户的查询请求,利用用户查询行为之间的相似度建立用户查询行为的分类模型;分析了用户查询行为的分类算法,重点论述了用户查询行为模型对案例查询过程的指导过程。实验结果表明,该方法能够有效地提高查询结果召回率以及查询成功率。  相似文献   

10.
微博已成为主流的在线社交网络平台,用户的影响力已成为衡量用户价值的一个重要指标。本文基于PageRank算法,通过分析用户之间的兴趣相似度、相对发帖活跃度、相互反馈互动程度来计算一个用户对其所关注的用户的关注程度,提出一个能够评估用户在微博上实际影响度WeiboRank算法。实验数据分析表明,该算法得到的用户影响度值能较客观地反映用户在其所处的虚拟社交网络中的实际影响度。  相似文献   

11.
基于锚文本相似度的PageRank改进算法   总被引:3,自引:0,他引:3       下载免费PDF全文
王钟斐  王彪 《计算机工程》2010,36(24):258-260
分析搜索引擎Google的PageRank算法,给出其存在的3个问题及针对这3个问题提出的改进。结合锚文本相似度提出一种改进的PageRank算法,利用Nutch对传统PageRank算法和改进后的PageRank算法进行实验分析与比较。实验结果表明,改进的PageRank算法提高了搜索结果的查准率,有利于减少主题漂移现象。  相似文献   

12.
基于主题相似度模型的TS-PageRank算法   总被引:1,自引:1,他引:1  
PageRank算法是著名搜索引擎Google的核心算法,但存在主题漂移的问题,致使搜索结果中存在过多与查询主题无关的网页.在分析PageRank算法及其有关改进算法的基础上,提出了基于虚拟文档的主题相似度模型和基于主题相似度模型的TS-PageRank算法框架.只要选择不同的相似度计算模型,就可以得到不同的TS-PageRank算法,形成一个网页排序算法簇.理论分析和数值仿真实验表明,该算法在不需要额外文本信息,也不增加算法时空复杂度的情况下,就能极大地减少主题漂移现象,从而提高查询效率和质量.  相似文献   

13.
HITS(Hyperlink-Induced Topic Search)算法是一种基于超链接结构的搜索结果排序算法。文章针对传统HITS算法存在的主题漂移问题提出了一种基于页面关联度的改进算法。通过引入搜索页面间关于查询主题的关联来为每个链接赋予不同的权重,进而改变邻接矩阵的项值。改进的HITS算法有效地抑制了主题漂移问题,并用实例得以验证。  相似文献   

14.
随着Web技术的迅速发展,提供个性化服务的搜索引擎技术受到用户的广泛关注,网页排序是其中的关键技术之一。本文利用PageRank算法对原有的Lucene网页排序进行了改进,设计并实现了关于手机信息搜索的个性化搜索引擎。实验结果证明,改进后的排序算法能够较好地提高信息检索的准确度,为用户带来了优于Lucene自身排序的搜索体验。  相似文献   

15.
基于PageRank的Web挖掘改进算法   总被引:1,自引:0,他引:1       下载免费PDF全文
焦金涛 《计算机工程》2009,35(15):284-284
针对Google使用的PageRank算法,提出一种改进的Web挖掘算法。实现该算法时,将网页使用信息和网页添加日期信息做成点击向量和日期向量,2个向量加权后标准化得到的一个向量作为常数加入到改进的迭代算法。实验结果证明,改进算法可以提高网页重要性判断的准确度。  相似文献   

16.
吴小兰 《计算机工程》2009,35(9):217-219
针对在线零售业务系统中用户要进入许多无关页面才能找到所需商品的问题,站点应能根据群体用户购买兴趣动态调整网页分配,即站点自适应。借用PageRank算法对元胞自动机模型进行改进,实现站点的自适应调整。与原模型相比,改进模型的演化规则简单、时间复杂度低、性能更优越。  相似文献   

17.
一种基于本体的PageRank算法的改进策略   总被引:1,自引:1,他引:0       下载免费PDF全文
介绍Google等搜索引擎应用的PageRank算法的定义、特点及缺陷。针对PageRank算法在基于Ontology的海洋文档检索系统应用中的问题对其加以改进,增加了文本文档的判断和主题相关性的判断,提出IPageRank算法。介绍海洋文档检索系统,并将改进的IPageRank算法应用于该系统中进行验证。  相似文献   

18.
王冲  纪仙慧 《计算机科学》2016,43(3):275-278, 312
针对传统的PageRank算法存在主题漂移、忽略用户兴趣等不足,提出一种基于用户兴趣与主题相关的Page-Rank改进算法——ITPR。为了更好地提高用户搜索质量,利用网页浏览时间与页面篇幅共同构建用户兴趣度因子,用线性拟合月点击量的方法预测用户兴趣度的升降,同时结合网页内容引入主题相关度因子,共同对网页PR值进行适当的修正,使其分配更为合理。仿真实验结果表明,在相同的实验环境下,改进的PageRank算法提升了网页排序质量、查准率以及用户搜索满意度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号