首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
针对Google PageRank算法中存在的“平均分配原则”及网络链接结构所造成的“旧网页问题”、“主题漂移问题”,提出一种改进的网页排序算法N-PageRank.该算法通过对搜索日志进行数据挖掘,捕捉用户与搜索引擎之间的交互过程,发现隐藏在用户搜索行为背后的用户兴趣和搜索规律,利用用户行为反馈模型,分析网络日志里用户的各项行为特点,改善了排序结果的准确率,保证了搜索引擎的返回结果正是用户所希望看到的网页.实验证明该算法有效地降低了网页排序时的客观因素的影响,充分考虑了用户对于网页质量的评价,所得到的排序结果更加能够满足用户的需求.  相似文献   

2.
王冲  曹姗姗 《计算机应用》2014,34(12):3502-3506
针对传统PageRank算法存在主题漂移、忽略用户兴趣及偏向旧网页的问题,提出一种基于用户反馈与主题关联度的网页排序改进算法。该算法为了更好满足用户的检索需求,利用用户对链接的点击量、链接结构及网页浏览时间来构成用户反馈因子,同时结合网页内容的主题关联度因子,共同对网页PR值进行适当修正与合理分配。为了改善网页排序的效果,算法通过添加时间相关因子,对新网页作出一定补偿,使得新网页一定程度上浮,旧网页下沉。实验结果表明,所提算法在相同实验环境下,相对于传统PageRank算法,提升了用户搜索满意度平均值约2.1%,达到了优化网页排序效果的预期研究目标。  相似文献   

3.
基于网站影响力的网页排序算法   总被引:1,自引:0,他引:1  
张芳  郭常盈 《计算机应用》2012,32(6):1666-1669
传统的排序算法主要是根据网页之间的链接关系进行排序,没有考虑到网站与网页之间互相增强的关系和用户对网页的重要性的评价。为此提出了一种基于更新时间、网页权威性和用户对网页的反映的相关排序算法。该算法以网站为节点计算每个网站权威值,在为网页分配权威值时考虑了网页在网站内的位置和用户对其的反映,并通过网站与网页之间相互影响的关系来相互反馈。实验结果表明,与传统的PageRank、HITS等排序算法相比,该算法在检索性能上有明显提高。  相似文献   

4.
聚类技术能将大规模数据按照数据的相似性划分成用户可迅速理解的簇.从而使用户更快地了解大量文档中所包含的内容。因此.聚类技术成为搜索引擎中不可或缺的部分和研究热点。Web上的AJAX应用和PowerPoint文件等弱链接文档由于缺乏足够的超链接信息,导致搜索该类文档时.排序结果不佳。针对该问题.给出一个弱链接文档的搜索引擎框架,并重点描述一个基于网页搜索结果的弱链接文档排序算法.基于聚类的弱链接文档排序算法利用聚类算法从高质量的网页搜索结果中提取与查询相关的主题.并根据主题的相关网页的排名确定该主题的重要性.根据识别的带权重的主题计算弱链接文档的排序值。实验结果表明该算法能够为弱链接文档产生较好的排序结果.  相似文献   

5.
为了提高网页排序的准确性,提出一种基于ε-贪婪学习和用户点击行为的网页排序算法。首先,根据用户查询,通过轮盘赌策略向用户推荐相关网页列表;然后,根据用户点击网页的行为进行ε-贪婪学习,计算得到排序系统中的强化信号,通过奖励和惩罚机制为每个网页计算相关性程度值;最后,根据相关性程度对网页进行重新排序。随着用户反馈的信息越来越多,相关网页会排列在列表的最高等级上。实验结果表明,提出的算法能够准确地推荐出相关网页,在P@n、NDCG和MAP性能指标上都获得了较优的性能。  相似文献   

6.
为了改善传统PageRank算法存在的不足,例如平分链接权重、主题漂移和忽略用户兴趣,提出一种基于分布式学习自动机和用户反馈的网页排序算法。利用页面内容的相似性、网页之间的超链接和用户遍历的路径,根据分布式学习自动机来确定网页间的超链接权重。考虑到用户反馈包含大量的价值信息,选择用户的转载、回复以及有效点击特征作为用户的行为特征,获得用户反馈因子。根据网页间的超链接权重和用户反馈因子计算每个网页的排名。仿真实验表明,与传统的PageRank算法和WPR算法相比,该算法在一定程度上提高了信息检索的精准度和用户满意度。  相似文献   

7.
《计算机工程》2017,(5):179-184
针对传统PageRank算法存在主题漂移、网页权值均分等问题,提出一种改进的PageRank算法。为提高用户查询效率和搜索质量,结合时间反馈因子对用户转发、用户评论和微博提及行为进行综合分析,采用统计分析方法对用户行为在微博用户影响力排序中的贡献进行度量,并利用改进的TF-IDF算法计算主题相似度权值使用户能够选择相关度较高的网页,从而获得相对应的PageRank权值。实验结果表明,与微博常用排序算法相比,改进PageRank算法具有更好的用户影响力排序效果。  相似文献   

8.
基于网页链接与用户反馈的PageRank算法改进研究   总被引:1,自引:0,他引:1  
曹姗姗  王冲 《计算机科学》2014,41(12):179-182
在网页链接结构的排序算法PageRank的基础上,提出了一种改进的Bias PageRank(BPR)算法。为了提高用户对网页排序结果的满意度,该算法结合网页链接结构与用户反馈信息(点击率、最近一次点击时间等)进行综合分析,从而从网页设计与用户角度共同对网页PR值进行合理分配,以在一定程度上达到高质量网页尽量排序靠前、信息价值低的网页尽量下沉的目的。仿真实验表明,BPR算法在一定程度上改善了排序效果,提升了用户信息检索满意度。  相似文献   

9.
搜索结果的可靠性是影响广大网民使用搜索引擎的一项重要指标。在开源 OPIC 算法的基础上,提出了TS 算法,该算法通过基于索引属性的改进,加入网页的创建时间和网页深度两个属性,使得网页的评分不仅仅局限于网页的链接,实现了网页评分因素的多元化。而网页最后的排序分值在原有OPIC算法的基础上与网页创建时间成正比,与网页深度成反比,有效改善了OPIC算法偏重历史网页的缺点,使搜索结果更加合理。最后,对TS算法进行效果演化,经过与传统搜索结果的分析对比,显示本算法返回的结果具有更高的可靠性。  相似文献   

10.
从搜索流程的分词和页面排序出发,由于中文分词比较复杂,鉴于正向最大分词算法和逆向最大分词算法的优缺点,提出基于正向最大和逆向最大匹配的双向匹配算法,该算法在一定程度提高了分词的准确性。页面排序也是影响用户搜索效率的一个重要因素,而网页相关度和网页的链接都是直接影响网页权值的重要因素,因而提出一种基于网页相关性的PageRank算法。新的页面排序算法既防治了页面漂移的可能性,也防治了全部依赖网页相关性的排序结果。  相似文献   

11.
Modern search engines record user interactions and use them to improve search quality. In particular, user click-through has been successfully used to improve clickthrough rate (CTR), Web search ranking, and query recommendations and suggestions. Although click-through logs can provide implicit feedback of users’ click preferences, deriving accurate absolute relevance judgments is difficult because of the existence of click noises and behavior biases. Previous studies showed that user clicking behaviors are biased toward many aspects such as “position” (user’s attention decreases from top to bottom) and “trust” (Web site reputations will affect user’s judgment). To address these problems, researchers have proposed several behavior models (usually referred to as click models) to describe users? practical browsing behaviors and to obtain an unbiased estimation of result relevance. In this study, we review recent efforts to construct click models for better search ranking and propose a novel convolutional neural network architecture for building click models. Compared to traditional click models, our model not only considers user behavior assumptions as input signals but also uses the content and context information of search engine result pages. In addition, our model uses parameters from traditional click models to restrict the meaning of some outputs in our model’s hidden layer. Experimental results show that the proposed model can achieve considerable improvement over state-of-the-art click models based on the evaluation metric of click perplexity.  相似文献   

12.
针对数据不均衡条件下贝叶斯个性化排序算法生成的推荐列表中存在强流行度偏差的问题,提出基于特征嵌入的去流行度偏差混合推荐算法。首先,利用卷积神经网络提取用户、物品特征确定用户偏好,并依据用户偏好对原始不均衡数据进行评分填充;其次,将卷积神经网络提取的用户偏好特征嵌入到贝叶斯个性化排序算法中进行混合推荐;最后,用评分填充数据训练混合推荐模型,得到去流行度偏差的个性化排序列表。为了验证算法的性能,在公开数据集MovieLens-100K和MovieLens-1M上进行分析与对比实验,实验结果显示流行度偏差降低了约50%~60%,精确度提高了约一倍。  相似文献   

13.
为提高校园网搜索引擎的查准率,提出一种新的校园网搜索引擎排序方法。该方法基于用户查询主题、用户浏览时间和页面点击等用户行为特征,计算新的页面相关度得分,改进搜索引擎的排序结果,为用户提供更准确的查询服务。实验结果表明,在不降低查全率的情况下,应用该排序方法的查准率有明显提高。  相似文献   

14.
一种基于用户标记的搜索结果排序算法   总被引:1,自引:0,他引:1  
随着计算机网络的快速发展,网络上的信息量也日益纷繁复杂.如何准确、快速地帮助人们从海量网络数据中获取所需信息,这是目前搜索引擎首要解决的问题,为此,各种搜索排序算法应运而生.但是目前,网页信息的表达形式都十分简单,用户描述查询的形式更是十分简单,这就造成了在判断网页内容与用户查询相关性时十分困难.首先对现有的搜索引擎排序算法进行了分类总结,分析它们的优缺点.然后提出了一种基于用户反馈的语义标记的新方法,最后采用多种评估方法与Google搜索结果进行对比分析.实验结果表明,利用该方法所得到的排序结果比Google的排序结果更接近用户需求.  相似文献   

15.
蒋宗礼  张婷 《微机发展》2014,(2):15-18,24
随着本地搜索的发展,通用排序算法得出的排序结果已不能完全满足用户的需要,根据本地搜索的特点,可以更好地利用用户的搜索特征。文中提出通过对用户的行为分析,提取用户行为特征值,再运用排序学习的SVM(支持向量机)方法将分析得到的用户行为特征值融入本地搜索算法当中,以此实现对排序算法的优化。融人了用户行为特征后,本地搜索的排序结果平均准确率和前十名文档的相关性都有了一定的提高。实验结果显示,用户行为特征使得排序结果可以更容易、准确地反映用户的兴趣,提升了用户的搜索体验。  相似文献   

16.
Blogs are increasingly accepted as a useful means to proliferate a variety of information on the web. As the popularity of blogs grows rapidly, a number of blog search engines have appeared recently to help users access and discover blog posts efficiently. Nevertheless, existing approaches tend to focus on ranking the blog posts according to their recency or popularity only, leaving the problem of retrieving more topic relevant posts to a user’s query largely unexplored. In this paper, we present a novel blog ranking framework, called PTRank, that improves search quality by taking account of relevance feedback from users as well as various information available from RSS feeds. A neural network method is employed to learn ranking functions that provide a relevance score between a keyword and a blog post. Extensive experiments on real blog data have been conducted to validate the proposed ranking framework for blog post search, and the results indicate that PTRank performs significantly better than the existing popular approach.  相似文献   

17.

摘  要:针对PageRank算法完全依据链接结构排序,未考虑网页内容分析,造成平均分配PR值、主题漂移、偏重旧网页的现象,且已有改进算法存在单一性优化等问题,提出一种多特征因子融合的PageRank算法。该算法为使搜索结果更接近用户查询需求,同时兼顾搜索内容的相关度和查准率,通过添加链入链出权重因子、用户反馈因子、主题相关因子和时间因子,共同改善PageRank算法存在的不足。实验结果表明,所提算法在内容相关性和查准率方面,较其他网页排序算法有明显提高,达到优化PageRank算法的目的。  相似文献   

18.
在无线传感器网络(WSN)中,容易因为故障节点存在冗余的故障属性、噪声数据以及数据可靠性等问题,从而产生传输错误数据,这将极大地消耗WSN节点中能量和带宽,向用户形成错误的决策。为此,提出了基于蚁群算法和BP神经网络模型的WSN节点故障检测方法。通过使用蚁群算法,使用户通过寻找优化路径来定位WSN节点的位置,通过这种随机搜索算法以及蚁群算法的搜索策略使用户对WSN故障节点的位置进行总体把握。然后又基于BP神经网络模型对获取的WSN故障节点信息进一步学习,在数据训练过程中,依据WSN故障节点预测误差,并进一步调整网络的权值和阈值,增加了故障诊断的精度。采用的算法对检测WSN故障节点具有较好的性能,使无线传感器网络的服务质量大大提高,增强了系统的稳定性,实验结果验证了算法的可行性和有效性。  相似文献   

19.
针对传统的搜索引擎人工评价方法效率低、成本大的问题,提出一种利用用户点击日志来评价搜索引擎用户满意度的方法。通过分析搜索引擎的用户点击日志,选择网页搜索结果排名、网页点击率、网页平均浏览时间作为用户满意度特征,分别运用多元线性回归分析、多元对数回归分析和BP神经网络方法,建立了基于用户点击日志的搜索引擎用户满意度评价模型。结合具体的实验数据集,通过实验对线性回归模型、对数回归模型和BP神经网络模型的结果进行了比较与分析,验证了模型的有效性。  相似文献   

20.
Yin  Minghao  Liu  Yanheng  Zhou  Xu  Sun  Geng 《Multimedia Tools and Applications》2021,80(30):36215-36235

Point of interest (POI) recommendation problem in location based social network (LBSN) is of great importance and the challenge lies in the data sparsity, implicit user feedback and personalized preference. To improve the precision of recommendation, a tensor decomposition based collaborative filtering (TDCF) algorithm is proposed for POI recommendation. Tensor decomposition algorithm is utilized to fill the missing values in tensor (user-category-time). Specifically, locations are replaced by location categories to reduce dimension in the first phase, which effectively solves the problem of data sparsity. In the second phase, we get the preference rating of users to POIs based on time and user similarity computation and hypertext induced topic search (HITS) algorithm with spatial constraints, respectively. Finally the user’s preference score of locations are determined by two items with different weights, and the Top-N locations are the recommendation results for a user to visit at a given time. Experimental results on two LBSN datasets demonstrate that the proposed model gets much higher precision and recall value than the other three recommendation methods.

  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号