首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基于用户兴趣的搜索结果动态聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
目前搜索引擎返回的结果往往比较多,而且各类文档混合在一起,没有针对性,使用者仍然需要花费大量时间来寻找自己感兴趣的文档。提出了一种对搜索结果动态聚类算法,利用用户的兴趣特点,从搜索结果的文档中抽取摘要,利用这种摘要随着用户的浏览进程进行动态聚类,将这些文档聚成不同类别。用户只需要找出自己感兴趣类别,便可以得到足够多感兴趣的文档。实验证明,这种方法是有效的,并具有抗噪声等良好性能。  相似文献   

2.
利用数据挖掘相关技术,针对后台计费服务器的数据库,基于K-means算法以校园网用户行为特征为对象来进行聚类分析,提出了几个校园网用户行为分析的模型.此类模型为校园网管理者在制定有效管理策略,满足校园网用户个性化需求方面提供理论依据.  相似文献   

3.
由于社交网络中人物与内容之间错综复杂的关系,如何合理地给用户推荐感兴趣的内容具有十分重要的意义。提出CCVR(Core user for Clustering interesting Vector for Recommend)算法。基于用户的兴趣矩阵,运用改进的K-means算法进行聚类从而推导类兴趣向量,由此预测用户对哪些内容标签感兴趣,从而形成推荐。实验结果证明CCVR算法具有良好的准确性。  相似文献   

4.
在电子商务支付中,由于传统检测恶意支付方法的漏检率高,研究基于行为聚类的电子商务恶意支付用户检测。首先,使用行为聚类技术训练数据,得到正常的数据特征生成簇,根据网络活动的属性信息提取对应的数据特征;其次,检测恶意支付行为,将得到的特征值与恶意数据库中的特征值展开对比分析从而完成基于行为聚类的电子商务恶意支付用户的检测;最后,进行实验对比分析。实验结果表明,实验组的漏检率最低,优于对照组。  相似文献   

5.
提出了一种基于用户浏览历史的用户兴趣提取模型,它隐式地收集用户信息用于个性化搜索中,即是通过对用户兴趣度的定义,在用户的浏览历史中得到一组代表用户兴趣的网页,并设计一个聚类算法,对这组代表用户兴趣的网页进行聚类操作,从而得到能代表此用户兴趣类别的词,即用户的兴趣。  相似文献   

6.
传统多维度文本聚类一般是从文本内容中提取特征,而很少考虑数据中用户与文本的交互信息(如:点赞、转发、评论、关注、引用等行为信息),且传统的多维度文本聚类主要是将多个空间维度线性结合,没能深入考虑每个维度中属性间的关系。为有效利用与文本相关的用户行为信息,提出一种结合用户行为信息的多维度文本聚类模型(MTCUBC)。根据文本间的相似性在不同空间上应该保持一致的原则,该模型将用户行为信息作为文本内容聚类的约束来调节相似度,然后结合度量学习方法来改善文本间的距离,从而提高聚类效果。通过实验表明,与线性结合的多维度聚类相比,MTCUBC模型在高维稀疏数据中表现出明显的优势。  相似文献   

7.
用户行为聚类的搜索引擎算法与实现   总被引:1,自引:0,他引:1  
提出一种基于用户行为聚类的搜索引擎算法。该算法从用户行为日志中挖掘用户意图,并根据用户的反馈信息定位用户意图信息,提升了查询的准确率,有效地解决了传统的全文检索式搜索引擎查询具有二义性词时的不足,并通过实践验证了算法的可行性。  相似文献   

8.
随着Internet的迅速发展,人们必须面对信息爆炸的现实.描述了一种关键词向量的方式表达用户兴趣.将BIRCH聚类算法应用于用户访问的网络文档上来建立用户兴趣模型.基于Myspace用户日志,又实现了一个用户兴趣建模系统,该系统验证了提出方法的有效性.  相似文献   

9.
网络用户行为体现为用户使用的网络应用,且用户群体的划分与业务具有密不可分的关系。通过研究用户使用的网络应用来分析用户的行为规律,提出一种基于小波聚类的网络用户行为分析方法。改方法利用小波聚类将数据进行聚类,按照不同的网络业务偏好将用户群体分为不同的网络业务类,实现用户使用网络业务偏好的群体划分。  相似文献   

10.
基于用户浏览行为聚类Web用户   总被引:3,自引:0,他引:3  
本文结合Web用户浏览行为的特点,提出了一种新的路径相似度的计算方法,在计算相似度时不仅把用户的浏览模式仅作为一种序列模式来考虑,还充分考虑了用户在网上浏览的时间因素.然后,把粗糙度的概念引入Leader聚类算法中,提出粗糙Leader聚类算法.最后,使用标准数据集进行了试验,证明基于此种相似度计算方法,应用粗糙Leader算法聚类Web用户的有效性.  相似文献   

11.
一种基于聚类和用户行为分析的搜索引擎结果优化方法   总被引:1,自引:0,他引:1  
在研究传统搜索引擎的基础上,提出了一种改进的元搜索引擎模型及一种基于聚类和用户行为分析的查询结果优化方法,最后通过对比优化前后用户的满意度验证了该方法的可行性。  相似文献   

12.
基于用户行为分析的搜索引擎研究   总被引:1,自引:0,他引:1  
如何提高搜索引擎的效率,把用户从无序的搜索结果中解放出来,是当前研究的一个热门方向。本文通过对现有自动分类搜索引擎的分析,提出了通过使用加权贝叶斯算法来分析用户行为,达到提高搜索效率的目的,并通过实例介绍了它的实现方法。  相似文献   

13.
基于用户行为分析的搜索引擎自动性能评价   总被引:6,自引:2,他引:4  
刘奕群  岑荣伟  张敏  茹立云  马少平 《软件学报》2008,19(11):3023-3032
基于用户行为分析的思路,提出了一种自动进行搜索引擎性能评价的方法.此方法能够基于对用户的查询和点击行为的分析自动生成导航类查询测试集合,并对查询对应的标准答案实现自动标注.基于中文商业搜索引擎日志的实验结果表明,此方法能够与人工标注的评价取得基本一致的评价效果,同时大大减少了评价所需的人力资源,并加快了评价反馈周期.  相似文献   

14.
搜索引擎已经成为人们生活和工作中不可或缺的信息获取工具,对于互联网信息的合理、充分利用发挥着至关重要的作用。用户行为分析一直是搜索引擎提升性能的重要途径,但当前的搜索用户行为分析技术多局限在较短时间段,缺乏对长期时间内用户行为的演化分析研究。基于商业搜索引擎提供的海量规模日志数据,对2006年到2011年间中文搜索引擎用户行为的演化规律进行了分析挖掘,从中得到的结论对于进行搜索技术未来发展方向的讨论具有一定的参考价值。  相似文献   

15.
基于日志挖掘的搜索引擎用户行为分析   总被引:1,自引:0,他引:1  
随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的重要研究领域之一。为更好理解网络用户的搜索行为,该文基于7.56亿条真实网络用户行为日志,对用户行为进行分析和研究。我们主要考察了用户搜索行为中的查询长度、查询修改率、相关搜索点击率、首次/最后一次点击位置分布以及查询内点击数分布等信息。该文还基于不同类型的查询集合,考察用户在不同查询需求下的行为差异性。相关分析结果对搜索引擎算法优化和系统改进等都具有一定的参考意义。  相似文献   

16.
用户满意度是以用户为中心的搜索引擎性能评价的一个重要分支,区别于传统基于查询与文档相关性的评价方法,基于用户满意度的性能评价能够更加全面、客观地对搜索引擎性能进行评价。该文通过设计搜索实验平台,在尽量不影响用户正常搜索过程的前提下收集用户的搜索行为及其满意度评价,通过用户行为分析的方法挖掘用户群体行为特征与用户查询满意度之间的关联关系。相关结论对提高搜索引擎性能、改善用户查询体验具有一定的参考意义。  相似文献   

17.
基于大规模日志分析的搜索引擎用户行为分析   总被引:18,自引:0,他引:18  
用户行为分析是网络信息检索技术得以前进的重要基石,也是能够在商用搜索引擎中发挥重要作用的各种算法的基本出发点之一。为了更好的理解中文搜索用户的检索行为,本文对搜狗搜索引擎在一个月内的近5 000万条查询日志进行了分析。我们从独立查询词分布、同一session内的用户查询习惯及用户是否使用高级检索功能等方面对用户行为进行了分析。分析结论对于改进中文搜索引擎的检索算法和更准确的评测检索效果都有较好的指导意义。  相似文献   

18.
为提高校园网搜索引擎的查准率,提出一种新的校园网搜索引擎排序方法。该方法基于用户查询主题、用户浏览时间和页面点击等用户行为特征,计算新的页面相关度得分,改进搜索引擎的排序结果,为用户提供更准确的查询服务。实验结果表明,在不降低查全率的情况下,应用该排序方法的查准率有明显提高。  相似文献   

19.
现有搜索引擎基本上采用"搜索适用所有用户"的模型,体现不出用户真正的兴趣所在。针对当前搜索引擎的不足,本文提出并研究一个基于用户反馈的个性化搜索引擎系统。通过学习用户满意度反馈信息,挖掘隐藏的用户兴趣信息,实现搜索引擎的个性化。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号