首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 23 毫秒
1.
一种基于聚类和用户行为分析的搜索引擎结果优化方法   总被引:1,自引:0,他引:1  
在研究传统搜索引擎的基础上,提出了一种改进的元搜索引擎模型及一种基于聚类和用户行为分析的查询结果优化方法,最后通过对比优化前后用户的满意度验证了该方法的可行性。  相似文献   

2.
为了改进当前社会化标注系统在标签浏览和检索方面的弱点,提出一种基于加权网络分割的社会性标签聚类算法。算法基于标签节点的核心度和相似性对标签共现网络进行分割,并在聚类后自动生成该类的特征标签来代表该类簇。实验测试表明算法具有较好的聚类效果。  相似文献   

3.
网络用户行为体现为用户使用的网络应用,且用户群体的划分与业务具有密不可分的关系。通过研究用户使用的网络应用来分析用户的行为规律,提出一种基于小波聚类的网络用户行为分析方法。改方法利用小波聚类将数据进行聚类,按照不同的网络业务偏好将用户群体分为不同的网络业务类,实现用户使用网络业务偏好的群体划分。  相似文献   

4.
因特网的飞速发展,网络资源呈爆炸式的增长。信息检索是人们上网的主要目的之一。目前的信息检索领域有许多检索方法与检索工具,为用户检索信息提供了许多途径。但如何利用搜索引擎实现更快更精确的搜索已经成为这一领域的研究热点。在研究现有的几种搜索引擎的基础上,提出了一种基于用户行为聚类的搜索引擎。通过分析不同的用户行为将搜索用户聚类成不同的用户组,为每组用户返回其喜欢的结果,优化查询结果。  相似文献   

5.
Web用户聚类算法   总被引:2,自引:0,他引:2  
Web用户聚类是将具有相似访问特性的用户归在一起,在电子商务的市场分割和为用户提供个性化服务中,能发挥巨大作用。文章提出基于用户访问路径以及节点高度的相似性评价函数,建立相似矩阵,并提出相似矩阵结构分解算法对此相似矩阵进行变换生成对角矩阵或下三角矩阵,该矩阵中的每一个子对角阵即对应一个用户类,矩阵的左下角对应各用户类之间的关系。  相似文献   

6.
利用数据挖掘相关技术,针对后台计费服务器的数据库,基于K-means算法以校园网用户行为特征为对象来进行聚类分析,提出了几个校园网用户行为分析的模型.此类模型为校园网管理者在制定有效管理策略,满足校园网用户个性化需求方面提供理论依据.  相似文献   

7.
用户行为聚类的搜索引擎算法与实现   总被引:1,自引:0,他引:1  
提出一种基于用户行为聚类的搜索引擎算法。该算法从用户行为日志中挖掘用户意图,并根据用户的反馈信息定位用户意图信息,提升了查询的准确率,有效地解决了传统的全文检索式搜索引擎查询具有二义性词时的不足,并通过实践验证了算法的可行性。  相似文献   

8.
提出一个基于Web日志的web用户群体和站点URL聚类算法.使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web用户群体和站点URL进行聚类.由于在聚类过程中同时考虑了用户对URL的浏览时间和访问次数,使算法的精度和效率都大大提高.同时,该算法能较好地处理类间重叠问题,使算法具有较好的实用性.最后对算法的有效性和可伸缩性进行了研究.  相似文献   

9.
对视频点播系统中用户行为进行建模和仿真,是研究系统使用状况、设计性能优化算法的重要手段.但在以往的研究中,对用户行为建模和仿真都是基于整体历史数据的统计进行的,而在很多情况下,对不同模式的行为采用不同的策略能够更好的提供视频传输服务.本文针对视频点播系统中用户点播行为的特性,以及系统优化策略的需要,提出用户行为时间序列模型和聚类方法,在中国科技大学视频点播系统实际数据基础上进行了仿真测试,结果表明了该方法的可行性.  相似文献   

10.
基于后缀树的Web检索结果聚类标签生成方法   总被引:1,自引:0,他引:1  
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之前就产生好的标签,在生成了标签的基础上,再进行检索结果聚类。对于搜索引擎返回的结果,我们先统一建立一棵后缀树,然后计算后缀树中各个短语的得分,选取得分最高的若干短语作为候选标签。得到标签后,将搜索引擎返回的各个结果项分配到它所包含的标签对应的分类中,形成最后的聚类。实验表明,我们的方法是比较有效的。  相似文献   

11.
多标签分类的实质就是为给定实例预测一个与其关联的标签集合。典型方法可以分为两类:问题转换型和算法适应型。本文主要研究基于标签幂集的问题转换型算法。由于已有的标签幂集算法很难发现甚至可能忽略隐藏在训练集中的重要标签集合,因此,本文提出了一种基于标签聚类的标签幂集方法,通过改进平衡k-means聚类来发现训练集中潜在的重要标签集合,并用于形成新的训练集进行多标签分类。经实验验证,该算法在多个评价指标上较原有的标签幂集方法具有更好的分类性能。  相似文献   

12.
随着文本资源的激增,特别是网页文本的迅速增加,针对文本的挖掘分析日益受到重视。谱聚类是文本聚类分析较常用的一种新型方法。该文将非负约束引入到传统的谱聚类算法中,提出了一种基于非负约束的谱聚类方法。文中实验验证了所提出方法在中文文本聚类分析应用中的有效性。  相似文献   

13.
在电子商务支付中,由于传统检测恶意支付方法的漏检率高,研究基于行为聚类的电子商务恶意支付用户检测。首先,使用行为聚类技术训练数据,得到正常的数据特征生成簇,根据网络活动的属性信息提取对应的数据特征;其次,检测恶意支付行为,将得到的特征值与恶意数据库中的特征值展开对比分析从而完成基于行为聚类的电子商务恶意支付用户的检测;最后,进行实验对比分析。实验结果表明,实验组的漏检率最低,优于对照组。  相似文献   

14.
一种Web用户行为聚类算法   总被引:13,自引:0,他引:13  
提出了一种新的路径相似度系数计算方法,并使之与雅可比相似系数结合,用于计算用户访问行为的相似度,在此基础之上又提出了一种分析web用户行为的聚类算法(FCC)。通过挖掘Web日志,找出具有相似行为的web用户,由于FCC聚类算法过滤了小于指定阚值的相似度系数,大大缩小了数据规模,很好地解决了其他聚类算法(如层次聚类)在高堆空间聚类时的“堆数灾难”问题,最后的实验结果很好。  相似文献   

15.
传统多维度文本聚类一般是从文本内容中提取特征,而很少考虑数据中用户与文本的交互信息(如:点赞、转发、评论、关注、引用等行为信息),且传统的多维度文本聚类主要是将多个空间维度线性结合,没能深入考虑每个维度中属性间的关系。为有效利用与文本相关的用户行为信息,提出一种结合用户行为信息的多维度文本聚类模型(MTCUBC)。根据文本间的相似性在不同空间上应该保持一致的原则,该模型将用户行为信息作为文本内容聚类的约束来调节相似度,然后结合度量学习方法来改善文本间的距离,从而提高聚类效果。通过实验表明,与线性结合的多维度聚类相比,MTCUBC模型在高维稀疏数据中表现出明显的优势。  相似文献   

16.
目前,聚合服务包含网络资源聚合、服务聚合与用户聚合三个方面,其中用户聚合研究亟待完善。在一些开放平台的社会化标签系统中,用户根据个人偏好自由选择词汇对网络资源进行标注。标注的标签词反映了用户的兴趣偏好。从标签共现网络视角,提出了一种基于标签共现网络的用户聚合算法TBKM。定义了TBKM算法的相关概念;创新提出了TBKM算法并给出了算法的详细设计;选择目前网络上最大的书签类站点Delicious的真实数据进行实证研究,将TBKM算法与传统K-means算法在聚类效果上进行比较,展示了TBKM算法在簇间距离与簇内半径两指标上的创新性。  相似文献   

17.
汤颖  钟南江  孙康高  秦大康  周伟华 《计算机科学》2017,44(Z11):385-390, 427
随着社交网络的流行,从各种各样的社交网络数据中提取出有效信息并进行清晰直观的可视化分析,从而为用户提供有价值的潜在知识,显得尤为重要。聚类分析是数据挖掘中的重要分析手段,传统的面向社交网络数据的用户聚类分析大都仅考虑网络的拓扑链接结构,未考虑用户的兴趣相似度。文中基于贝叶斯概率模型来计算用户兴趣相似度并进行聚类,进一步设计交互可视化方式来展示上述聚类结果。具体地,针对社交网络中的用户评分数据 建立潜在语义模型来提取表示每个用户兴趣特点的特征向量;基于用户的特征向量对用户进行聚类,得到具有不同特征的人群,并通过实验和热度图选择合适的人群聚类数;最后提出了基于层次气泡图的可视化展现和分析方案,将用户、电影类型、电影等多维信息在图形中交互展示,支持用户从全局概览到局部细节的推进式探索,从多角度可视化人群特征。对豆瓣网用户和电影评分数据进行了实验和分析,结果验证了所提方法的有效性。  相似文献   

18.
分析了现有文章推荐系统中基于关键词向量的用户模型表示方法存在的不足,提出了基于聚类兴趣点的用户模型表示方法。该方法可通过文章聚类形成兴趣点。由于传统的基于划分的聚类算法存在的不足,提出了基于复杂网络特征的文章聚类算法。实验结果表明该用户模型的表示方法较好地反映了用户多方面的兴趣,提高了文章推荐系统的性能。  相似文献   

19.
社会标签系统是Web2.0中提出的新概念,旨在更好地表达用户的兴趣和意愿。标签聚类是社会标签数据挖掘中一个非常重要的研究课题。标签相似度的计算是标签聚类的关键技术。主要工作包括:(1)提出了一种基于TF-IDF的标签相似度计算方法和基于该相似度的聚类算法;(2)分析了影响标签相似度的条件;(3)通过实验表明:与已有方法相比,新方法的准确性更高。  相似文献   

20.
一种用于文章推荐系统中的用户模型表示方法   总被引:2,自引:0,他引:2  
分析了现有文章推荐系统中基于关键词向量的用户模型表示方法存在的不足,提出了基于聚类兴趣点的用户模型表示方法。该方法可通过文章聚类形成兴趣点。由于传统的基于划分的聚类算法存在的不足,提出了基于复杂网络特征的文章聚类算法。实验结果表明该用户模型的表示方法较好地反映了用户多方面的兴趣,提高了文章推荐系统的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号