共查询到20条相似文献,搜索用时 171 毫秒
1.
基于隐马尔可夫模型的兴趣迁移模式发现 总被引:17,自引:0,他引:17
Web挖掘的一个重要研究方向是发现用户的迁移模式。一般来说,用户的迁移具有某种目的性。这种目的性表现为用户对某种概念的兴趣。文中提出基于隐马尔可夫模型的兴趣迁移模式发现方法,用于发现这种带有某种兴趣的用户迁移模式,这种模式实质上是一种特殊的关联规则。在这种方法中,作者首先根据用户的访问记录定义一个隐马尔可夫模型,然后提出一种新的增量发现算法Increase_R用于发现兴趣迁移模式,同时给出了证明以说明该算法可以发现所有的兴趣迁移模式。 相似文献
2.
基于搜索历史的用户兴趣模型的研究 总被引:3,自引:0,他引:3
提出了一种新的基于搜索历史的用户兴趣模型,目的是解决现有搜索引擎很难考虑用户兴趣来实现用户个性化搜索以及用户兴趣很难更新的问题。提出了基于搜索历史的用户兴趣的表达方法和自动隐式学习算法。全面地描述了用户兴趣模型的建立及通过自动隐式学习算法不断更新、优化模型的处理过程,并给出了对模型的评价标准。 相似文献
3.
基于搜索历史的用户兴趣模型的研究 总被引:2,自引:0,他引:2
提出了一种新的基于搜索历史的用户兴趣模型,目的是解决现有搜索引擎很难考虑用户兴趣来实现用户个性化搜索以及用户兴趣很难更新的问题。提出了基于搜索历史的用户兴趣的表达方法和自动隐式学习算法。全面地描述了用户兴趣模型的建立及通过自动隐式学习算法不断更新、优化模型的处理过程,并给出了对模型的评价标准。 相似文献
4.
5.
随着大数据时代的到来,大量的用户位置信息被隐式地收集.虽然这些隐式收集到的时空数据在疾病传播、路线推荐等科学、社会领域中发挥了重要的作用,但它们与用户主动发布的时空数据相互参照引起了大数据时代时空数据发布中新的个人隐私泄露问题.现有的位置隐私保护机制由于没有考虑隐式收集的时空数据与用户主动发布的位置数据可以相互参照的事实,不能有效保护用户的隐私.首次定义并研究了隐式收集的时空数据中的隐私保护问题,提出了基于发现-消除的隐私保护框架.特别地,提出了基于前缀过滤的嵌套循环算法用于发现隐式收集的时空数据中可能泄露用户隐私的记录,并提出基于频繁移动对象的假数据添加方法消除这些记录.此外,还分别提出了更高效的反先验算法和基于图的假数据添加算法.最后,在若干真实数据集上对提出的算法进行了充分实验,证实了这些算法有较高的保护效果和性能. 相似文献
6.
由于协同过滤推荐算法依赖用户的数据,因而存在很大的隐私泄露风险.差分隐私保护技术可提供严格的隐私保护效果,但目前大多数基于差分隐私的推荐算法没有考虑隐式反馈数据,针对该问题,提出了一种新的基于差分隐私保护的协同过滤推荐算法.首先对隐式反馈矩阵进行矩阵分解,得到用户和物品的隐式特征向量;然后把得到的隐式特征向量融合到显式反馈模型求解中,通过在模型求解过程中加入均值扰动和梯度扰动,使算法满足ε-差分隐私保护;最后应用此算法预测评分,并在MovieLens数据集上对算法进行有效性评价.实验结果表明,所提算法能在推荐结果的准确性和用户的隐私保护之间实现有效的平衡. 相似文献
7.
个性化推荐服务中用户兴趣模型研究 总被引:1,自引:0,他引:1
本文提出了一种利用用户浏览页面集的内容信息和浏览行为信息,隐式地创建用户兴趣描述文件的方法。通过对用户浏览的web页面进行兴趣度分析,并与对用户浏览网页时的浏览行为分析相合,得到了用特征矩阵表示的用户兴趣模型。并采用层次聚类算法和k-means聚类算法相结合的综合聚类算法进行聚类,得到用兴趣分类树表示的用户兴趣模型。由于采用的是隐式创建用户描述文件的方法,减少了因用户参于而带来的系统噪声,保证了所创建的用户兴趣模型的准确性。 相似文献
8.
基于用户兴趣的不同,研究如何针对用户的浏览行为来获取用户的有效兴趣数据,并根据现有用户兴趣模型存在的不足,结合Web挖掘中的相关技术,先显式构建用户兴趣模型,后隐式更新用户兴趣模型,从而实现能适应用户兴趣变化的用户兴趣模型。 相似文献
9.
基于用户兴趣的不同,研究如何针对用户的浏览行为来获取用户的有效兴趣数据,并根据现有用户兴趣模型存在的不足,结合Web挖掘中的相关技术,先显式构建用户兴趣模型,后隐式更新用户兴趣模型,从而实现能适应用户兴趣变化的用户兴趣模型。 相似文献
10.
董全德 《数字社区&智能家居》2007,(17)
提出用户浏览兴趣迁移模式作为关联规则生成的基础的思路;给出了用户频繁访问路径的更新算法,用聚类主题号代替浏览序列的页面号,获得用户浏览兴趣迁移模式,以此得到更优化的个性化服务. 相似文献
11.
微博用户兴趣挖掘是个性化推荐、社群划分的基础工作.在深入分析微博网络特点的基础上,给出了能够揭示微博网络多模性的描述模型,对面向微博网络的后续研究具有参考价值.根据微博网络的特点,提出了基于背景的用户静态兴趣表示及挖掘方法,以及基于微博的用户动态兴趣表示和挖掘方法.针对微博网络中缺少背景信息、发表微博很少的大量不活跃用户,提出了基于关注的用户兴趣挖掘方法.以新浪微博为例,选取了时尚、企业管理、教育、军事、文化这5个领域进行用户兴趣挖掘及相似度计算的实验分析和比较,结果表明,与主流的兴趣挖掘方法相比,该微博用户兴趣的表示和挖掘方法可以有效地改善微博用户兴趣挖掘的效果. 相似文献
12.
一种有效的隐私保护关联规则挖掘方法 总被引:23,自引:3,他引:23
隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法.首先将数据干扰和查询限制这两种隐私保护的基本策略相结合,提出了一种新的数据随机处理方法,即部分隐藏的随机化回答(randomized response with partial hiding,简称RRPH)方法,以对原始数据进行变换和隐藏.然后以此为基础,针对经过RRPH方法处理后的数据,给出了一种简单而又高效的频繁项集生成算法,进而实现了隐私保护的关联规则挖掘.理论分析和实验结果均表明,基于RRPH的隐私保护关联规则挖掘方法具有很好的隐私性、准确性、高效性和适用性. 相似文献
13.
一个基于VSM的个性化信息推荐系统 总被引:1,自引:0,他引:1
为了帮助用户从Internet上方便地获得信息,针对Proxy用户环境设计了一个信息推荐系统。先通过Proxy日志挖掘获得用户兴趣,再根据向量空间模型为用户生成兴趣特征,并据此对用户进行信息推荐。系统通过服务评估和反馈来保证信息推荐的质量。 相似文献
14.
随着WLAN在室内环境的日益普及,基于现代的移动设备可以方便实时地获取各种有价值的WLAN数据,这对我们识别个体日常生活中的多样化行为提供了前所未有的机会。近年来,用户的兴趣点与行为模式挖掘等领域日益引起各界的广泛关注,设计了一套基于室内定位的推荐系统,基于用户的历史访问记录,实现从过载的信息中识别出用户感兴趣的内容。现有的位置服务通常只针对用户的室外位置数据,缺乏对室内数据的挖掘分析,忽略了室内位置数据中蕴含的大量语义信息。利用室内定位技术获取用户在商场中的活动轨迹,根据用户去过的店铺和浏览过的商品等历史信息,估算用户的兴趣爱好并进而向用户个性化地推荐感兴趣的商品,基于以上思路设计实现了一套基于室内定位和微信平台的个性化商品推荐系统。 相似文献
15.
针对微博用户兴趣随时间变化的特征,提出一种基于模糊关联规则的潜在兴趣发现方法(PIDFAR),利用LDA主题模型表达微博主题分布,通过时间加权的方式计算出用户现在兴趣的主题分布,进行模糊关联规则挖掘,得出关联规则集合以表示和发现用户兴趣随时间发生变化的一般规律,最后根据关联规则集合中关联规则和用户现在兴趣的主题分布来计算相似度,取相似度较高的关联规则的后项的集合组成用户的潜在兴趣.实验表明, PIDFAR方法能够使得用户潜在兴趣的发现过程脱离用户的好友群体限制,相比基于协同过滤技术的潜在兴趣发现方法明显提高了发现微博用户潜在兴趣的准确率. 相似文献
16.
随着短视频数量的爆发式增长, 精准的个性化短视频推荐成为学术界和工业界的迫切需求。然而,现有的推荐方法没有考虑实际的短视频具有数据多源异构多模态、用户行为复杂多样、用户兴趣动态变化等特点。短视频模态间的语义鸿沟、社交网络用户多行为挖掘、用户动态兴趣捕捉依然是短视频推荐领域面临的三个重要问题。针对当前推荐系统存在的问题,并充分考虑短视频推荐系统的实际需求,本文介绍了短视频推荐中基于图表示学习的短视频推荐方法;研究了短视频异构多模态特征表示,充分挖掘视频内容特征并进行高效融合;研究了短视频社交网络用户多行为表示,通过社交网络用户多种行为挖掘更细粒度的用户偏好;研究了用户的动态偏好表示方法,通过利用时序信息建模用户的动态兴趣,保证推荐结果的准确度并增加其多样性与个性化。本研究可在理论和实践上推进基于图特征学习的短视频推荐研究,也可作为短视频推荐系统的关键技术。 相似文献
17.
基于模糊概念图的文档聚类及其在Web中的应用 总被引:12,自引:0,他引:12
随着World Wide Web上数据量的日益庞大,现有的搜索引擎已经不能满足用户日益增长的需求.利用数据挖掘技术,提高搜索效率,实现了查询的用户化.首先提出了模糊概念图的模型来描述词语间的关系,然后在聚类过程中引入概念知识,提出了基于模糊概念图的文档聚类算法,通过分析用户的浏览行为发现兴趣模式.在上述技术的基础上,给出了一种用户化的智能搜索系统的实现策略,通过分析概念间的关系和用户的兴趣模式,评价超链/文档和查询的相关程度,从而帮助用户得到更准确的信息. 相似文献
18.
用户访问兴趣路径挖掘方法 总被引:2,自引:1,他引:1
针对当前挖掘用户访问模式算法仅将频繁访问路径作为用户浏览兴趣路径的问题,依据使用Web日志挖掘用户兴趣页面时,通过引入页面信息量参数,综合考虑页面访问次数、浏览时间和页面信息量大小来定义用户兴趣度,提出了基于兴趣度的用户访问模式挖掘算法。实验证明该算法是有效的,在用户浏览兴趣度量方面比当前的频繁访问路径挖掘算法更准确。 相似文献
19.
随着互联网上的信息日益增长,个性化的搜索需求越来越迫切,由于用户兴趣的不同和行为的差异,如何为不同的用户提供不同的检索结果成为一个具有挑战性的问题。首先对现有搜索引擎的个性化信息检索和查询扩展技术进行了分类总结,分析了它们各自的优缺点。然后提出了基于社会化标签的个性化查询词扩展方法。这些方法通过从用户所收藏的社会化标签或标签所对应的网页中提取出和用户查询词相关的词,来对用户的初始查询进行扩展。最后利用Delicious网站上的用户数据,对比研究了这几种个性化查询扩展算法。通过与Google进行对比分析实验,结果表明所提出的社会化标签的个性化查询词扩展方法能够较好地满足用户的个性化需求,检索结果比Google的检索结果更接近用户需求。 相似文献
20.
随着电子商务的快速发展,一个越来越重要的问题是如何挖掘并预测用户的导航模式。挖掘用户的导航模式是Web使用挖掘的一项重要任务,也是产生导航推荐的基本方法。由于用户的兴趣是不断变化的,因此很难准确跟踪用户的导航模式。在提出了一种蚁群模型来解决该问题。把Web用户看成是人工的蚂蚁,然后应用蚂蚁理论来指导用户在网站上的选择。首先,基于Web日志数据建立一个用户导航模型;其次,设计了一个算法,动态挖掘群体用户偏好的导航模式;最后,对真实数据集的实验结果表明该方法是有效的。 相似文献