共查询到20条相似文献,搜索用时 62 毫秒
1.
基于兴趣聚类的自动建模 总被引:1,自引:0,他引:1
针对传统粗兴趣粒度表示的建模方法不能准确描述每个用户的兴趣主题的问题,提出基于兴趣聚类的自动建模方法.利用文档聚类发现用户的多个子兴趣主题,从而提高对用户兴趣偏好描述的准确性.将该方法用于个性化信息检索,取得较好的效果. 相似文献
2.
目前搜索引擎返回的结果往往比较多,而且各类文档混合在一起,没有针对性,使用者仍然需要花费大量时间来寻找自己感兴趣的文档。提出了一种对搜索结果动态聚类算法,利用用户的兴趣特点,从搜索结果的文档中抽取摘要,利用这种摘要随着用户的浏览进程进行动态聚类,将这些文档聚成不同类别。用户只需要找出自己感兴趣类别,便可以得到足够多感兴趣的文档。实验证明,这种方法是有效的,并具有抗噪声等良好性能。 相似文献
3.
文本分类和文本聚类在信息过滤系统对用户兴趣进行学习的过程中,都具有很普遍的应用。文中对两者的工作原理进行了对比和分析,从根本上指出了文本分类作为有监督学习方法所存在的固有缺陷,提出了一种在文本聚类后根据词条与聚类的分布特征调整词条权重的方法,并设计和实现了一个基于文本聚类和权重调整的用户兴趣模型构造算法。 相似文献
4.
文本分类和文本聚类在信息过滤系统对用户兴趣进行学习的过程中,都具有很普遍的应用。文中对两者的工作原理进行了对比和分析,从根本上指出了文本分类作为有监督学习方法所存在的固有缺陷,提出了一种在文本聚类后根据词条与聚类的分布特征调整词条权重的方法,并设计和实现了一个基于文本聚类和权重调整的用户兴趣模型构造算法。 相似文献
5.
基于用户访问兴趣的路径聚类研究 总被引:1,自引:0,他引:1
网站可以通过关注用户访问路径、访问某个页面的时间、在此页面的驻留时间以及由那个链接到此页面的URL等信息,利用聚类技术将具有相同兴趣的用户分类。文章将介绍一种新的基于用户访问兴趣的路径聚类算法,其中定义了新的兴趣度、相似度、及聚类中心。最后采用龙城热线网站日志进行真实测试,实验的结果是成功的。 相似文献
6.
微博平台隐含潜在的用户信息,通过微博数据挖掘用户兴趣具有重要的社会意义。结合用户兴趣与微博信息的特点,提出了一种文本聚类与兴趣衰减的微博用户兴趣挖掘(TCID-MUIM)方法。首先,通过基于词林的同义词合并策略弥补建模时词频信息不足的弊端;其次,利用二次Single-Pass不完全聚类算法将用户微博划分为多个簇,将簇合并为同一文档以弥补微博文本短小难以挖掘主题信息的问题;最后,通过LDA模型建模,并考虑用户兴趣随时间变化的问题,引入时间因子,将微博—主题矩阵压缩为用户—主题矩阵,获取用户兴趣。实验表明,较之传统建模方法与合并用户历史微博为同一文档的建模方法,TCID-MUIM方法挖掘的用户兴趣主题具有更好的主题区分度,且更贴合用户的真实兴趣偏好。 相似文献
7.
8.
因子分析在基于用户兴趣的Web文档聚类中的应用 总被引:1,自引:0,他引:1
通过对实际Web访问日志的统计分析认为,在日志中用户的兴趣具有集中性,这说明用户由稳定兴趣驱动访问Web的频率远远高于偶然兴趣的驱动,因此一定时间段的Web访问日志中一定蕴含了用户的稳定兴趣.本文试图利用因子分析理论从用户访问频率矩阵中挖掘出用户的稳定兴趣因子,以此构造用户兴趣空间,并在用户兴趣空间中进行Web文档聚类.该用户兴趣空间突出了用户的共同兴趣,是一个正交空间.实验结果表明,用户兴趣空间中的Web文档聚类优于直接在用户访问频率矩阵(即用户空间)中的聚类.同时,空间的转换达到了数据压缩的效果. 相似文献
9.
因特网的飞速发展,网络资源呈爆炸式的增长。信息检索是人们上网的主要目的之一。目前的信息检索领域有许多检索方法与检索工具,为用户检索信息提供了许多途径。但如何利用搜索引擎实现更快更精确的搜索已经成为这一领域的研究热点。在研究现有的几种搜索引擎的基础上,提出了一种基于用户行为聚类的搜索引擎。通过分析不同的用户行为将搜索用户聚类成不同的用户组,为每组用户返回其喜欢的结果,优化查询结果。 相似文献
10.
针对传统的协同过滤算法忽略了用户兴趣源于关键词以及数据稀疏的问题,提出了结合用户兴趣度聚类的协同过滤推荐算法。利用用户对项目的评分,并从项目属性中提取关键词,提出了一种新的RF-IIF (rating frequency-inverse item frequency)算法,根据目标用户对某关键词的评分频率和该关键词被所有用户的评分频率,得到用户对关键词的偏好,形成用户—关键词偏好矩阵,并在该矩阵基础上进行聚类。然后利用logistic函数得到用户对项目的兴趣度,明确用户爱好,在类簇中寻找目标用户的相似用户,提取邻居爱好的前◢N◣个物品对用户进行推荐。实验结果表明,算法准确率始终优于传统算法,对用户爱好判断较为准确,缓解了数据稀疏问题,有效提高了推荐的准确率和效率。 相似文献
11.
基于用户兴趣的不同,研究如何针对用户的浏览行为来获取用户的有效兴趣数据,并根据现有用户兴趣模型存在的不足,结合Web挖掘中的相关技术,先显式构建用户兴趣模型,后隐式更新用户兴趣模型,从而实现能适应用户兴趣变化的用户兴趣模型。 相似文献
12.
13.
张晋宁 《计算机光盘软件与应用》2010,(16)
互联网迅速发展,个性化信息服务成为研究的热点之一.在个性化信息服务的研究中,用户兴趣建模是核心问题之一.本文针对 RSS 标准的信息源,从用户兴趣知识获取、用户模型表示、用户模型学习、用户模型更新这四个方面论述了基于 RSS 的用户兴趣模型构建过程中的理论、方法和技术. 相似文献
14.
15.
基于RSS信息源的用户兴趣建模与更新 总被引:6,自引:0,他引:6
互联网迅速发展,个性化信息服务成为研究的热点之一。RSS标准提供了结构化的信息模式,便于信息搜索和概要浏览。该文针对基于RSS标准的新闻源,根据用户点击等隐式信息,通过文本相似判定,自动聚类形成用户兴趣子类。用户模型节点、信息类别和用户兴趣子类构成了三层结构的树状用户兴趣模型。信息类别与用户兴趣子类均有对应的兴趣度。用户模型的更新是通过用户兴趣子类的更新与相关兴趣度的更新完成的。通过此模型进行信息推荐还要保证适当的信息冗余度。该模型的个性化程度高且更新效果好。 相似文献
16.
17.
用户兴趣建模是个性化服务的核心,考虑到情景信息对用户偏好的影响,对融和情景信息的用户行为日志数据进行深入研究,提出了一种基于情景信息的用户兴趣建模方法.该方法首先通过计算情景相似度来获得用户当前情景的近似情景集;对“用户-兴趣项-情景”三维模型采用情景预过滤的方法降维处理.然后根据用户浏览内容得到用户兴趣主题,分析页面内容得到每种主题的兴趣关键词,建立基于层次向量空间模型的用户兴趣模型.实验结果表明,本文提出的基于情景信息的用户兴趣模型对用户兴趣的预测误差控制在9%以内,是有效的. 相似文献
18.
针对微博用户兴趣建模问题,提出一种在微博短文本数据集上建立用户兴趣模型的方法。为缓解短文本造成的数据稀疏性问题,在分析微博短文本结构和内容的基础上,给出微博短文本重构概念,根据微博相关的其他微博短文本和文本中包含的3种特殊符号,进行文本内容的扩展,从而扩充原始微博的特征信息。利用HowNet2000概念词典将重构后文本的特征词集映射到概念集。以抽象到概念层的文本向量为基础进行聚类,划分用户的兴趣集合,并给出用户兴趣模型的表示机制。实验结果表明,短文本重构和概念映射提高了聚类效果,与基于协同过滤的微博用户兴趣建模方法相比,平衡均值提高29.1%,表明构建的微博用户兴趣模型具有较好的性能。 相似文献
19.
融合用户评分与显隐兴趣相似度的协同过滤推荐算法 总被引:1,自引:0,他引:1
协同过滤算法是推荐系统中使用最广泛的算法,其核心是利用某兴趣爱好相似的群体来为用户推荐感兴趣的信息.传统的协同过滤算法利用用户-项目评分矩阵计算相似度,通过相似度寻找用户的相似群体来进行推荐,但是由于其评分矩阵的稀疏性问题,对相似度的计算不够准确,这间接导致推荐系统的质量下降.为了缓解数据稀疏性对相似度计算的影响并提高... 相似文献
20.
该文在综合分析了现有个性化检索系统中用户兴趣模型表示方法以及建立与更新机制的优缺点的基础上,设计了一种基于分类知识库的,结合关键词与主题概念的用户兴趣表示方法。模型中将用户的兴趣分成短期兴趣和长期兴趣,并且对两种兴趣采用不同的建立与更新机制。通过不断的更新与优化模型,使模型能准确反映用户的兴趣特征。 相似文献