共查询到20条相似文献,搜索用时 0 毫秒
1.
推荐系统通过建立用户和信息产品之间的二元关系,利用用户行为产生的数据挖掘每个用户感兴趣的对象并进行推荐,基于用户的协同过滤是近年来的主流办法,但存在一定局限性:推荐时需要考虑全部用户,而单个用户往往只与少部分用户类似。为了解决这个问题,提出了基于改进Canopy聚类的协同过滤推荐算法,将用户模型数据密度、距离与用户活跃度结合,计算用户数据权值,对用户模型数据进行聚类。由于结合了Canopy的聚类思想,同一用户可以属于不同的类,符合用户可能对多领域感兴趣的情况。最后对每个Canopy中的用户进行相应的推荐,根据聚类结果与用户评分预测用户可能感兴趣的对象。通过在数据集MovieLens和million songs上与对比算法进行MAE、RMSE、NDGG三个指标的比较,验证了该算法能显著提高推荐系统预测与推荐的准确度。 相似文献
2.
3.
4.
一种改进的Slope One协同过滤算法 总被引:1,自引:0,他引:1
相对传统的基于用户项目评分的协同过滤算法,Slope One算法简单、高效。但该算法依赖于大量用户对待预测项目的评分,如果对预测项目评分的用户较少,没有考虑用户本身的喜好,将对评分预测的结果有影响。因此,引入描述关键字的语义相似度,利用关键字相似性度量项目间的相似程度,并结合该用户对其他项目的评分,提出一种基于项目语义相似度的改进Slope One算法,并在标准的MovieLens数据集上进行预测实验。实验数据表明,相对于原算法,改进的算法在一定程度上提高了预测的准确性。 相似文献
5.
针对Web服务的可靠性预测已成为服务计算领域的研究热点。为提高已有的针对Web服务可靠性预测方法的性能,提出两种方法。首先,针对基于协同过滤的Web服务可靠性预测方法,对用户的相似性、服务相似性以及预测值的计算方法都进行了适当的改进;其次,将k-means聚类算法与Slope One算法进行集成,进而用于开展Web服务可靠性预测。实验结果表明,相较已有方法,本文所提出的方法具有更高的预测精度。 相似文献
6.
7.
通过对传统协同过滤算法中存在的问题以及解决情况进行分析,论文采用了一种混合减聚类的遗传模糊聚类的协同过滤推荐算法,利用混合减聚类的模糊聚类可以更有效地对数据进行柔性划分,更好地发挥遗传算法的全局搜索能力,加快收敛速度,同时也能够很好地解决数据稀疏性带来的冷启动问题. 相似文献
8.
当今是一个数据爆炸时期,促进信息过滤技术发展,个性化推荐系统作为其中一种重要的应用方式,已经成为很多网站一种个性化信息服务方式,但传统的协同过滤算法存在扩展性和稀疏性的问题。提出一种基于项目聚类、项目语义相似度和奇异值分解的混合推荐模型,来应对传统的协同过滤推荐系统面临的算法的伸缩性问题、数据稀疏性问题和推荐的精准度问题,进行推荐。结果表明,与传统的算法相比,使用该改进算法能显著地提高推荐系统的推荐质量。 相似文献
9.
针对多项式有限混合模型参数估计过程中存在的初始化依赖、参数易收敛到边界值以及容易陷入局部最优等问题,引入了最小信息长度准则,优化多项式有限混合模型的参数估计过程。在此基础上,采用基于多项式有限混合模型的聚类算法对用户评分行为进行聚类,利用模型求解得到的聚类归属概率对Slope One算法实施改进。实验结果表明:应用最小信息长度准则对多项式有限混合模型进行优化后,聚类效果明显提高;同时,相比于基于用户聚类的Slope One推荐算法,改进算法具有明显的改进效果。 相似文献
10.
推荐系统运用统计和知识发现技术在实时交互系统中提供产品推荐,并且已经在电子商务中取得了较广泛的应用。本文中我们介绍了一种不同于以往的推荐产生算法,称之为改进的聚类邻居协同过滤推荐算法,试验表明我们的算法比k-邻近点算法和聚类邻居算法具有更好的效果。 相似文献
11.
经典的Slope One算法采用线性回归模型对目标项目进行预测评分,但在项目评分偏差表构建过程中产生了部分噪声数据,影响了算法的推荐性能。为了解决该问题,建立了一种基于局部近邻Slope One协同过滤推荐算法。算法计算了当前活跃用户针对不同推荐商品的近邻用户集,其邻居用户集根据目标项目的不同而动态变化;根据活跃用户关于不同目标项目的邻居用户数据来进一步优化项目之间的平均偏差,进而产生推荐。对比实验说明,该算法在MovieLens数据集上具有较高推荐精度。 相似文献
12.
13.
采用聚类算法优化的K近邻协同过滤算法 总被引:1,自引:0,他引:1
协同过滤推荐是电子商务系统最重要的技术之一,而协同过滤技术中一种被广泛使用的算法就是基于用户评分相似度的K近邻算法.该算法简单有效,易于实现.但K近邻算法在决定待预测样本的预测评分时,并未考虑这K个最近邻与其隶属类别的关联程度.作为评分矩阵中的不同样本,由于它们对分类贡献各不相同,因此在评分预测时需要区别对待.本文采用中心聚类算法,先求出各样本与其所属类别的类别关联度,再利用类别关联度来区别对待待预测样本的K个最近邻.通过实验证明,优化后的K近邻算法能较好的提高推荐精度. 相似文献
14.
针对传统的协同过滤推荐算法存在评分数据稀疏和推荐准确率偏低的问题,提出了一种优化聚类的协同过滤推荐算法。根据用户的评分差异对原始评分矩阵进行预处理,再将得到的用户项目评分矩阵以及项目类型矩阵构造用户类别偏好矩阵,更好反映用户的兴趣偏好,缓解数据的稀疏性。在该矩阵上利用花朵授粉优化的模糊聚类算法对用户聚类,增强用户的聚类效果,并将项目偏好信息的相似度与项目评分矩阵的相似度进行加权求和,得到多个最近邻居。融合时间因素对目标用户进行项目评分预测,改善用户兴趣变化对推荐效果的影响。通过在MovieLens 100k数据集上实验结果表明,提出的算法缓解了数据的稀疏性问题,提高了推荐的准确性。 相似文献
15.
协同过滤推荐算法可以根据已知用户的偏好预测其可能感兴趣的项目,是现今最为成功、应用最广泛的推荐技术。然而,传统的协同过滤推荐算法受限于数据稀疏性问题,推荐结果较差。目前的协同过滤推荐算法大多只针对用户-项目评分矩阵进行数据分析,忽视了项目属性特征及用户对项目属性特征的偏好。针对上述问题,提出了一种融合聚类和用户兴趣偏好的协同过滤推荐算法。首先根据用户评分矩阵与项目类型信息,构建用户针对项目类型的用户兴趣偏好矩阵;然后利用K-Means算法对项目集进行聚类,并基于用户兴趣偏好矩阵查找待估值项所对应的近邻用户;在此基础上,通过结合项目相似度的加权Slope One算法在每一个项目类簇中对稀疏矩阵进行填充,以缓解数据稀疏性问题;进而基于用户兴趣偏好矩阵对用户进行聚类;最后,面向填充后的评分矩阵,在每一个用户类簇中使用基于用户的协同过滤算法对项目评分进行预测。实验结果表明,所提算法能够有效缓解原始评分矩阵的稀疏性问题,提升算法的推荐质量。 相似文献
16.
17.
针对基于邻近关系的协同过滤算法在线推荐效率低的问题,提出了一种可离线训练评分预测模型的算法。通过聚类算法降低用户-项目评分矩阵中用户向量和项目向量的维数,并对数据进行转换使其适用于监督模型;利用转换后的数据离线训练随机森林模型,在线推荐时只需根据随机森林模型的规则进行评分预测,无需查找最邻近用户或项目。实验结果表明,该算法在不降低评分预测精度的情况下,在线推荐效率远高于基于邻近关系的协同过滤算法。 相似文献
18.
针对传统的协同过滤算法忽略了用户兴趣源于关键词以及数据稀疏的问题,提出了结合用户兴趣度聚类的协同过滤推荐算法。利用用户对项目的评分,并从项目属性中提取关键词,提出了一种新的RF-IIF (rating frequency-inverse item frequency)算法,根据目标用户对某关键词的评分频率和该关键词被所有用户的评分频率,得到用户对关键词的偏好,形成用户—关键词偏好矩阵,并在该矩阵基础上进行聚类。然后利用logistic函数得到用户对项目的兴趣度,明确用户爱好,在类簇中寻找目标用户的相似用户,提取邻居爱好的前◢N◣个物品对用户进行推荐。实验结果表明,算法准确率始终优于传统算法,对用户爱好判断较为准确,缓解了数据稀疏问题,有效提高了推荐的准确率和效率。 相似文献
19.
针对目前协同过滤推荐算法的推荐质量和推荐效率低的问题,提出了一种基于改进蜂群K-means聚类模型的协同过滤推荐算法。首先,根据用户属性信息,采用改进蜂群K-means算法对用户进行聚类,建立用户聚类模型;然后,计算目标用户与用户聚类模型中各聚类中心的距离,其中距离最近的类为目标用户的检索空间;最后,从检索空间中依据用户-项目评分矩阵通过相似度计算搜索目标用户的最近邻居,由最近邻居的信息产生推荐列表。实验结果表明,该算法降低了平均绝对误差值,缩短了运行时间,提高了推荐质量和推荐效率。 相似文献
20.
针对传统Slope One算法在相似性计算时未考虑项目属性信息和时间因素对项目相似性计算的影响,以及推荐在当前大数据背景下面临的计算复杂度高、处理速度慢的问题,提出了一种基于聚类和Spark框架的加权Slope One算法。首先,将时间权重加入到传统的项目评分相似性计算中,并引入项目属性相似性生成项目综合相似度;然后,结合Canopy-K-means聚类算法生成最近邻居集;最后,利用Spark计算框架对数据进行分区迭代计算,实现该算法的并行化。实验结果表明,基于Spark框架的改进算法与传统Slope One算法、基于用户相似性的加权Slope One算法相比,评分预测准确性更高,较Hadoop平台下的运行效率平均可提高3.5~5倍,更适合应用于大规模数据集的推荐。 相似文献