共查询到20条相似文献,搜索用时 0 毫秒
1.
基于用户的协同过滤通过获取最近邻的偏好实现对目标用户偏好的预测推荐,相似度计算为其核心步骤.传统数值相似度计算依赖于用户共同评分项的评分数值,用户-项目评分矩阵稀疏程度的加剧导致数值相似度计算准确性降低,难以为目标用户选取可靠的最近邻,影响推荐效果;现有结构相似度大多利用用户共同评分项占比度量,计算简单,受数据稀疏影响... 相似文献
2.
3.
推荐算法通过历史数据发现用户的兴趣偏好,在数据资源中寻找用户的偏好信息,并对用户进行推荐。目前,推荐系统中的协同过滤算法在各领域应用广泛,由于数据稀疏性和冷启动,使得推荐质量有所下降,为提升推荐精度,有学者从相似度方向进行研究。总结了推荐系统中最广泛使用的协同过滤算法,以及推荐系统中常用的传统相似度算法;对比分析了基于Pearson相关系数的相似度、余弦相似度、修正的余弦相似度等的适用场景;从冷启动和数据稀疏等方面分析了相似度的研究现状,研究表明通过混合相似度计算用户相似性,提高了推荐质量。最后,总结了相关文献在改进后存在推荐效率低、复杂度增高的问题,在提高推荐精度和推荐效率方面对相似度改进进行了展望。 相似文献
4.
针对传统协同过滤推荐算法在数据稀疏的情况下存在的性能缺陷和相似性度量方法的不足,为了提高推荐精度,改进原算法得到了一种基于多层次混合相似度的协同过滤推荐算法。该算法主要分为三个不同的层次:首先采用模糊集的概念将用户评分模糊化,计算用户的模糊偏好,并结合用户评分的修正余弦相似度和用户评分的Jarccad相似度总体作为用户评分相似度;再对用户评分进行分类来预测用户对项目类别的兴趣程度,从而计算出用户兴趣相似度;然后利用用户的特征属性来预测用户之间的特征相似度;其次根据用户评分数量来动态地融合用户兴趣相似度及用户特征相似度;最后融合三个层次的相似度作为用户混合相似度的结果。利用MovieLens公用数据集对改进前后的算法进行对比实验,结果表明:当在邻居集合数量较少时,改进的混合算法相对修正余弦相似度算法的平均绝对偏差(MAE)下降了5%左右;较改进的修正的Jaccard相似性系数的协同过滤(MKJCF)算法也存在略微的优势,随着邻居集合数的增加MAE也平均下降了1%左右。该算法采用多层次的推荐策略提高了用户的推荐精度,有效地缓解了数据稀疏性问题和单一度量方法的影响。 相似文献
5.
协同过滤算法是推荐系统的一种常见算法,其核心思想是通过历史数据挖掘用户偏好,计算对象相似近邻项进行推荐。但是一般真实数据都存在严重的数据稀疏性问题,用户或者项目之间的共同评分项目过少,使得一些传统相似度算法计算不准确、推荐准确度不高。传统Slope One算法准确度不高,但其实现简单,运行效率高,可以用做稀疏数据预填充,从而改善相似度计算的准确度。因此,结合Slope One算法,该文提出了一种基于降低数据稀疏度的协同过滤算法。首先对用户评分数据进行分层聚类,再使用Weighted Slope One算法对高稀疏度数据集部分空白数据进行预测填充,从而大幅度降低数据稀疏度,提高了皮尔逊相似度计算的准确度,最后再引入对象属性偏好相似度进行融合。通过MovieLens 100 K数据集进行算法验证,从结果中可以清晰地看出其平均绝对误差(Mean Absolute Error, MAE)有所降低,证明该算法能在一定程度上提升推荐结果的准确度。 相似文献
6.
7.
一种结合共同邻居和用户评分信息的相似度算法 总被引:1,自引:0,他引:1
随着互联网的发展,推荐系统逐步得到广泛应用,协同过滤(CF)是其中运用得最早.最成功的技术之一.CF首先根据用户间的相似度,找出每个用户的近邻;然后根据目标用户近邻的评分预测目标用户的评分;最后把预测评分较高的项目推荐给目标用户.因此相似度计算方法直接关系到预测结果的准确性,对推荐起着至关重要的作用.目前,学者们已从不同的角度提出了各种各样的相似度计算方法,其中共同邻居算法(common-neighbors)是一种简单有效的方法.但此法仅考虑了两用户间的共同邻居数,忽略了用户的具体评分信息.针对这个问题对共同邻居算法进行了改进,同时考虑了共同邻居数和用户的评分信息.实验结果表明,改进的共同邻居算法在一定程度上可提高评分预测的准确性. 相似文献
8.
在用户对项目进行评分的时候,有时会出现不合理因素导致用户对项目做出不合理评分,使得推荐过程出现偏差。为修正这一偏差,采用评分矩阵的多种维度进行相似度比较以修正不合理评分,再用修正后的评分进行协同过滤推荐。而在采用变维度评分矩阵进行相似度对比时,主要利用同一用户对相似项目评分的相近性,对比2个用户对多个相似项目评分数组在不同维度下的余弦相似度。首先将多个评分构建成等维度的几个数组,对比2个用户的各个评分数组相似度,当某个相似度与其它相似度差别较大时,认为该相似度对应的2个用户的数组中至少有1个包含不合理评分;然后将2个数组按同样的方式均分为维度更低的数组,以此类推,最终确定不合理评分;最后以所有合理评分数组对应的相似度均值作为不合理评分数组对应的相似度,从而修正不合理评分。利用MovieLens和Bookcrossing数据库进行实验,结果表明:带修正评分的协同过滤算法相比未修正前的评分具有更高的推荐精度,其推荐评分MAE明显下降,本文算法相比对照算法获得了更优的MAE,Precision和Coverage。 相似文献
9.
10.
基于用户的协同过滤推荐算法在进行近邻用户的筛选时以用户之间相似度的计算结果作为依据,数据量的增大加剧了数据的稀疏程度,导致了计算结果的准确性较差,影响了推荐准确度.针对该问题本文提出了一种基于用户联合相似度的推荐算法.用户联合相似度的计算分为用户对项目属性偏好的相似度和用户之间人口统计学信息的相似度两个部分.用户的项目属性偏好引入了LDA模型来计算,计算时评分数据仅作为筛选依据,因而避免了对数据的直接使用,减缓了稀疏数据对相似度计算结果的影响;用户之间人口统计学信息的相似度则在数值化人口统计学信息之后通过海明距离进行度量.实验结果表明,本文提出的算法在推荐准确度上优于传统协同过滤推荐算法. 相似文献
11.
随着互联网技术的迅猛发展,互联网信息急剧增长,信息过载问题愈发凸显。面对海量的互联网信息,用户往往需要耗费大量的时间来搜索所需的信息或产品,而搜索的解往往受到制约。为解决信息过载问题,推荐系统应运而生。推荐系统根据用户的历史行为推测其需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户。作为推荐领域中一类重要的推荐方法,基于记忆的协同过滤方法通常依据用户或产品的近邻信息来构造评分预测函数,其核心在于准确度量用户或产品之间的相似度。传统的相似度量,如皮尔逊、余弦及秩相关系数等,通常只考虑了用户之间的线性关系;而启发式相似度如基于3个特殊因子的PIP相似度及其改进方法,则只刻画了用户之间的非线性关系。事实上,在推荐系统中,就用户之间的相似关系而言,仅用线性或是非线性函数来度量均是不准确的。为了更为精细地刻画用户之间的相似程度,文中提出了基于非线性函数的用户极端评分行为的相似程度度量指数,通过将该指数融入传统的线性相关系数,构造了一个考虑极端评分行为的新的相似度。为验证该方法的有效性,基于Ml(100k)和Ml-latest-small两个数据集,将其与传统相似度以及启发式相似度进行比较,结果... 相似文献
12.
《计算机应用与软件》2017,(8)
针对传统协同过滤算法中评分数据稀疏性及所造成推荐质量不高的问题,提出一种巴氏系数(Bhattacharyya Coefficient)改进相似度的协同过滤算法。在基于近邻协同过滤算法基础上,首先利用Jaccard相似性来计算用户间的全局相似性;其次使用巴氏系数获得评分分布的整体规律,并结合Pearson相关系数来计算其局部相似性;最后融合全局相似性和局部相似性得到最终的相似度矩阵。实验结果表明,该算法在稀疏数据集上获得更好的推荐结果,有效地缓解了评分数据稀疏性问题,提高了推荐的准确度。 相似文献
13.
14.
基于邻居(neighborhood-based)的协同过滤是一项很受欢迎的用于推荐系统的技术.它可以分为基于用户(user-based)和基于项目(item-based)协同过滤.它通过用户或项目之间的相似性预测用户对于未评分项目的偏好.然而,传统的相似度方法易受数据稀疏影响.为了解决这个问题,提出了基于心理测量学(psychometrics-based)的相似度方法.实验结果表明,提出的相似方法更适合基于邻居协同过滤,它们可以提高推荐准确性和覆盖度(coverage). 相似文献
15.
针对传统的协同过滤推荐由于数据稀疏性导致物品间相似性计算不准确、推荐准确度不高的问题,文中提出了一种基于用户评分偏好模型、融合时间因素和物品属性的协同过滤算法,通过改进物品相似度度量公式来提高推荐的准确度。首先考虑到不同用户的评分习惯存在差异这一客观现象,引入评分偏好模型,通过模型计算出用户对评分类别的偏好,以用户对评分类别的偏好来代替用户对物品的评分,重建用户-物品评分矩阵;其次基于时间效应,引入时间权重因子,将时间因素纳入评分相似度计算中;然后结合物品的属性,将物品属性相似度和评分相似度进行加权,完成物品最终相似度的计算;最后通过用户偏好公式来计算用户对候选物品的偏好,依据偏好对用户进行top-N推荐。在MovieLens-100K和MovieLens-Latest-Small数据集上进行了充分实验。结果表明,相比已有的经典的协同过滤算法,所提算法的准确率和召回率在MovieLens-100K数据集上提高了9%~27%,在MovieLens-Latest-Small数据集上提高了16%~28%。因此,改进的协同过滤算法能有效提高推荐的准确度,有效缓解数据稀疏性问题。 相似文献
16.
传统的用户相似度计算方法中每个项目的权重是相同的,然而分析传统推荐算法和现实情形,用户间共同高评分项目的权重应该高于用户间共同低评分项目的权重,并且传统用户相似度计算方法没有考虑项目间的类群关系。针对上述问题,提出了一种给项目加权的方法,从而得到考虑项目相似权重的用户相似度计算方法。通过在MovieLens数据集上进行实验,与基于传统用户相似度计算方法的协同过滤算法比较,实验结果表明,考虑了项目相似度权重的协同过滤算法能显著提高评分预测的准确性和推荐系统的质量。 相似文献
17.
18.
赵京东 《计算机工程与应用》2006,42(28):31-33
全面分析了近年来百余篇关于Vague集理论及应用的论文,将以往Vague集的相似度分为5类,指出了它们存在的一些不足之处。在此基础上,给出了更一般的离散Vague集间的相似度。 相似文献
19.
20.
药物重定位算法可以为发现药物的新用途提供理论上的支持。针对传统药物重定位推荐算法的不足,提出一种基于多相似度融合的药物重定位推荐算法(MSF)。首先通过药物-疾病数据源计算出疾病相似度,再通过药物-化学结构、药物-靶蛋白以及药物-副作用数据源计算出三种相似度并融合为药物相似度,最后利用两种相似度计算药物与疾病对应关系的预测值,并通过预测值融合方法融合为最终预测值。实验结果表明,与SLAMS算法和DRCFFS算法相比,MSF算法在精确率和召回率上有较大的提高;与针对单个数据源的药物重定位算法相比,通过融合多种数据源,预测值的可靠性和精确性都有进一步的提升。案例分析显示,MSF算法可以有效地预测出有治疗效果的药物-疾病组合。 相似文献