首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
为提高差分隐私保护下推荐算法的准确性,提出了一种考虑差分隐私保护的基于Bhattacharyya系数(BC)的聚类推荐算法.以BC作为项目相似性度量的标准,根据BC相似性对项目进行K-medoids聚类,并在聚类簇中进行私有项目邻居选择.最后,根据最近邻居集信息,对用户的评分进行预测和Top-n推荐.提出的方案有效地克服了已有方法中存在的相似性度量依赖于共同评分的问题,提高了相似性度量的准确性,有效避免了因隐私保护而造成的最近邻居集质量下降的问题.理论分析和实验测试的结果表明,该方法在实现隐私保护的同时还能有效保证推荐的高质量,较好地实现了隐私保护和数据效用之间的平衡,具有良好的应用潜力.  相似文献   

2.
传统的相似度计算方法通过评分信息得出用户之间的相关关系,这些方法仅仅从用户评价信息考虑用户之间的相似度,使计算结果过于片面,在稀疏数据集中受较大影响,导致推荐结果的准确性有所降低。针对一般的协同过滤推荐算法中存在的数据稀疏性问题,通过引入用户相似度权重系数,将Pearson相关系数进行加权处理后与Jaccard相似性方法相结合,提出一种新的计算方案,改进算法考虑了用户对共同评分项目所占的比率和用户对项目的评分取值大小,优化了协同过滤算法中相似度量的关键性能。在MovieLens和Book-Crossing两个公共数据集中进行试验,结果表明,改进算法使平均绝对误差值最大程度上降低了5. 2%,从而有效降低稀疏数据集对推荐结果的影响,显著提升了推荐系统的准确度。  相似文献   

3.
针对传统的协同过滤(collaborative filtering, CF)推荐模型中利用单一的总体评分进行相似性计算,但总体评分不能准确反映用户对物品喜好的问题,提出基于多方面评分的景点协同推荐算法。该算法综合利用用户对景点在景色、趣味性、性价比三个方面的评分计算用户或景点之间的相似性,进而计算目标用户对目标景点的总体评分。试验结果表明:在相似性计算中引入景点在这三个方面的评分信息后,推荐结果的均方根误差、平均绝对误差、覆盖率、准确率和F-度量指标都得到了改善。  相似文献   

4.
基于杰卡德相似性的推荐系统研究   总被引:1,自引:0,他引:1  
协同过滤推荐系统的核心是用户的相似性度量.在杰卡德相似性度量基础上,提出一种修正的杰卡德相似性度量.该方法将用户评分差异的数目融入相似度计算,并综合杰卡德相似度建立神经网络学习模型,选取Movielens数据作为训练集,得到合适的权重.实验结果表明,与pearson相似性度量相比,该方法在用户评价较少时给出相对可靠的推荐,在推荐的精度、平均绝对误差等方面具有一定的优越性.  相似文献   

5.
一种嵌入分布信息的Web文档相似性度量   总被引:1,自引:1,他引:0  
Web文档间的相似性度量是Web文本分类的关键,有效的相似性度量策略可改进Web文本分类的精度.经典的向量空间模型(VSM)仅考虑网页中单词的出现频率,未有效利用单词的分布信息,因而影响了网页的分类精度.论文计算了网页中单词分布位置的均值和方差,并将之引入到网页的相似性计算中,提出了一种直接嵌入分布信息的新的网页相似性度量方法.该方法因合理利用单词的出现频率及其分布信息,可有效改进和拓展经典的网页相似性度量策略.实验结果表明,该网页相似性度量方法是有效可行的.  相似文献   

6.
提出一种基于流形排序和社会化矩阵分解的推荐方法,采用流形排序方法度量用户间的社会相似度,利用正则化技术构建用于评分矩阵因式分解的目标函数,将用户之间的偏好差异作为目标函数的惩罚项,从而将用户之间的社会相似性融入评分矩阵的低阶矩阵分解过程. 实验结果表明,在大型的数据集上,该方法获得了比当前同类方法更好的推荐精度和更低的评分预测均方根误差/评分预测平均绝对误差(RMSE/MAE)值.  相似文献   

7.
协同过滤已在推荐系统中广泛使用,但传统算法存在一定的局限性,如不能较好地适应用户-项目评分矩阵数据集的稀疏性、计算项目相似性时未考虑项目的分类及用户对项目评分和兴趣的时变性等因素。针对这些局限性在传统协同过滤算法基础上提出一种基于大数据集的混合动态协同过滤算法。该算法在计算项目的相似性时引入了时间衰减函数,并综合考虑项目评分的相似性和项目分类的相似性,两者在项目综合相似性中所占权重可以自适应动态调节。算法还在相似性计算和近邻项目选取上做了一些改进。实验表明该算法比传统推荐算法质量有所提高。  相似文献   

8.
针对评分数据的稀疏性制约协同过滤推荐性能的情况,提出一种新的相似性度量方法。首先,定义了用户的模糊信息熵以反映用户评分偏好的不确定程度;其次,利用两两用户的模糊互信息衡量用户之间的相似程度;最后,同时考虑用户之间的模糊互信息和用户的模糊信息熵,并设计一种基于模糊信息熵的相似性度量方法以计算用户之间的相似性。在两个公开数据集上的试验结果表明:基于模糊信息熵的相似性度量方法能够降低数据稀疏性的影响,并能显著提高推荐系统的推荐性能。  相似文献   

9.
协同过滤算法作为一种成功的个性化推荐技术已经被应用到很多领域中.传统的协同过滤算法中用户相似性的计算只考虑了用户评分信息而没有考虑到用户的社会背景信息,针对这个问题,本文提出了基于用户社会信息的相似度计算方法,实验表明,改进后的协同过滤算法能更好地反映用户兴趣,提高推荐精度,在推荐效果方面得到了更好的改善.  相似文献   

10.
针对现有方法未能考虑用户社会地位和信任对象的差异及用户相似性在面对不同项目时不能自适应变化的问题,提出一种融合项目信息与信任机制的协同过滤算法CF-PIC。首先,将项目按照所属领域进行划分,综合考虑用户在不同领域内的全局信任度和局部信任度,构建特定领域的信任网络;然后,将项目间相似性融入Pearson相关系数,计算用户面对不同项目时的偏好程度,以更加精确地捕获其近邻信息;最后,对目标用户进行TOP-N推荐。在真实数据集Epinions上的大量实验表明,该算法的推荐性能相较于经典的协同过滤算法和融入单一信息的算法有了大幅提高。  相似文献   

11.
针对传统协同过滤推荐算法在用户评分数据极端稀疏情况下无法取得令人满意的推荐质量问题,结合User-based 和Item-based 协同过滤算法思想,提出了一种基于选择性预测策略的协同过滤推荐算法,算法利用高相似度阈值来计算用户相似性和项目相似性,并通过形成用户最近邻居集和项目最近邻居集来预测填充评分矩阵。基于Movielens数据集的实验表明,改进的算法有效改善了传统协同过滤推荐算法的数据稀疏性和扩展性问题,明显提高了系统的推荐质量。  相似文献   

12.
传统协同过滤方法面临数据稀疏问题,稀疏的用户-项目关联数据将产生不准确的相似用户或项目,为了改善推荐质量,提出一种基于Map Reduce的混合协同过滤方法.该方法利用用户特征和用户-项目评分数据构造项目偏好向量,然后使用模糊K-Means算法对项目进行聚类,并从每个项目簇中选择相似项目,最后组合所有项目簇的预测结果作出推荐.实验结果显示,该方法能缓解数据稀疏问题,改善推荐精度.  相似文献   

13.
传统基于项目的协同过滤算法离线计算项目间的相似度,提高了向用户推荐的速度,但极大的数据稀疏度影响了推荐质量,且该算法也忽略了用户兴趣随时间变化这一现象. 针对上述问题,提出了一种融合项目聚类和时间权重的动态协同过滤算法,根据用户偏好对项目进行聚类,找出类别偏好相似的候选邻居,再在候选邻居中搜寻最近邻,排除与目标项目共同评分较少的项目干扰,提高了搜寻相似项目的准确性. 同时,引入时间权重来反映用户兴趣随时间的变化,从整体上提高推荐质量. 在MovieLens数据集上进行实验,实验结果表明,本文所提出算法的推荐质量较传统的协同过滤算法有显著提高.  相似文献   

14.
针对User-based协同过滤和Item-based协同过滤算法的不足,提出了一种新的推荐算法。该算法融合用户-项目评分数据集所包含的用户相关和项目相关的信息来推荐商品,并且利用模糊聚类技术分别将相似的项目和相似的用户聚类,改善传统推荐算法的数据稀疏性和可扩展性问题。实验结果表明,将用户相关和项目相关的信息融合能够提供更好的推荐。  相似文献   

15.
针对基于标签和协同过滤的个性化推荐(TCF)没有考虑评分数据的作用和用户兴趣标签稀疏的问题,提出了一种加入评分数据并扩展用户兴趣标签的基于标签和协同过滤的改进推荐算法(ITCF).首先,以项目- 标签相关度构造项目特征向量,并结合评分构造用户特征向量和用户-标签关联度; 其次,对用户的历史偏好标签集进行基于标签相似性和基于近邻用户偏好的扩展; 最后,以MovieLens数据集为例对ITCF算法的有效性进行实验验证.实验结果表明,在稠密的数据集中,ITCF算法的平均准确率和平均召回率比文献[2]和[3]算法的平均准确率和平均召回率分别提升约2.0%和1.7%; 在稀疏的数据集中,当推荐项目数不超过20时,ITCF算法的平均准确率和平均召回率约比文献[2]和文献[3]算法的平均准确率和平均召回率分别提升约0.2%和0.8%.因此,本文提出的ITCF算法具有较好的应用前景.  相似文献   

16.
通过分析传统协同过滤存在的稀疏性、冷启动及实时性问题的根源后,提出一种改进的基于客户颅目的聚类协同过滤组合推荐算法;算法通过运用聚类技术和基于用户的协同过滤算法来预测计算邻居用户,并给出未评分的目标项目的最终预测评分以得到推荐列表,弥补协同过滤推荐在新项目推荐方面的不足的同时稀疏问题也迎刃而解;在预测评分中增加时间权重...  相似文献   

17.
为了提高协同过滤算法的推荐精度,从协同过滤算法中近邻用户/项目组的选择人手,提出基于双重阈值近邻查找的协同过滤算法。该算法能充分利用现有的稀疏用户项目评分矩阵,找出与目标用户相关性较强,且能参与到评分预测过程中的候选用户。实验结果表明,该算法相比传统的协同过滤算法及部分改进算法,其推荐精度有一定提高,对实际应用具有一定的参考价值。  相似文献   

18.
针对传统协同过滤推荐算法存在无法反映用户短时兴趣的问题,提出一种基于门控循环单元(gated recurrent unit, GRU)神经网络与主动学习的协同过滤推荐算法。在采用GRU神经网络的基础上,将数据进行时序化处理,反映用户兴趣变化,并利用主动学习动态采样数据中的高质量的数据进行GRU神经网络的训练,使模型快速建立。在MovieLens1M数据集上的试验结果表明:加入主动学习的GRU模型的推荐算法比基于用户的协同过滤推荐算法(user-based collaborative filtering, UCF)、基于马尔科夫模型的协同过滤推荐算法(markov chain, MC)、基于隐语义模型的协同过滤推荐算法(latent factor model, LFM)算法有更高的短时预测率、召回率、项目覆盖率以及用户覆盖数,能够有效预测用户短时兴趣,提升精度,发掘长尾物品,且与原始GRU模型相比能够以更少的迭代次数达到相同效果。  相似文献   

19.
根据在线社区中群体的历史行为进行物品(或信息)推荐是当前研究热点之一,传统推荐算法都面临数据稀疏性问题的挑战. 针对传统推荐算法知识表示的局限性进行了研究,提出了一种基于标签系统的用户行为知识表示法,把用户在物品上历史行为的统计,转化为对用户在物品标签上的统计,从而缓解数据稀疏的情况. 为了降低标签维度过高导致的计算复杂性问题,提出了采用因子分析法,抽取出潜在重要且稳定的特征因子向量来最终表示用户的历史行为,并据此度量用户行为在特征因子向量上的相似性. 最后采用协同过滤的思想给出了一种新的协同推荐方法. 通过在真实数据集上的大量对比实验,表明该方法在处理具有稀疏性的数据集时,总是能保持更高且更稳定的推荐准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号