共查询到20条相似文献,搜索用时 15 毫秒
1.
为了减少协同过滤算法存在的噪音数据以及数据稀疏性问题,提高算法准确性,本文提出一种基于信息熵和改进相似度的协同过滤算法,使用用户信息熵模型来判断噪音数据,排除噪音数据对实验结果的干扰;使用面向稀疏数据的改进相似度计算方法,使用全部评分数据而不是依靠共同的评分项来计算,对缓解稀疏数据对推荐结果的精确性影响有很大帮助。实验结果表明,该算法能在一定程度上排除噪音数据对结果的影响,缓解数据稀疏对推荐结果精确性的干扰,提高该推荐算法的精确性,且缓解了传统推荐系统算法中常见的一些问题,与传统的协同过滤算法相比,该算法的精确性更高。 相似文献
2.
针对传统协同过滤推荐算法仅通过使用用户评分数据计算用户相似度以至于推荐精度不高的问题,提出一种改进的协同过滤推荐算法。首先,以用户评分的平均值作为分界点得出用户间的评分差异度,并将其作为权重因子计算基于评分的用户相似度;其次,依据用户项目评分和项目类别信息挖掘用户对项目类别的兴趣度以及用户项目偏好,并以此计算用户偏好相似度;然后,结合上述两种相似度加权产生用户综合相似度;最后,融合传统项目相似度和用户综合相似度进行评分预测及项目推荐。实验结果表明,相对于传统的基于用户评分的协同过滤推荐算法,所提算法在数据集下的平均绝对误差值平均降低了2.4%。该算法可在一定程度上提高推荐算法精度以及推荐质量。 相似文献
3.
4.
5.
利用电商平台推荐算法难以准确建立用户关系网络,为保证平台内商品推荐的准确性,研究关联规则挖掘Apriori算法在农产品电商平台推荐中的应用方法。首先,计算具备相似性的用户关系强度,得到词语概率的分布规律,通过时间综合相似度获得多个主题内容的演化结果;其次,基于关联规则挖掘Apriori算法建立电商平台推荐模型,得到新的商品推荐算法;最后,以平均绝对误差与均方根误差作为推荐算法精度的指标,进行实验对比分析。实验结果表明,在不同的特征维数下,关联规则挖掘Apriori算法的平均绝对误差与均方根误差均为相同条件下的最小值,可见该方法在农产品电商平台推荐中最准确,其推荐精度最高。 相似文献
6.
协同过滤推荐算法是个性化推荐系统中最常用的方法之一,其中相似度计算直接影响基于内存的协同过滤推荐算法的推荐质量.针对协同过滤推荐算法中传统的用户间相似度计算方法仅考虑共同评分项评分数值上的差异导致难以准确衡量非偏好评分场景中用户间相似度的问题,本文提出一种基于余弦相似度并融合评分相对差异的用户间相似度计算方法.该方法考虑评分规模上的差异,计算评分相对相似度并且引入放大系数,在非偏好评分的场景下可以更加准确地区分用户间差异.在真实的数据集上完成对比实验分析,结果表明在非偏好评分场景下,所提方法相较于对比方法能降低预测误差,提高推荐质量. 相似文献
7.
随着信息共享时代的发展,海量数据的诞生对推荐系统提出了更高的要求.针对微博的海量数据,提出了一种融合朴素贝叶斯分类和基于用户的协同过滤算法的混合推荐算法.该算法将文本关键字作为特征属性,利用贝叶斯分类法筛选出用户可能感兴趣的数据,缩小推荐结果集;然后采用基于用户的协同过滤算法,通过计算用户相似度,根据最近邻居得到推荐结... 相似文献
8.
一种基于向量的关联规则挖掘算法改进 总被引:1,自引:0,他引:1
通过对Apriori算法思想和传统的向量挖掘算法进行分析,提出一种基于向量运算的关联规则改进算法.该算法采用树形数据结构,克服了Apriori算法需多次扫描数据库这一缺点,并通过向量计算来避免生成候选项集,经过实验证明提高了关联规则挖掘的效率. 相似文献
9.
10.
11.
针对传统基于用户的协同过滤推荐算法在大数据环境下存在评分高维稀疏性、推荐精度低的问题,提出一种基于人口统计学数据与改进聚类模型相结合的协同过滤推荐算法,以提高推荐系统精度和泛化能力。该方法首先通过用户人口统计学数据属性,结合用户-项目评分矩阵计算各个用户间的相似度;然后对用户、项目进行分层近邻传播聚类,根据用户对项目的评分数据计算用户或项目之间的相似性,产生目标用户或项目的兴趣近邻;最后根据兴趣最近邻进行推荐。对Epinions,MovieLents等数据集进行仿真实验,仿真的结果表明, 与传统的协同过滤算法相比, 提出的算法提高了推荐精度,为传统的协同过滤推荐算法提供了参考。 相似文献
12.
协同过滤算法广泛应用于推荐系统中,论文针对传统协同过滤算法中数据稀疏性及推荐准确率不高的问题,提出了一种改进的协同过滤算法。首先通过SVD++算法对用户-项目评分矩阵进行填充,初步缓解数据的稀疏性问题,然后通过计算相似度引入项目属性,最后通过改进Slope One算法对评分矩阵进行二次预测计算,提高推荐算法的准确度。在数据集MovieLens100K数据集上对论文提出的混合推荐算法作五折交叉实验,结果表明混合算法提高了推荐系统的预测准确度。 相似文献
13.
基于邻域的协同过滤算法中,用户(项目)相似度的计算对预测和推荐结果有重要影响。传统相似度基于共同评分项目,能快速计算出相似度结果,但在稀疏数据下,推荐准确性较低。目前大多数改进的协同过滤算法通过制定较复杂的相似度公式,提高推荐准确性,但往往忽略了模型的计算时间。为达到在降低时间成本的同时执行有效的推荐,提出融合相似度和预筛选模式的协同过滤算法。首先在相似度模型中定义相对评分差异,并列举应满足的定性条件得到优化的相似度,同时考虑基于信息熵改进的评分偏好和用户全局评分的数量信息作为权重因子,更好地区分用户间差异,缓解稀疏数据下相似度计算不准确的问题。其次通过分析相似度模型和评分预测公式的隐式约束,提出预筛选模式,过滤掉大量无效的用户及对应的评分数据,进一步提高计算效率。最终通过融合相似度和预筛选模式得到协同过滤算法。在基准数据集上的实验表明,与其余8种算法相比,提出的算法具有良好的推荐质量和较高的时间效率。 相似文献
14.
15.
关联规则挖掘Apriori算法的研究与改进 总被引:7,自引:1,他引:6
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联.Apriori算法是关联规则挖掘中的经典算法.然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点.对Apriori算法的原理及效率进行分析,指出了一些不足,并且提出了改进的Apriori_LB算法.该算法基于新的数据结构,改进了产生候选项集的连接方法.在详细阐述了Apriori_LB算法后,对Apriori算法和Apriori_LB算法进行了分析和比较,实验结果表明改进的Apriori_LB算法优于Apriori算法,特别是对最小支持度较小或者项数较少的事务数据库进行挖掘时,效果更加显著. 相似文献
16.
17.
传统协同过滤推荐算法在处理海量数据时存在数据稀疏性和项目长尾效应,导致推荐精度较低。针对该问题,结合本体语义和用户属性,提出一种改进的协同过滤算法。利用本体计算项目之间的语义相似度,构建项目相似度矩阵,同时引入用户属性计算用户相似度矩阵。通过融合本体语义和用户属性形成用户-项目评分矩阵,并对该矩阵的预测评分进行加权处理,生成TOP-N推荐结果。实验结果表明,相比传统皮尔逊相似度计算协同过滤算法、基于本体语义的协同过滤算法和基于评分矩阵填充与用户兴趣的协同过滤算法,该算法的平均绝对误差较低,准确率较高,综合性能及新颖度较优。 相似文献
18.
《计算机应用与软件》2017,(8)
针对传统协同过滤算法中评分数据稀疏性及所造成推荐质量不高的问题,提出一种巴氏系数(Bhattacharyya Coefficient)改进相似度的协同过滤算法。在基于近邻协同过滤算法基础上,首先利用Jaccard相似性来计算用户间的全局相似性;其次使用巴氏系数获得评分分布的整体规律,并结合Pearson相关系数来计算其局部相似性;最后融合全局相似性和局部相似性得到最终的相似度矩阵。实验结果表明,该算法在稀疏数据集上获得更好的推荐结果,有效地缓解了评分数据稀疏性问题,提高了推荐的准确度。 相似文献
19.
协同过滤推荐算法使用评分数据作为学习的数据源,针对协同过滤推荐算法中存在的评分数据稀疏以及算法的可拓展性问题,提出了一种基于聚类和用户偏好的协同过滤推荐算法。为了挖掘用户的偏好,该算法引入了用户对项目类型的平均评分到评分矩阵中,并加入了基于用户自身属性的相似度;同时,为了降低数据稀疏性,该算法使用Weighted Slope One算法填充评分数据中的未评分项,并通过融入密度和距离优化初始聚类中心的K-means算法聚类填充后的评分数据中的用户,缩小了相似用户的搜索空间;最后在聚类后的数据集中使用传统的协同过滤推荐算法生成目标用户的推荐结果。通过使用MovieLens100K数据集实验证明,提出的算法对推荐效果有所改善。 相似文献
20.
随着互联网的迅速发展,网络上可用的数据呈爆炸式增长,搜索相关信息的过程花费了大量的时间,为了解决这一问题,推荐系统应运而生。协同过滤推荐算法是推荐系统的重要组成部分。针对传统协同过滤推荐算法中数据稀疏性严重影响推荐精确性的问题,提出了一种基于专家动态生成的协同过滤推荐算法。该算法通过计算用户之间的交叉性、信任性以及趋同性三项指标值和专家因子值动态地为每个用户挖掘出特定的专家数据集,然后通过计算用户与所挖掘专家数据集之间的相似度来预测评分。在FilmTrust数据集上的实验结果表明,相较于传统的基于用户的协同过滤推荐算法(UBCF)和采用均值中心化改进的UBCF算法(RUBCF),MAE分别降低了75.18%和6.90%,RMSE分别降低了69.73%和6.54%,精确性得到了明显的提升。 相似文献