共查询到17条相似文献,搜索用时 78 毫秒
1.
2.
为解决用户冷启动问题,提出一种基于随机森林-马尔可夫链相结合的方法。利用随机森林对原始数据进行有监督分类,为特征属性与商品标签建立关联,以此形成第一层推荐列表;利用马尔可夫优良的动态时效性以及最大信息熵原理去除冗余信息,在第一层的列表的基础上进行实时推荐的第二层推荐列表,依次类推形成K层推荐列表。通过MovieLens数据集验证该模型相较于已有的模型具有较高的准确率和召回率。 相似文献
3.
针对传统环境下运行的推荐算法预测精度不高的问题,提出一种基于矩阵分解和随机森林算法的推荐模型.提出的基于数据分割策略和新的学习过程的分布式推荐模型是在Apache Spark上设计的.通过数据分区、模型训练和偏好预测三个步骤处理大规模数据,提高预测质量,解决数据稀疏问题.为了提高模型在大数据环境下的性能,采用基于矩阵分... 相似文献
4.
为提升就业信息推荐结果的精确率和召回率,引入随机森林算法开展对就业信息个性化推荐方法的设计研究。首先,利用随机森林算法挖掘就业信息,并对特征进行提取;其次,针对得到的就业信息和特征进行聚类,利用Apriori算法对就业信息进行关联分析;最后,针对不同求职者的就业需要,为其提供个性化智能推荐。实验结果表明,新的推荐方法在实际应用中推荐结果的精确率和召回率,均明显高于基于关联规则算法的推荐方法。 相似文献
5.
分析了新竞争形式下通信运营商外呼业务的需求,为实现高效的外呼系统,针对现代外呼业务的特点,对外呼系统进行精细化的分析设计,结合人工外呼、IVR自动外呼、短信、彩信、WAP_PUSH、Email等多媒体交互技术,论述了具备精细化管理及多种形式交互的多媒体外呼系统的实现。 相似文献
6.
针对基于邻近关系的协同过滤算法在线推荐效率低的问题,提出了一种可离线训练评分预测模型的算法。通过聚类算法降低用户-项目评分矩阵中用户向量和项目向量的维数,并对数据进行转换使其适用于监督模型;利用转换后的数据离线训练随机森林模型,在线推荐时只需根据随机森林模型的规则进行评分预测,无需查找最邻近用户或项目。实验结果表明,该算法在不降低评分预测精度的情况下,在线推荐效率远高于基于邻近关系的协同过滤算法。 相似文献
8.
9.
情境感知推荐系统通过增加情境信息来提高推荐精度,在实际应用中得到广泛的应用。然而,传统的情境感知推荐方法存在赋予情境因素相同权重,忽略了用户在不同情境下所偏好项目的不同,以及情境因素在推荐过程中所起的影响作用不同的问题。提出一种基于多子域随机森林算法的情境感知推荐方法。该方法对特征重要性按权值大小进行排序,将权值的取值区域分为多个大小相等的子区域,在这些子区域中随机选择特征,构造特征子空间来改进随机森林算法;通过改进的随机森林算法来分解并降低用户、项目和情境的特征维度;使用协同过滤推荐算法来进行冷链物流配载个性化推荐。对LDOS-CoMoDa和Cycle Share两个数据集进行仿真实验,结果表明该方法相比传统方法平均绝对误差减少近10%,有效地提高了推荐系统的预测精度,为情境感知推荐的应用提供借鉴。 相似文献
10.
11.
基于类别随机化的随机森林算法 总被引:1,自引:0,他引:1
随机森林是数据挖掘和机器学习领域中一种常用的分类方法,已成为国内外学者共同关注的研究热点,并被广泛应用到各种实际问题中。传统的随机森林方法没有考虑类别个数对分类效果的影响,忽略了基分类器和类别之间的关联性,导致随机森林在处理多分类问题时的性能受到限制。为了更好地解决该问题,结合多分类问题的特点,提出一种基于类别随机化的随机森林算法(RCRF)。从类别的角度出发,在随机森林两种传统随机化的基础上增加类别随机化,为不同类别设计具有不同侧重点的基分类器。由于不同的分类器侧重区分的类别不同,所生成的决策树的结构也不同,这样既能够保证单个基分类器的性能,又可以进一步增大基分类器的多样性。为了验证所提算法的有效性,在UCI数据库中的21个数据集上将RCRF与其他算法进行了比较分析。实验从两个方面进行,一方面,通过准确率、F1-measure和Kappa系数3个指标来验证RCRF算法的性能;另一方面,利用κ-误差图从多样性角度对各种算法进行对比与分析。实验结果表明,所提算法能够有效提升集成模型的整体性能,在处理多分类问题时具有明显优势。 相似文献
12.
13.
14.
协同过滤是目前应用最广泛和最成功的推荐技术之一。然而,目前该技术的发展面临着严重的冷启动和稀疏性问题,降低了其推荐质量,因此提出了一种基于信任网络随机游走模型的协同过滤推荐方法。该方法融合了基于信任和项目的协同过滤推荐方法,并引入了信任因子作为引导推荐的重要因素。随机游走模型不仅考虑了信任用户对目标项目的评分,也考虑了他们对与目标项目相似的项目的评分。随着随机游走深度的增加,以相似项目的评分信息来代替目标项目的评分信息的概率也逐渐增大。在Epinions真实数据集上的验证结果表明,该方法在推荐评价指标上比其他算法具有更好的推荐结果。 相似文献
15.
16.
随着大数据时代的到来,数据信息呈几何倍数增长。传统的分类算法将面临着极大的挑战。为了提高分类算法的效率,提出了一种基于弱相关化特征子空间选择的离散化随机森林并行分类算法。该算法在数据预处理阶段对数据集中的连续属性进行离散化。在随机森林抽取特征子空间阶段,利用属性向量空间模型计算属性间的相关性,构造弱相关化特征子空间,使所构建的决策树之间相关性降低,从而提高随机森林的分类效果;并通过研究随机森林的并行化策略,结合MapReduce框架,改进并实现了随机森林模型构建过程的双重并行化,进一步改善了算法的计算效率。 相似文献
17.
针对目前微博转发行为预测具有的特征选择任意性、准确率不高的问题,提出了融合异常检测与随机森林的微博转发行为预测方法。首先,提取用户基本特征、博文基本特征、博文内容主题特征,并基于相对熵计算用户活跃度、博文影响力;其次,通过结合过滤式与封装式特征选择方法筛选出关键特征组;最后,融合异常检测与随机森林算法,依据筛选后的关键特征组进行微博转发行为预测,并利用袋外数据误差估计设置随机森林中的决策树和特征数。在真实新浪微博数据集上与基于逻辑回归、决策树、朴素贝叶斯、随机森林等算法的微博转发行为预测方法进行实验对比,结果表明所提方法的预测准确率(90.5%) 高于基准方法中最优的随机森林方法的预测准确率,同时验证了特征筛选方法的有效性。 相似文献