首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
沈晶磊  虞慧群  范贵生  郭健美 《计算机科学》2017,44(11):164-167, 186
如今随着推荐系统势头的加强,如何对用户行为进行快速而准确的预测变得愈加重要。通过分析网上社区帖子的点赞和点踩数据,实现了基于随机森林的推荐系统。该系统将实际问题转化为分类模型,并实现了数据处理、特征提取和参数调整。同时,该系统还对用户浏览帖子后是否产生交互行为进行了预测。最后,通过实验仿真并利用F1值对实验结果进行评估。实验结果证明了系统的有效性和效率。  相似文献   

2.
为解决用户冷启动问题,提出一种基于随机森林-马尔可夫链相结合的方法。利用随机森林对原始数据进行有监督分类,为特征属性与商品标签建立关联,以此形成第一层推荐列表;利用马尔可夫优良的动态时效性以及最大信息熵原理去除冗余信息,在第一层的列表的基础上进行实时推荐的第二层推荐列表,依次类推形成K层推荐列表。通过MovieLens数据集验证该模型相较于已有的模型具有较高的准确率和召回率。  相似文献   

3.
针对传统环境下运行的推荐算法预测精度不高的问题,提出一种基于矩阵分解和随机森林算法的推荐模型.提出的基于数据分割策略和新的学习过程的分布式推荐模型是在Apache Spark上设计的.通过数据分区、模型训练和偏好预测三个步骤处理大规模数据,提高预测质量,解决数据稀疏问题.为了提高模型在大数据环境下的性能,采用基于矩阵分...  相似文献   

4.
郭娟  王娜 《信息与电脑》2022,(21):20-22
为提升就业信息推荐结果的精确率和召回率,引入随机森林算法开展对就业信息个性化推荐方法的设计研究。首先,利用随机森林算法挖掘就业信息,并对特征进行提取;其次,针对得到的就业信息和特征进行聚类,利用Apriori算法对就业信息进行关联分析;最后,针对不同求职者的就业需要,为其提供个性化智能推荐。实验结果表明,新的推荐方法在实际应用中推荐结果的精确率和召回率,均明显高于基于关联规则算法的推荐方法。  相似文献   

5.
分析了新竞争形式下通信运营商外呼业务的需求,为实现高效的外呼系统,针对现代外呼业务的特点,对外呼系统进行精细化的分析设计,结合人工外呼、IVR自动外呼、短信、彩信、WAP_PUSH、Email等多媒体交互技术,论述了具备精细化管理及多种形式交互的多媒体外呼系统的实现。  相似文献   

6.
针对基于邻近关系的协同过滤算法在线推荐效率低的问题,提出了一种可离线训练评分预测模型的算法。通过聚类算法降低用户-项目评分矩阵中用户向量和项目向量的维数,并对数据进行转换使其适用于监督模型;利用转换后的数据离线训练随机森林模型,在线推荐时只需根据随机森林模型的规则进行评分预测,无需查找最邻近用户或项目。实验结果表明,该算法在不降低评分预测精度的情况下,在线推荐效率远高于基于邻近关系的协同过滤算法。  相似文献   

7.
在设备水平相似的情况下,提供差异性的服务是电信运营商们竞争的关键,而对计费系统的改造则是当务之急  相似文献   

8.
《软件》2018,(1):110-115
对于基于二部图网络结构的算法忽视了兴趣偏好的影响,只考虑用户与项目之间的关系,结合随机森林分类模型和二部图网络结构,提出了一种基于随机森林修正的加权二部图推荐算法。在二部图网络结构的基础上,利用评分计算边权,充分考虑项目的度和用户共同评分项目的影响改进相似度公式。同时用随机森林算法对用户在项目特征的偏好构建分类模型,根据其对初步得出的推荐列表进行评分修正。对比在Movie Lens数据集上的实验结果,证明该方法比其他算法能够提高推荐的准确性和推荐精度。  相似文献   

9.
情境感知推荐系统通过增加情境信息来提高推荐精度,在实际应用中得到广泛的应用。然而,传统的情境感知推荐方法存在赋予情境因素相同权重,忽略了用户在不同情境下所偏好项目的不同,以及情境因素在推荐过程中所起的影响作用不同的问题。提出一种基于多子域随机森林算法的情境感知推荐方法。该方法对特征重要性按权值大小进行排序,将权值的取值区域分为多个大小相等的子区域,在这些子区域中随机选择特征,构造特征子空间来改进随机森林算法;通过改进的随机森林算法来分解并降低用户、项目和情境的特征维度;使用协同过滤推荐算法来进行冷链物流配载个性化推荐。对LDOS-CoMoDa和Cycle Share两个数据集进行仿真实验,结果表明该方法相比传统方法平均绝对误差减少近10%,有效地提高了推荐系统的预测精度,为情境感知推荐的应用提供借鉴。  相似文献   

10.
11.
基于类别随机化的随机森林算法   总被引:1,自引:0,他引:1  
随机森林是数据挖掘和机器学习领域中一种常用的分类方法,已成为国内外学者共同关注的研究热点,并被广泛应用到各种实际问题中。传统的随机森林方法没有考虑类别个数对分类效果的影响,忽略了基分类器和类别之间的关联性,导致随机森林在处理多分类问题时的性能受到限制。为了更好地解决该问题,结合多分类问题的特点,提出一种基于类别随机化的随机森林算法(RCRF)。从类别的角度出发,在随机森林两种传统随机化的基础上增加类别随机化,为不同类别设计具有不同侧重点的基分类器。由于不同的分类器侧重区分的类别不同,所生成的决策树的结构也不同,这样既能够保证单个基分类器的性能,又可以进一步增大基分类器的多样性。为了验证所提算法的有效性,在UCI数据库中的21个数据集上将RCRF与其他算法进行了比较分析。实验从两个方面进行,一方面,通过准确率、F1-measure和Kappa系数3个指标来验证RCRF算法的性能;另一方面,利用κ-误差图从多样性角度对各种算法进行对比与分析。实验结果表明,所提算法能够有效提升集成模型的整体性能,在处理多分类问题时具有明显优势。  相似文献   

12.
罗知林  陈挺  蔡皖东 《计算机科学》2014,41(4):62-64,74
转发(Retweet)是微博中一个重要的信息传播机制,用户可以将其关注者(Follower)的有趣微博转发到自身平台,分享给他的粉丝(Fan),快速地实现微博信息的传播。主要对微博转发预测进行了研究,首先提取了重要特征,比如用户间的微网络结构、权重比率、用户个人信息等,以研究用户微博转发行为,然后基于以上特征提出了一个随机森林微博转发预测算法(RFMR)。实验结果表明,RFMR算法优于其他分类算法,可以有效地用来预测微博转发。  相似文献   

13.
为适应桁架结构健康监测技术的发展,进一步优化桁架结构损伤程度预测效果,提出一种基于随机森林的桁架结构损伤程度预测算法。算法建立并优化桁架结构损伤数据库,对多个损伤信号分量提取频域特征,通过孤立森林算法和缺失森林算法对数据库进行异常检测和数据补全,并采用主成分分析法对其进行特征降维。经实验验证,算法能够针对不同损伤程度的桁架结构敏感度做出有效判定,与极端随机树、AdaBoost、Bagging等回归算法相比,均方误差显著降低,为桁架结构健康监测提供了有效的预测手段。  相似文献   

14.
何明  刘伟世  魏铮 《计算机科学》2016,43(6):257-262
协同过滤是目前应用最广泛和最成功的推荐技术之一。然而,目前该技术的发展面临着严重的冷启动和稀疏性问题,降低了其推荐质量,因此提出了一种基于信任网络随机游走模型的协同过滤推荐方法。该方法融合了基于信任和项目的协同过滤推荐方法,并引入了信任因子作为引导推荐的重要因素。随机游走模型不仅考虑了信任用户对目标项目的评分,也考虑了他们对与目标项目相似的项目的评分。随着随机游走深度的增加,以相似项目的评分信息来代替目标项目的评分信息的概率也逐渐增大。在Epinions真实数据集上的验证结果表明,该方法在推荐评价指标上比其他算法具有更好的推荐结果。  相似文献   

15.
彭徵  王灵矫  郭华 《计算机科学》2018,45(12):148-152
文本分类是信息检索的核心技术。传统的文本分类系统由于单机的计算与存储能力有限,已经不适用于大数据时代。在Spark大数据平台上并行地运行算法对文本进行分类,以数据和任务的并行化来提高算法的效率具有现实性和紧迫性。文中提出了改进的不平衡数据随机森林算法,通过对训练样本的多数类进行欠取样且对少数类进行有放回取样从而形成新训练样本的方法来减少不平衡数据对随机森林的影响。实验结果表明,新算法在处理不平衡数据集上的少数类时提高了分类的正确率。  相似文献   

16.
随着大数据时代的到来,数据信息呈几何倍数增长。传统的分类算法将面临着极大的挑战。为了提高分类算法的效率,提出了一种基于弱相关化特征子空间选择的离散化随机森林并行分类算法。该算法在数据预处理阶段对数据集中的连续属性进行离散化。在随机森林抽取特征子空间阶段,利用属性向量空间模型计算属性间的相关性,构造弱相关化特征子空间,使所构建的决策树之间相关性降低,从而提高随机森林的分类效果;并通过研究随机森林的并行化策略,结合MapReduce框架,改进并实现了随机森林模型构建过程的双重并行化,进一步改善了算法的计算效率。  相似文献   

17.
周先亭  黄文明  邓珍荣 《计算机科学》2017,44(7):191-196, 220
针对目前微博转发行为预测具有的特征选择任意性、准确率不高的问题,提出了融合异常检测与随机森林的微博转发行为预测方法。首先,提取用户基本特征、博文基本特征、博文内容主题特征,并基于相对熵计算用户活跃度、博文影响力;其次,通过结合过滤式与封装式特征选择方法筛选出关键特征组;最后,融合异常检测与随机森林算法,依据筛选后的关键特征组进行微博转发行为预测,并利用袋外数据误差估计设置随机森林中的决策树和特征数。在真实新浪微博数据集上与基于逻辑回归、决策树、朴素贝叶斯、随机森林等算法的微博转发行为预测方法进行实验对比,结果表明所提方法的预测准确率(90.5%) 高于基准方法中最优的随机森林方法的预测准确率,同时验证了特征筛选方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号