共查询到18条相似文献,搜索用时 62 毫秒
1.
2.
个性化推荐技术的发展有利于解决互联网海量数据信息过载问题。本文在了解分布式处理架构的特点的基
础上,提出了基于Hadoop 构建标签推荐系统方案。采用基于MapReduce 模型实现的算法具有较高的伸缩性和性能,能高效
地进行离线数据分析。 相似文献
3.
张贵元 《计算机光盘软件与应用》2014,(22):58-59
本文在全面研究各类推荐算法的基础上,提出了基于物联网的推荐算法。该算法结合了基于内容的推荐和协同过滤推荐,综合考虑了物联网中设备的资源与资源相似性、设备与设备的评分矩阵,并基于用户与用户之间的相似性预测评分,给出推荐结果。 相似文献
4.
针对协同过滤推荐算法在数据稀疏性及在大数据规模下系统可扩展性的两个问题, 在分析研究Hadoop分布式平台与协同过滤推荐算法后, 提出了一种基于Hadoop平台实现协同过滤推荐算法的优化方案. 实验证明, 在Hadoop平台上通过MapReduce结合Hbase数据库实现算法, 能够有效地提高协同过滤推荐算法在大数据规模下的执行效率, 从而能够进一步地搭建低成本高性能、动态扩展的分布式推荐引擎. 相似文献
5.
针对智慧城市中乘客打车策略的推荐算法效率不高的问题,使用古典概率学统计历史轨迹中该时间该路段有空车的天数占数据集总天数比例,作为乘客等到空车概率;使用最小二乘法拟合时间与到达空车数曲线,预测乘客等到空车时间,以提高推荐效率。同时,使用Hadoop作为数据存储和计算平台以提高数据处理能力;提出一种基于地图栅格化的路网存储结构来提高搜索地图速度;改进一种基于计算几何的地图匹配算法提高匹配准确率。实验结果显示,空车概率推荐算法正确率约87%,等待时间推荐算法正确率达88.4%,表明挖掘轨迹数据为乘客提供推荐服务的可行性。 相似文献
6.
为紧跟时代步伐,越来越多的人选择在空闲时间到图书馆学习。为有效利用图书馆的座位资源,提高座位预约过程中的就座效率,文章针对某高校图书馆不同资源场景下的空闲座位与不同用户的需求匹配问题,采用混合推荐算法实现图书馆座位推荐。此算法将基于用户的协同过滤算法与基于内容的推荐算法相结合,通过基于内容的推荐算法得到座位相似度,从而克服了协同过滤算法在面对冷启动情况时的不足,提高了座位推荐的精确性。 相似文献
7.
协同过滤算法作为一种成功的个性化推荐技术已经被应用到很多领域中,但随着系统规模的扩大,它的效率逐渐降低。针对它出现的缺点,提出一种新的基于内容和网络结构图的混合算法,实验数据证明该算法可以解决传统推荐算法中存在的一些缺陷。 相似文献
8.
9.
冯本勇 《电子制作.电脑维护与应用》2014,(24)
在电子商务推荐系统中,协同过滤算法技术是主要的采用技术,而推荐系统的准确率受相似度方法的直接影响。本文通过对用户共同评分项的流行度和用户的特征之间的相关性的分析,给出了改进的相似度度量方法及相应的协同过滤推荐算法,设计并实现了基于Hadoop的协同过滤推荐系统。利用MAE分别对原始协同过滤推荐效果和改进后的推荐算法进行测评,结果表明,该算法在一定程度上提高了推荐的准确度。同时,对分布式推荐平台的整体性能实验表明,随着虚拟机节点的适度增加,协同过滤推荐引擎的计算时间不断减少,这表明推荐引擎的总体性能较传
统单机推荐引擎得到提升。 相似文献
统单机推荐引擎得到提升。 相似文献
10.
11.
12.
针对当前数据规模不断增大,单机的数据挖掘运行效率低下的问题,本文采用Hadoop 平台对聚类K-means 算法进行研究以解决此类问题。首先对Hadoop 平台的架构和搭建进行了详细描述;其次详细分析了K-means 算法;最后给出了算法实现,并对算法进行了实验分析。 相似文献
13.
于奕 《电脑编程技巧与维护》2013,(18):66+79
B2C只是一个过渡性的商业模式,未来电子商务真正模式是C2B。推荐系统是在电子商务平台上常见的一种推荐方式。基于推荐算法在电子商务网站的实际应用中因为C2B模式的兴起面临看很好的机遇,通过预测用户需求来实现厂家按需生成以及商家按需进货。 相似文献
14.
15.
共享知识挖掘是指通过学习不同事物之间的共享知识,将学习到的知识应用到未知事物来加快认知未知事物。针对大数据集中串行共享知识挖掘算法效率低下的问题,结合云计算技术,提出了一种基于Hadoop的并行共享决策树挖掘算法(PSDT)。该算法采用传统的属性表结构实现并行挖掘,但 其I/O操作过多,影响算法性能,为此,进一步提出了一种混合并行共享决策树挖掘算法(HPSDT)。该算法采用混合数据结构,在计算分裂指标阶段使用属性表结构,在分裂阶段采用数据记录结构。数据分析表明,HPSDT算法简化了分裂过程,其I/O操作是PSDT的0.34左右。实验结果表明,PSDT和HPSDT都具有良好的并行性和扩展性;HPSDT比PSDT性能更好,并且随着数据集的增大,HPSDT的优越性更加明显。 相似文献
16.
调度问题是目前云计算研究中的热点问题,其目的是研究如何协同云计算资源,使其能最大化利用.Hadoop是目前流行的开源云计算平台.针对Hadoop自带的作业调度算法的不足,研究和实现了基于优先级的加权循环算法.该算法能够区分用户服务等级,保证系统资源不被服务等级高的用户长时间占有,保证系统资源得到合理的利用.最后,对该算法进行实验及性能分析,验证该算法能够提高系统的整体效率和减少了相应时间,避免资源浪费. 相似文献
17.
随着数据库技术的发展和Internet的迅速普及,实际应用中需要处理的数据量急剧地增长,致聚类研究面临许多新的问题和挑战,如海量数据和新的计算环境等.深入研究了基于云计算平台Hadoop的并行k-means聚类算法,给出了算法设计的方法和策略.在多个不同大小数据集上的实验表明,设计的并行聚类算法具有优良的加速比、扩展率和数据伸缩率等性能,适合用于海量数据的分析和挖掘. 相似文献