首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
朱雷 《煤炭技术》2014,(2):146-148
随着电子商务的高速发展,推荐系统成为煤炭产业网站的核心技术之一。协同过滤算法是推荐系统中的主要方法。由于社交网络的发展,用户之间往往通过推荐喜欢的商品给熟悉用户,这种基于社交网络的协同过滤算法往往能够更加准确的完成网站的推荐工作。但是,随着煤炭销售数据规模的增大,传统的基于社交网络的协同过滤算法不能有效地完成推荐工作。针对煤炭数据规模大、分析复杂问题,提出了基于云平台的分布式社交网络协同过滤算法,该算法分布式完成系统推荐工作,具有很高的效率。  相似文献   

2.
罗莉 《煤炭技术》2013,(5):193-195
随着互联网技术的发展,往往希望通过分析消费者已有的历史数据,推荐消费者可能感兴趣的产品,并进一步取得更好的销售记录。煤炭系统中希望通过分析用户的消费记录,从而推荐给用户潜在的煤炭产品,提高煤炭的销售量。基于用户协同过滤算法被广泛地应用在煤炭推荐系统中,基于项目的 KNN协同过滤算法是通过分析产品之间的相似性完成聚类并推荐。传统的基于项目的 KNN协同过滤算法对现有的海量规模的煤炭系统中的销售记录数据不能高效、快速地完成推荐工作。文章基于海量规模数据,提出了基于MapReduce的分布式、基于项目的KNN协同过滤算法。通过实验结果表明,文中提出的算法具有很高的加速比,并且,具有很好的可扩展性。  相似文献   

3.
张旭 《煤炭技术》2013,(11):317-319
随着互联网电子商务的高速发展,推荐系统在电子商务领域得到了广泛的应用。煤炭产业也开始引进了电子销售系统。在煤炭系统中,推荐系统利用消费者对消费商品的排名打分,分析相似性并进一步预测消费者可能感兴趣的商品。协同过滤算法被普遍应用在推荐系统中。但是,煤炭销售数据规模逐渐增大,传统的协同过滤算法不能有效地处理海量规模煤炭数据,推荐效率很低。本文针对大规模煤炭销售数据,提出了基于Mapreduce的分布式协同过滤算法,该算法有效地完成推荐系统的预测及推荐工作。通过大量的实验结果也进一步表明本文提出的算法与传统算法相比,具有很高的效率,并且扩展性良好。  相似文献   

4.
张海建 《煤炭技术》2013,(12):194-196
层次聚类(Hierarchical Clustering)就是通过对数据集按照某种方法进行层次分解。该聚类方法可以设定聚类的个数,并得到了各个研究和应用领域的广泛应用。煤炭产业中往往希望对煤炭的产品进行聚类分析,从而有助于开发和生产。随着煤炭系统中收集的煤炭数据数量的增多,层次聚类算法由于需要计算大量的相似性矩阵需要大量的内存,原有的层次聚类算法不能有效地处理海量规模数据。文章针对煤炭数据中生成的大规模数据,提出基于云计算平台的分布式层次聚类算法,该算法能够分布式完成相似性矩阵的保存和计算,快速、准确地完成层次聚类工作。在实验部分通过2组实验证明了算法具有很高的效率以及很高的可扩展性。  相似文献   

5.
吴华芹  邵华 《煤炭技术》2014,(2):141-143
煤炭系统中,往往希望分析不同煤炭产品购买之间的关联规则,并通过一定的关联性推荐煤炭商品,有助于购买者购买并取得更高的销售量。发掘频繁项目集是关联规则中经常用到的关键技术。随着煤炭系统数据库中信息的增多,原有的频繁项目集挖掘算法无法快速高效地完成频繁项目的挖掘。针对海量数据信息频繁项目集挖掘问题,提出了分布式频繁项目集挖掘算法,该算法是基于MapReduce分布式计算框架,能够高效地完成数据库中的频繁项目挖掘工作。通过实验结果证明该算法具有很高的效率及可扩展性。  相似文献   

6.
雷学智 《煤炭技术》2013,(11):248-250
支持向量机(SVM)普遍应用在机器学习领域的学习算法,广泛用于分类学习。支持向量机也应用在很多实际应用领域中。该算法也广泛地应用在煤炭系统的分类预测工作中。随着数字时代的发展,煤炭系统的数据规模也呈现大规模增长趋势。针对海量规模数据,传统的支持向量机模型不能有效地完成煤炭系统中数据的分类、回归等工作。文章针对大规模数据处理困难的问题,提出了分布式支持向量机模型。该模型针对现有流行的云计算平台,在该平台下构建基于Hadoop分布式计算框架的分布式模型,该分布式支持向量机模型能够高效、快速地完成真实数据的分类或回归任务,具有很高的效率。文中的实验部分通过大量的实验数据进一步证明了文章提出算法的可行性。  相似文献   

7.
随着互联网络的发展,煤炭系统也开发了多种网络销售系统,并且数据规模呈现指数级上升趋势。逻辑回归算法是被广泛应用的分类算法之一。但是,传统的逻辑回归算法没有考虑预测错误代价,将不同的预测视为同等成本代价,会一定程度上影响算法的预测精度。文章提出了基于成本代价的逻辑回归算法,该算法考虑了预测错误代价完成煤炭数据集重新标签并完成预测工作。并且,针对海量规模煤炭数据,提出了基于云计算平台的分布式算法。通过大量的实验结果,表明提出的算法能够明显降低预测算法的代价成本,并且没有影响算法的预测精度。  相似文献   

8.
刘小强 《煤炭技术》2013,(9):184-186
随着信息技术的快速发展,在煤炭产业中也挖掘出了大量的煤炭数据。煤炭产业管理者希望能够应用现有的煤炭数据进行分析预测,但是海量煤炭数据的处理分析是一地大难点。文章针对煤炭数据的分类问题,提出了基于MapReduce分布式计算框架的贝叶斯分类算法,该算法分布式地完成分类问题,能够更加快速、有效地处理大规模的数据。通过文中的实验结果也进一步说明文中提出的分布式贝叶斯分类算法有很高的效率,与传统算法相比有明显的加速比,并且,该算法也具有很好的可扩展性。  相似文献   

9.
张文静 《煤炭技术》2013,(9):198-199
集成算法通过将多个分类器集成起来,能够有效地提高分类算法的预测精度。集成算法在煤炭开采、预测中也得到了广泛地应用。基于权重的集成算法是通过赋予不同分类器权重,进一步改进了集成算法的性能。但是,由于集成算法需要对多个分类器构建模型,随着数据规模的增大,传统的集成算法不能快速、有效地完成集成学习工作。本文针对煤炭领域中的大规模数据,提出了基于MapReduce分布式框架的分布式权重集成算法,该算法分布式完成集成的及预测工作。通过大量的实验结果进一步证明了本文提出的算法具有很高的效率以及很好的可扩展性。  相似文献   

10.
传统的推荐算法具有各自的局限性,单纯依靠单一的算法作为推荐,严重影响了推荐系统的质量和效率。针对该问题,采用基于协同过滤推荐和关联规则推荐相结合的混和推荐技术来实现推荐系统,实验结果表明,混合推荐系统确实提高资源推荐的精度和覆盖率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号