首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 658 毫秒
1.
随着现代信息技术的发展,各行各业产生了大量的高维数据,用不同的属性描述数据。煤炭产业也产生了大量的高维数据。煤炭企业的管理者往往希望从这些海量高维数据中得到更多的隐藏价值的知识。双向聚类算法被广泛地应用在各个领域中,该算法能够准确地完成聚类。随着数据规模呈现指数级地增长以及数据维度的增加,传统双向聚类算法不仅不能快速完成数据聚类,而且不能有效地处理高维数据。文章针对海量高维数据,提出了可扩展的基于高维数据的分布式双向聚类算法。通过实验结果展示了文中提出的算法具有很好的聚类结果以及很高的加速比及可扩展性。  相似文献   

2.
祝振欣 《煤炭技术》2014,(1):247-248
协同过滤技术被广泛地应用在推荐系统中。随着电子商务的快速发展,煤炭产业也引进了电子销售系统。近年来,矩阵分解的协同过滤算法得到了煤炭销售系统的广泛应用。但是,随着互联网的快速发展,煤炭电子销售记录呈现指数级增长,传统的基于矩阵分解的协同聚类算法不能有效、快速地完成销售系统的推荐工作。文章针对大规模煤炭数据推荐工作,提出了分布式矩阵分解协同过滤算法,该算法基于云计算平台,能够分布式、高效地完成推荐系统的推荐工作。通过实验结果进一步展示了本算法与传统协同过滤算法相比,具有很高的加速比以及很好的可扩展性。  相似文献   

3.
罗莉 《煤炭技术》2013,(5):193-195
随着互联网技术的发展,往往希望通过分析消费者已有的历史数据,推荐消费者可能感兴趣的产品,并进一步取得更好的销售记录。煤炭系统中希望通过分析用户的消费记录,从而推荐给用户潜在的煤炭产品,提高煤炭的销售量。基于用户协同过滤算法被广泛地应用在煤炭推荐系统中,基于项目的 KNN协同过滤算法是通过分析产品之间的相似性完成聚类并推荐。传统的基于项目的 KNN协同过滤算法对现有的海量规模的煤炭系统中的销售记录数据不能高效、快速地完成推荐工作。文章基于海量规模数据,提出了基于MapReduce的分布式、基于项目的KNN协同过滤算法。通过实验结果表明,文中提出的算法具有很高的加速比,并且,具有很好的可扩展性。  相似文献   

4.
刘小强 《煤炭技术》2013,(9):184-186
随着信息技术的快速发展,在煤炭产业中也挖掘出了大量的煤炭数据。煤炭产业管理者希望能够应用现有的煤炭数据进行分析预测,但是海量煤炭数据的处理分析是一地大难点。文章针对煤炭数据的分类问题,提出了基于MapReduce分布式计算框架的贝叶斯分类算法,该算法分布式地完成分类问题,能够更加快速、有效地处理大规模的数据。通过文中的实验结果也进一步说明文中提出的分布式贝叶斯分类算法有很高的效率,与传统算法相比有明显的加速比,并且,该算法也具有很好的可扩展性。  相似文献   

5.
张文静 《煤炭技术》2013,(9):198-199
集成算法通过将多个分类器集成起来,能够有效地提高分类算法的预测精度。集成算法在煤炭开采、预测中也得到了广泛地应用。基于权重的集成算法是通过赋予不同分类器权重,进一步改进了集成算法的性能。但是,由于集成算法需要对多个分类器构建模型,随着数据规模的增大,传统的集成算法不能快速、有效地完成集成学习工作。本文针对煤炭领域中的大规模数据,提出了基于MapReduce分布式框架的分布式权重集成算法,该算法分布式完成集成的及预测工作。通过大量的实验结果进一步证明了本文提出的算法具有很高的效率以及很好的可扩展性。  相似文献   

6.
张旭 《煤炭技术》2013,(11):317-319
随着互联网电子商务的高速发展,推荐系统在电子商务领域得到了广泛的应用。煤炭产业也开始引进了电子销售系统。在煤炭系统中,推荐系统利用消费者对消费商品的排名打分,分析相似性并进一步预测消费者可能感兴趣的商品。协同过滤算法被普遍应用在推荐系统中。但是,煤炭销售数据规模逐渐增大,传统的协同过滤算法不能有效地处理海量规模煤炭数据,推荐效率很低。本文针对大规模煤炭销售数据,提出了基于Mapreduce的分布式协同过滤算法,该算法有效地完成推荐系统的预测及推荐工作。通过大量的实验结果也进一步表明本文提出的算法与传统算法相比,具有很高的效率,并且扩展性良好。  相似文献   

7.
雷学智 《煤炭技术》2013,(11):248-250
支持向量机(SVM)普遍应用在机器学习领域的学习算法,广泛用于分类学习。支持向量机也应用在很多实际应用领域中。该算法也广泛地应用在煤炭系统的分类预测工作中。随着数字时代的发展,煤炭系统的数据规模也呈现大规模增长趋势。针对海量规模数据,传统的支持向量机模型不能有效地完成煤炭系统中数据的分类、回归等工作。文章针对大规模数据处理困难的问题,提出了分布式支持向量机模型。该模型针对现有流行的云计算平台,在该平台下构建基于Hadoop分布式计算框架的分布式模型,该分布式支持向量机模型能够高效、快速地完成真实数据的分类或回归任务,具有很高的效率。文中的实验部分通过大量的实验数据进一步证明了文章提出算法的可行性。  相似文献   

8.
吴华芹  邵华 《煤炭技术》2014,(2):141-143
煤炭系统中,往往希望分析不同煤炭产品购买之间的关联规则,并通过一定的关联性推荐煤炭商品,有助于购买者购买并取得更高的销售量。发掘频繁项目集是关联规则中经常用到的关键技术。随着煤炭系统数据库中信息的增多,原有的频繁项目集挖掘算法无法快速高效地完成频繁项目的挖掘。针对海量数据信息频繁项目集挖掘问题,提出了分布式频繁项目集挖掘算法,该算法是基于MapReduce分布式计算框架,能够高效地完成数据库中的频繁项目挖掘工作。通过实验结果证明该算法具有很高的效率及可扩展性。  相似文献   

9.
朱雷 《煤炭技术》2014,(2):146-148
随着电子商务的高速发展,推荐系统成为煤炭产业网站的核心技术之一。协同过滤算法是推荐系统中的主要方法。由于社交网络的发展,用户之间往往通过推荐喜欢的商品给熟悉用户,这种基于社交网络的协同过滤算法往往能够更加准确的完成网站的推荐工作。但是,随着煤炭销售数据规模的增大,传统的基于社交网络的协同过滤算法不能有效地完成推荐工作。针对煤炭数据规模大、分析复杂问题,提出了基于云平台的分布式社交网络协同过滤算法,该算法分布式完成系统推荐工作,具有很高的效率。  相似文献   

10.
谢先伟 《煤炭技术》2013,(9):177-179
文章针对海量规模数据,提出了基于云计算平台的分布式神经网络算法,该算法能够分布式的完成神经网络的构建,最终准确地进行分类预测。实验部分的结果用数据进一步表明了文章提出的算法具有很高的效率,与传统算法相比有很高的加速比及很好的可扩展性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号