共查询到17条相似文献,搜索用时 375 毫秒
1.
随着互联网技术的发展,往往希望通过分析消费者已有的历史数据,推荐消费者可能感兴趣的产品,并进一步取得更好的销售记录。煤炭系统中希望通过分析用户的消费记录,从而推荐给用户潜在的煤炭产品,提高煤炭的销售量。基于用户协同过滤算法被广泛地应用在煤炭推荐系统中,基于项目的 KNN协同过滤算法是通过分析产品之间的相似性完成聚类并推荐。传统的基于项目的 KNN协同过滤算法对现有的海量规模的煤炭系统中的销售记录数据不能高效、快速地完成推荐工作。文章基于海量规模数据,提出了基于MapReduce的分布式、基于项目的KNN协同过滤算法。通过实验结果表明,文中提出的算法具有很高的加速比,并且,具有很好的可扩展性。 相似文献
2.
协同过滤技术被广泛地应用在推荐系统中。随着电子商务的快速发展,煤炭产业也引进了电子销售系统。近年来,矩阵分解的协同过滤算法得到了煤炭销售系统的广泛应用。但是,随着互联网的快速发展,煤炭电子销售记录呈现指数级增长,传统的基于矩阵分解的协同聚类算法不能有效、快速地完成销售系统的推荐工作。文章针对大规模煤炭数据推荐工作,提出了分布式矩阵分解协同过滤算法,该算法基于云计算平台,能够分布式、高效地完成推荐系统的推荐工作。通过实验结果进一步展示了本算法与传统协同过滤算法相比,具有很高的加速比以及很好的可扩展性。 相似文献
3.
随着互联网电子商务的高速发展,推荐系统在电子商务领域得到了广泛的应用。煤炭产业也开始引进了电子销售系统。在煤炭系统中,推荐系统利用消费者对消费商品的排名打分,分析相似性并进一步预测消费者可能感兴趣的商品。协同过滤算法被普遍应用在推荐系统中。但是,煤炭销售数据规模逐渐增大,传统的协同过滤算法不能有效地处理海量规模煤炭数据,推荐效率很低。本文针对大规模煤炭销售数据,提出了基于Mapreduce的分布式协同过滤算法,该算法有效地完成推荐系统的预测及推荐工作。通过大量的实验结果也进一步表明本文提出的算法与传统算法相比,具有很高的效率,并且扩展性良好。 相似文献
4.
随着互联网络的发展,煤炭系统也开发了多种网络销售系统,并且数据规模呈现指数级上升趋势。逻辑回归算法是被广泛应用的分类算法之一。但是,传统的逻辑回归算法没有考虑预测错误代价,将不同的预测视为同等成本代价,会一定程度上影响算法的预测精度。文章提出了基于成本代价的逻辑回归算法,该算法考虑了预测错误代价完成煤炭数据集重新标签并完成预测工作。并且,针对海量规模煤炭数据,提出了基于云计算平台的分布式算法。通过大量的实验结果,表明提出的算法能够明显降低预测算法的代价成本,并且没有影响算法的预测精度。 相似文献
5.
煤炭系统中,往往希望分析不同煤炭产品购买之间的关联规则,并通过一定的关联性推荐煤炭商品,有助于购买者购买并取得更高的销售量。发掘频繁项目集是关联规则中经常用到的关键技术。随着煤炭系统数据库中信息的增多,原有的频繁项目集挖掘算法无法快速高效地完成频繁项目的挖掘。针对海量数据信息频繁项目集挖掘问题,提出了分布式频繁项目集挖掘算法,该算法是基于MapReduce分布式计算框架,能够高效地完成数据库中的频繁项目挖掘工作。通过实验结果证明该算法具有很高的效率及可扩展性。 相似文献
6.
层次聚类(Hierarchical Clustering)就是通过对数据集按照某种方法进行层次分解。该聚类方法可以设定聚类的个数,并得到了各个研究和应用领域的广泛应用。煤炭产业中往往希望对煤炭的产品进行聚类分析,从而有助于开发和生产。随着煤炭系统中收集的煤炭数据数量的增多,层次聚类算法由于需要计算大量的相似性矩阵需要大量的内存,原有的层次聚类算法不能有效地处理海量规模数据。文章针对煤炭数据中生成的大规模数据,提出基于云计算平台的分布式层次聚类算法,该算法能够分布式完成相似性矩阵的保存和计算,快速、准确地完成层次聚类工作。在实验部分通过2组实验证明了算法具有很高的效率以及很高的可扩展性。 相似文献
7.
支持向量机(SVM)普遍应用在机器学习领域的学习算法,广泛用于分类学习。支持向量机也应用在很多实际应用领域中。该算法也广泛地应用在煤炭系统的分类预测工作中。随着数字时代的发展,煤炭系统的数据规模也呈现大规模增长趋势。针对海量规模数据,传统的支持向量机模型不能有效地完成煤炭系统中数据的分类、回归等工作。文章针对大规模数据处理困难的问题,提出了分布式支持向量机模型。该模型针对现有流行的云计算平台,在该平台下构建基于Hadoop分布式计算框架的分布式模型,该分布式支持向量机模型能够高效、快速地完成真实数据的分类或回归任务,具有很高的效率。文中的实验部分通过大量的实验数据进一步证明了文章提出算法的可行性。 相似文献
8.
集成算法通过将多个分类器集成起来,能够有效地提高分类算法的预测精度。集成算法在煤炭开采、预测中也得到了广泛地应用。基于权重的集成算法是通过赋予不同分类器权重,进一步改进了集成算法的性能。但是,由于集成算法需要对多个分类器构建模型,随着数据规模的增大,传统的集成算法不能快速、有效地完成集成学习工作。本文针对煤炭领域中的大规模数据,提出了基于MapReduce分布式框架的分布式权重集成算法,该算法分布式完成集成的及预测工作。通过大量的实验结果进一步证明了本文提出的算法具有很高的效率以及很好的可扩展性。 相似文献
9.
随着信息技术的快速发展,在煤炭产业中也挖掘出了大量的煤炭数据。煤炭产业管理者希望能够应用现有的煤炭数据进行分析预测,但是海量煤炭数据的处理分析是一地大难点。文章针对煤炭数据的分类问题,提出了基于MapReduce分布式计算框架的贝叶斯分类算法,该算法分布式地完成分类问题,能够更加快速、有效地处理大规模的数据。通过文中的实验结果也进一步说明文中提出的分布式贝叶斯分类算法有很高的效率,与传统算法相比有明显的加速比,并且,该算法也具有很好的可扩展性。 相似文献
10.
随着现代信息技术的发展,各行各业产生了大量的高维数据,用不同的属性描述数据。煤炭产业也产生了大量的高维数据。煤炭企业的管理者往往希望从这些海量高维数据中得到更多的隐藏价值的知识。双向聚类算法被广泛地应用在各个领域中,该算法能够准确地完成聚类。随着数据规模呈现指数级地增长以及数据维度的增加,传统双向聚类算法不仅不能快速完成数据聚类,而且不能有效地处理高维数据。文章针对海量高维数据,提出了可扩展的基于高维数据的分布式双向聚类算法。通过实验结果展示了文中提出的算法具有很好的聚类结果以及很高的加速比及可扩展性。 相似文献
11.
文本分类是指在给定的分类系统下,根据文本的内容或属性,将大量文本归到一个或多个类别的过程。随着煤炭产业的高速发展,煤炭数据库中保存了大量煤炭采集文本数据,针对如此大规模的文本信息,传统的SVM算法不能很好地对大规模海量煤炭文本数据进行有效的处理。文中基于现有流行的Hadoop分布式计算平台,提出了分布式SVM文本分类算法。通过实验表明,文中提出的算法能够明显减小文本分类时间,并且具有很好的可扩展性。 相似文献
12.
13.
14.
采煤机作为煤矿开采中的重要机电装备,提升采煤机的控制质量和效率是所有煤矿企业面临的问题。在分析分布式控制思想的基础上,设计了采煤机的分布式控制系统整体方案框架,分析了分布式控制系统的网络模型。从控制器技术参数、工作流程及软件界面3个层面详细阐述了基于CAN总线的设计情况。研究了分布式模块的类型及功能,对其电路进行了详细设计。将设计的分布式控制系统应用到采煤机工程实践中,基本达到了预期效果。研究为煤矿企业创造了良好的效益。 相似文献
15.
本文在分析煤矿隐患排查工作流程和特点的基础上,结合煤矿生产安全隐患排查的实际需求,研究并开发了基于局域网的隐患排查管理信息系统。系统采用分布式数据库技术、协同软件技术等,实现了隐患排查业务流程主要环节的程序化、规范化闭环管理,系统还通过大屏幕、短信功能等实现了信息的实时交流与共享,同时系统还建立科学的知识库体系,提供强大的数据统计、详细分析、以及各种可视化查询功能,为使用者提供快捷、高效的安全生产建设平台。 相似文献
16.