共查询到19条相似文献,搜索用时 62 毫秒
1.
层次聚类(Hierarchical Clustering)就是通过对数据集按照某种方法进行层次分解。该聚类方法可以设定聚类的个数,并得到了各个研究和应用领域的广泛应用。煤炭产业中往往希望对煤炭的产品进行聚类分析,从而有助于开发和生产。随着煤炭系统中收集的煤炭数据数量的增多,层次聚类算法由于需要计算大量的相似性矩阵需要大量的内存,原有的层次聚类算法不能有效地处理海量规模数据。文章针对煤炭数据中生成的大规模数据,提出基于云计算平台的分布式层次聚类算法,该算法能够分布式完成相似性矩阵的保存和计算,快速、准确地完成层次聚类工作。在实验部分通过2组实验证明了算法具有很高的效率以及很高的可扩展性。 相似文献
2.
随着互联网技术的发展,往往希望通过分析消费者已有的历史数据,推荐消费者可能感兴趣的产品,并进一步取得更好的销售记录。煤炭系统中希望通过分析用户的消费记录,从而推荐给用户潜在的煤炭产品,提高煤炭的销售量。基于用户协同过滤算法被广泛地应用在煤炭推荐系统中,基于项目的 KNN协同过滤算法是通过分析产品之间的相似性完成聚类并推荐。传统的基于项目的 KNN协同过滤算法对现有的海量规模的煤炭系统中的销售记录数据不能高效、快速地完成推荐工作。文章基于海量规模数据,提出了基于MapReduce的分布式、基于项目的KNN协同过滤算法。通过实验结果表明,文中提出的算法具有很高的加速比,并且,具有很好的可扩展性。 相似文献
3.
可扩展标记语言XML已成为当今互联网数据描述和交换的标准,也是存储网络数据的主要形式,SQLServer是微软公司领先的数据库产品,SQL Server 2005提供了非常强大的支持XML的功能。该文讨论了XML技术和SQL Server 2005如何结合发挥作用,并描述了在SQL Server 2005中对XML的支持,最后给出如何使用XML和SQL Server 2005实现分布式系统集成。 相似文献
4.
5.
随着互联网电子商务的高速发展,推荐系统在电子商务领域得到了广泛的应用。煤炭产业也开始引进了电子销售系统。在煤炭系统中,推荐系统利用消费者对消费商品的排名打分,分析相似性并进一步预测消费者可能感兴趣的商品。协同过滤算法被普遍应用在推荐系统中。但是,煤炭销售数据规模逐渐增大,传统的协同过滤算法不能有效地处理海量规模煤炭数据,推荐效率很低。本文针对大规模煤炭销售数据,提出了基于Mapreduce的分布式协同过滤算法,该算法有效地完成推荐系统的预测及推荐工作。通过大量的实验结果也进一步表明本文提出的算法与传统算法相比,具有很高的效率,并且扩展性良好。 相似文献
6.
煤炭开采过程中需要对收集的勘探数据进行分析和研究,从中挖掘出更加有价值的信息。文章针对多种数据分类算法,研究分析他们在煤炭勘探数据分析中的作用。通过研究和比较多种分类算法在数据分析工作中的性能,找到能够更加有效地处理勘探数据的分类算法。 相似文献
7.
随着互联网络的发展,煤炭系统也开发了多种网络销售系统,并且数据规模呈现指数级上升趋势。逻辑回归算法是被广泛应用的分类算法之一。但是,传统的逻辑回归算法没有考虑预测错误代价,将不同的预测视为同等成本代价,会一定程度上影响算法的预测精度。文章提出了基于成本代价的逻辑回归算法,该算法考虑了预测错误代价完成煤炭数据集重新标签并完成预测工作。并且,针对海量规模煤炭数据,提出了基于云计算平台的分布式算法。通过大量的实验结果,表明提出的算法能够明显降低预测算法的代价成本,并且没有影响算法的预测精度。 相似文献
8.
9.
为了提高煤炭调运的效率及节省运输成本,采用蚁群算法来完成煤炭调运分配的路径规划,文章首先对我国煤炭资源地理分配不均及城市需求各有差异等实际情况进行了说明,接着详述蚁群算法基本原理,最后进行煤炭调运实例仿真,实验结果表明,采用蚁群算法求得最优解,收敛快,效率高,而且能够方便实现路径规划。实验证明,蚁群算法运用于煤炭调运分配具有一定的优势,有较高的研究价值。 相似文献
10.
随着信息技术的快速发展,在煤炭产业中也挖掘出了大量的煤炭数据。煤炭产业管理者希望能够应用现有的煤炭数据进行分析预测,但是海量煤炭数据的处理分析是一地大难点。文章针对煤炭数据的分类问题,提出了基于MapReduce分布式计算框架的贝叶斯分类算法,该算法分布式地完成分类问题,能够更加快速、有效地处理大规模的数据。通过文中的实验结果也进一步说明文中提出的分布式贝叶斯分类算法有很高的效率,与传统算法相比有明显的加速比,并且,该算法也具有很好的可扩展性。 相似文献
11.
煤炭系统中,往往希望分析不同煤炭产品购买之间的关联规则,并通过一定的关联性推荐煤炭商品,有助于购买者购买并取得更高的销售量。发掘频繁项目集是关联规则中经常用到的关键技术。随着煤炭系统数据库中信息的增多,原有的频繁项目集挖掘算法无法快速高效地完成频繁项目的挖掘。针对海量数据信息频繁项目集挖掘问题,提出了分布式频繁项目集挖掘算法,该算法是基于MapReduce分布式计算框架,能够高效地完成数据库中的频繁项目挖掘工作。通过实验结果证明该算法具有很高的效率及可扩展性。 相似文献
12.
13.
14.
KNN也称作K最邻近结点算法(k-Nearest Neighbor algorithm)的缩写形式,是分类预测的经典算法之一。在煤炭勘探过程中,往往希望将新勘探出来的煤炭产品分类预测,并采取对应类别的煤炭处理和保存措施。文中,将采用基于特征选择的KNN分类算法应用到煤炭勘探分类预测工作中,该方法首先选择煤炭分类中有价值的特征属性,并使用KNN算法完成分类工作.该算法可以有效地提高煤炭分类预测工作的效率,并且有助于煤炭后续的保存和精加工措施。 相似文献
15.
煤矿基本建设项目工程资料,是项目竣工检查验收的重要因素,也是安全验收、消防验收、节能验收的重要依据。所以,工程项目的竣工资料整理的完善程度,关系到煤矿安装项目的正常运行。本文作者根据自己多年的煤矿工程监督管理经验,在深刻剖析煤矿安装工程资料整理的重要性基础上,从编制工程资料整理文件、编制科学合理的工程资料整理计划、建立相应的管理制度、做好资料整理流程图这几个重要环节论述了煤矿安装工程资料整理的有效方法。 相似文献
16.
17.
文章提出了基于CUDA的数字影像处理算法。可以快速、高效地计算数字图像中的拉普拉斯算子。通过实验结果表明,本文提出的算法与在CPU中执行的串行代码在时间上取得了很好的加速比,并且有很低的误差。 相似文献
18.