排序方式: 共有9条查询结果,搜索用时 15 毫秒
1
1.
2.
本文应用数值积分和计算机模拟两种方法计算出两个贝塔分布r.v乘积的分布,得出其乘积也服从贝塔分布的结论;并且用皮尔逊卡方检验方法对拟合结果进行了拟合检验。 相似文献
3.
本文从统计学与数据挖掘的联系与区别出发,介绍数据挖掘方法、步骤、目的,探讨统计学在数据挖掘领域中的作用、多元统计分析方法的运用和所能解决的问题。在SAS系统的支持下,如果把多元分析方法与其它数据挖掘技术结合加以灵活运用,应该会有更好的效果。 相似文献
4.
聚类是数据挖掘的一种常用技术,最常用的距离度量方法是欧几里得距离,但运用加权欧氏距离需要对数据的实际意义有一定了解,并且要求分析者具有相关的专业知识,而在实际操作中这一点很难保证。本文提出了一种在对数据没有任何先验信息的情况下,如何运用加权欧氏距离有效进行聚类的方法。并结合实例,说明在一定条件下,这种加权欧氏距离聚类方法能显著提高聚类质量。 相似文献
5.
针对综采工作面设备较多、人工控制较复杂的问题,为改善井下工人劳动环境,设计并实现基于综采工作面的采煤设备协同控制系统。从硬件设计和软件设计两方面对该系统进行详细阐述。同时,为验证设计系统的可行性,进行工业试验。试验结果表明,设计并实现的协同控制系统能够保证"三机"设备正常、有序、稳定工作,达到预期设计目标。 相似文献
6.
7.
介绍了与煤制烯烃项目配套的20 kt/a硫磺回收装置的工艺流程、特点以及装置开工后主要设备运行情况。该装置运行平稳,各项指标均达到设计要求,硫回收装置外排烟气中的SO2质量浓度通常在500 mg/m3以下,硫回收率达99%以上,产品质量合格率100%,排放的烟气达到国家标准要求。 相似文献
8.
自动文本分类中权值公式的改进 总被引:17,自引:4,他引:13
在自动文本分类中,TF-IDF公式是常用的词语权重计算公式,但是TF-IDF公式是一种经验公式,并没有坚实的理论基础,它并不适用于任何情况下。通过信息论和概率证明了,在训练文本同属一个类别时,词语的重要性与词语的文档频率成正比,并对TF-IDF进行了改进,得到了改进的权值公式。改进的权值公式与TF-IDF公式进行实验比较,实验结果表明改进的权值公式提高了算法的分类精度。 相似文献
9.
隐私保护是数据挖掘中很有意义的研究方向。本文所关心的问题是如何在两个私有数据库的联合样本集上施行数据挖掘算法,同时保证不向对方泄露任何与结果无关的数据库信息。这种情形在科研合作等领域已经屡见不鲜。针对数据分类算法中应用非常普遍的朴素贝叶斯分类算法,我们利用安全两方计算协议,给出一个保持隐私的朴素贝叶斯分类协议,在保持计算隐私性的同时,协议在计算复杂度和传输复杂度与一般的贝叶斯分类非常接近,协议是高效可行的。 相似文献
1