共查询到20条相似文献,搜索用时 109 毫秒
1.
在油田实际生产中,注采连通情况是一个很难确定却又十分重要的问题,它对油田开发方案的制定、剩余油分布的描述具有重要意义。本文采用大港油田某油藏的生产动态资料,建立基于贝叶斯优化的MLP神经网络模型,使用Sobol敏感性分析方法计算敏感性系数,通过敏感性系数的大小定量评判注采连通情况的好坏,通过与示踪剂解释结果的对比进而验证该方法的有效性和可靠性。研究表明,建立的基于贝叶斯优化的MLP神经网络模型取得了较好的拟合效果,Sobol敏感性系数能有效评价注采连通情况,结果符合油藏的实际情况。 相似文献
2.
基于S-CART决策树的多关系空间数据挖掘方法 总被引:1,自引:0,他引:1
针对空间数据关系复杂的情况,提出了一种改进的多关系数据挖掘结构分类与回归树(S-CART)算法,该算法首先利用空间关联索引表抽取不同主题图层之间的关系原子命题,然后基于逻辑谓词创建多关系二叉决策树,抽取空间关联规则,同时基于我国湖北大冶部分地区土壤污染数据验证算法的有效性。 相似文献
3.
4.
本文利用数据挖掘中C5.0决策树模型判别分析法建立陶瓷原料分类模型,探讨陶瓷原料的分类方法,研究结果表明:经该模型计算所得的分类结果和实际情况相吻合。该方法有助于在配方过程中遴选陶瓷原料,可在生产过程中应用和推广。 相似文献
5.
6.
决策树算法研究及应用 总被引:2,自引:0,他引:2
信息论是数据挖掘技术的重要指导理论之一,是决策树算法实现的理论依据.决策树算法是一种逼近离散值目标函数的方法,其实质是在学习的基础上,得到分类规则。本文简要介绍了信息论的基本原理,重点阐述基于信息论的决策树算法,分析了它们目前主要的代表理论以及存在的问题,并用具体的事例来验证。 相似文献
7.
决策树算法的系统实现与修剪优化 总被引:6,自引:3,他引:6
决策树是对分类问题进行深入分析的一种方法,在实际问题中,按算法生成的决策树往往复杂而庞大,令用户难以理解,这就告诉我们在重分类精确性的同时,也要加强对树修剪的研究,以一个决策树算法的程序实现为例,进一步讨论了对树进行修剪优化时可能涉及的问题,目的在于给决策树研究人员提供一个深入和清晰的简化技术视图。 相似文献
8.
9.
决策树算法是数据挖掘中常用的重要方法,广泛应用于分类和预测。本文对决策树的ID3算法的基本思想进行了介绍,通过应用实例说明了构造决策树的实现过程。 相似文献
10.
决策树算法是一个经典的数据挖掘分类算法,如今已经被广泛应用到各个领域,并且取得了很好的效果,此外,对决策树算法的改进也在不断的进行中。将决策树算法应用在智能导学系统中,其目的是为了使智能导学系统能更好对学习者进行分类。采用的方式是应用决策树算法对学习者输入的资料对其进行分类,并对不同类型的学习者应用不同的教学计划。结果表明应用决策树算法分类能明确的把握学习者的特性,提高系统的分类效率。由此得出结论,将决策树算法应用在智能导学系统中是十分可行的。 相似文献
11.
基于SPRINT方法的并行决策树分类研究 总被引:9,自引:0,他引:9
决策树技术的最大问题之一就是它的计算复杂性和训练数据的规模成正比,导致在大的数据集上构造决策树的计算时间太长。并行构造决策树是解决这个问题的一种有效方法。文中基于同步构造决策树的思想,对SPRINT方法的并行性做了详细分析和研究,并提出了进一步研究的方向。 相似文献
12.
在构造决策树的过程中,分裂属性选择的标准直接影响分类的效果。分析了现有改进的ID3算法不同程度地存在学习效率偏低和对多值属性重要性的主观评测等问题,提出一种高效而且可靠的基于灰色关联度的决策树改进算法。该算法通过灰色关联分析建立各特征属性与类别属性之间的关系,进而利用灰色关联度来修正取值较多但非重要属性的信息增益。通过实验与其它ID3改进算法进行了比较,验证了改进后的算法是有效的。 相似文献
13.
为解决多维时间序列的分类并获取易于理解的分类规则,引入了时序熵的概念及构造时序熵的方法,基于属性选择和属性值划分两方面扩展了决策树模型。并给出了两种构造多维时间序列分类的决策树模型算法。最后,采用移动客户流失的真实数据,对过程决策树进行测试,展示了方法的可行性。 相似文献
14.
移动通信领域中的客户信息挖掘是数据挖掘和商务智能领域中典型应用之一,具有较高研究意义和商业应用价值。在基于决策树的数据分类算法基础上,采用相异度计算原理进行再次分类,以此对移动通信客户信息中的不同属性进行分析,重点对移动通信客户是否可能成长为高价值客户的分类进行了研究。测试结果表明,该组合分类算法在移动通信客户分类时的平均准确率达到了83.1%。 相似文献
15.
16.
基于变精度粗糙集的决策树优化算法研究 总被引:4,自引:2,他引:4
应用变精度粗糙集理论,提出了一种利用新的启发式函数构造决策树的方法。该方法以变精度粗糙集的分类质量的量度作为信息函数,对条件属性进行选择。和ID3算法比较,本方法充分考虑了属性间的依赖性和冗余性,尤其考虑了训练数据中的噪声数据,允许在构造决策树的过程中划入正域的实例类别存在一定的不一致性,可简化生成的决策树,提高决策树的泛化能力。 相似文献
17.
传统决策树算法应用于有序分类任务时存在两个问题:传统决策树算法没有引入序关系,因此无法学习和抽取数据集中的序结构;现实生活中存在大量模糊而非精确的知识,而传统的决策树算法无法处理存在模糊属性取值的数据。针对上述问题,提出了基于模糊优势互补互信息的有序决策树算法。首先,使用优势集表示数据中的序关系,并引入模糊集来计算优势集以形成模糊优势集。模糊优势集不仅能反映数据中的序信息,而且能自动获取不精确知识。然后,在模糊优势集的基础上将互补互信息进行推广,并提出了模糊优势互补互信息。最后,使用模糊优势互补互信息作为启发式,设计出基于模糊优势互补互信息的有序决策树算法。在5个人工数据集及9个现实数据集上的实验结果表明,所提算法在有序分类任务上较经典决策树算法取得了更低的分类误差。 相似文献
18.
ID3算法作为数据挖掘分类技术中的核心算法,有着构造简单、学习能力强、分类速度快等优点。但由于其沿用的是机器学习算法,处理的数据集规模小且与数据库集成性较差,影响了其实用性。在继承原有算法思路的基础上,对其核心部分进行了改进,通过使用嵌入式SQL,直接对目标数据库进行查询操作并处理,最终得到分类决策表并保存于数据库。实验证明,改进的ID3算法结合了SQL的高效性和C语言的灵活性,高效无缝地实现了大量数据的分类且大大提高了算法的执行效率。 相似文献
19.
CART决策树的两种改进及应用 总被引:2,自引:0,他引:2
利用Fayyad边界点判定原理对CART决策树选取连续属性的分割阈值的方法进行改进,由Fayyad边界点判定原理可知,建树过程中选取连续属性的分割阈值时,不需要检查每一个分割点,只要检查样本排序后,该属性相邻不同类别的分界点即可;针对样本集主类类属分布不平衡时,样本量占相对少数的小类属样本不能很好地对分类进行表决的情况,采用关键度度量的方法进行改进。基于这两点改进构建CART分类器。实验结果表明,Fayyad边界点判定原理适用于CART算法,利用改进后的CART算法生成决策树的效率提高了近45%,在样本集主类类属分布不平衡的情况下,分类准确率也略有提高。 相似文献
20.
基于粗糙集的理论全面考虑了分离属性每个划分对整个分类的贡献程度,把这些贡献度进行汇总,避免局部最佳效应。在此基础上结合变精度模型,用变精度近似精度来代替近似精度,提出了一种新的变精度分支汇总粗糙度的概念,把变精度分支汇总粗糙度作为属性选择标准构造决策树。既提高了属性选择的准确度又有效克服噪声数据的影响,使生成的决策树灵活泛化能力更强。将算法应用于武汉市康龙逸君健康体检中心的信息管理系统,经实际数据验证,该算法生成的决策树复杂度低,分类效果好。 相似文献