共查询到10条相似文献,搜索用时 15 毫秒
1.
决策树算法是一种采用分治策略的自顶向下的归纳算法,传统的决策树算法往往是基于信息论度量的.文章以粗糙集合理论中的区分观点为基础,提出了两种新型的属性选择判据:区分度和区分价值.实验结果表明,采用区分价值的属性选择策略所生成的决策树要明显优于基于熵的属性选择策略. 相似文献
2.
分类问题是数据挖掘和机器学习中的一个核心问题。为了得到最高的分类准确率,决策树分类过程中,决策属性的选择非常关键。分析了粗糙理论的属性约简方法,提出了基于粗糙理论的属性约简在决策树中的应用,并产生多个相对约简的选择问题。 相似文献
3.
4.
数据挖掘技术在医学领域的应用已经逐步成熟。其中,粗糙集合理论作为研究不精确性、不确定性、不完整性现存信息或知识的数学工具,适合分析某些疾病各个症状内在的微妙关系。通过心脏病病例数据分析,也可以给医学统计提供一些证据。从而推导出一部分相对准确的计算机医学诊断所需的知识。本文依据吉林大学医学部的临床数据做出了细致的数学推断,并给出了数据挖掘的结果。 相似文献
5.
6.
基于属性相关性的决策树规则生成算法 总被引:5,自引:0,他引:5
决策树方法因结构简单、便于理解和具有较高的分类精度而在数据挖掘中被广泛采用,其规则生成算法实现对决策树规则的提取和化简。属性相关性分析的基本思想是计算某种度量,用于量化属性与给定概念的相关性。提出了一种基于属性相关性的c4.5决策树规则生成算法c—c4.5rules,可替代c4.5原有的规则生成算法。c—c4.5rules在对规则进行化简时充分考虑了属性之间的关联性,实验表明该算法在保持原有分类精度的前提下,能有效提高规则生成时的计算速度和效率。 相似文献
7.
分析了ID3算法的基本原理、实现步骤及现有两种改进分类算法的优缺点,针对ID3算法的取值偏向问题和现有两种改进算法在分类时间、分类精确度方面存在的不足,提出了一种新的分类属性选择方案,并利用数学知识对其进行了优化。经实验证明,优化后的方案克服了ID3算法的取值偏向问题,同时在分类时间及分类精确度方面优于ID3算法及现有两种改进的分类算法。 相似文献
8.
采用粗糙集理论中的属性重要度作为挑选测试属性的指标来构造决策树,形成了一种新的决策树分类算法S_D_Tree,在计算挑选测试属性的时间复杂度为O(|C||n|)。实验结果表明,该算法可以构建一个较简洁的决策树,与C4.5算法相比较,具有更好的预测准确率。 相似文献
9.
单变量决策树难以反映信息系统属性间的关联作用,构造的决策树往往规模较大.多变量决策树能较好地反映属性间的关系,得到非常简单的决策树,但使构造的决策树难以理解.针对以上两种决策树特点,提出了基于知识粗糙度的混合变量决策树的构造方法,选择知识粗糙度较小的分类属性来构造决策树.实验结果表明,这是一种操作简单、效率很高的决策树生成方法. 相似文献