首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
针对构造决策树时,分类属性的选择直接影响分类效果的问题,提出了一种新的属性选择分类标准——集合分类粗糙度,该标准结合了ROUGH集知识表示与决策树构造的特性,能在总数不变的情况下,使叶结点的层次在一定程度上上浮.  相似文献   

2.
在构造决策树的过程中,分离属性选择的标准直接影响分类的效果.基于变精度粗糙集的理论将属性重要度作为选择分离属性的标准.经实验证明,使用该方法构造的决策树与经典ID3决策树算法相比,具有复杂性低,能有效提高分类效果的优点.  相似文献   

3.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的标准直接影响决策树分类的效果。基于粗糙集的属性频率函数等方法度量属性重要性的概念,将其用于分枝划分属性的选择,提出一种决策树学习算法。该方法仅利用区分矩阵就可以计算出属性的出现频率函数值,计算简单。实验结果表明,用该方法构造的决策树与传统的基于信息熵方法构造的决策树相比较,结构简单,且能有效提高分类效果。  相似文献   

4.
基于决策树数据挖掘的分析与应用   总被引:1,自引:1,他引:0  
决策树技术是一种对海量数据集进行分类的非常有效方法。通过构造决策树模型,提取有价值的分类规则,帮助决策者做出准确的预测已经应用在很多领域。基于这种技术构造的蘑菇可食用性决策树模型,提供了通过蘑菇属性判别蘑菇可食用性的科学依据。决策树算法采用C4.5算法,它把信息增益率作为属性选择的度量标准。从实验结果来看,决策树模型虽然显示了一个很不平衡的结构,但得出了很容易理解的决策规则。  相似文献   

5.
为了使构造的决策树更简单,规则更容易被理解且精度更高,文章基于粗糙集理论提出了一种对属性约简及泛化的多变量决策树算法。该方法采用条件属性的加权平均粗糙度这个指标来选择测试属性构造决策树。实验表明该方法较ID3算法得到的决策树更小且分类准确率更高。文章还展望用核属性以外的条件组合属性作测试属性构造更简化的多变量决策树。  相似文献   

6.
Iterative Dichotomiser version3(ID3)算法是数据挖掘中经典的决策树分类算法,其核心是分裂训练集属性的选择标准,即分裂前后的信息增益量最大,用该标准选择属性时对于取值较多的属性具有较强依赖性。剖析了ID3算法存在的不足并加以改进,引入了属性关注度,提出了改进算法AAID3算法。实验表明改进算法对原ID3算法的取值偏向问题有所克服并使分类更加准确,决策树更加简明。  相似文献   

7.
一个基于粗糙集和决策树的最简分类规则集生成算法   总被引:5,自引:0,他引:5  
利用粗糙集理论中属性核与不可分辨关系给出了属性约简和数据过滤算法,去除信息系统中与决策无关的冗余信号,在简化的信息系统基础上用传统算法构造决策树,总利用由粗糙度理论推出的极小、极大化学习方法对决策树规则进行极小、极大化处理,最后给出了一个最简分类规则集生成算法。  相似文献   

8.
基于决策树的就业数据挖掘   总被引:12,自引:0,他引:12  
针对学生就业问题,给出了就业数据挖掘模型.决策树方法是数据挖掘中非常有效的分类方法,根据就业数据特点,采用了C4.5决策树算法.C4.5算法是决策树核心算法ID3的改进算法,它构造简单,速度较快,容易实现.模型对就业数据预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别,挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析。  相似文献   

9.
决策树构造过程中的属性选择标准一直是数据挖掘领域的研究热点。本研究在分析ID3算法和C4.5算法属性选择策略的基础上,基于通信系统中的平均自信息与平均互信息提出了两种决策树的构造算法。研究过程中从理论证明了所提出的两种算法与ID3算法以及C4.5算法是等价的,即,信息增益等价于通信系统中的平均互信息,而信息增益率等价于通信系统中平均互信息与平均自信息的比值。在AllElectronics数据集进行的实验表明:与信息增益和信息增益率相比,本研究提出的属性选择标准具有计算方便、且容易理解的特点。  相似文献   

10.
一种基于信息熵建立决策树的算法   总被引:2,自引:0,他引:2  
信息论给出了信息的数学本质,提出了用热力学中的熵来度量信息量的大小。分类是一个重要的数据挖掘问题,在训练数据集上建立分类树的关键是如何选择决策树每一个内部结点的测试属性。传统的决策树建立算法利用信息论中熵的概念选择属性,具有偏向于取值较多属性的缺点。本文分析了信息论中有关熵的一些基本概念和含义,讨论了它们在挖掘分类树中的应用,利用互信息设计了一个建立分类树的算法,克服了传统算法的缺点。  相似文献   

11.
一种新的基于粗糙集理论的决策表离散化算法   总被引:12,自引:0,他引:12  
主要研究了粗糙集理论在决策表离散化中的应用,提出了一种新的基于粗糙集理论的决策表离散化算法.该算法是一种基于决策表属性重要性的算法,首先使用条件属性与决策属性的互信息来度量条件属性的重要性,并据此对条件属性按照重要性由小到大排序,然后按排序后的顺序,考察每个条件属性的所有断点,将冗余的断点去掉,从而将条件属性离散化.  相似文献   

12.
模糊信息表决策规则获取与属性约简方法   总被引:2,自引:0,他引:2  
将粗糙集方法用于模糊信息表上的规则获取和属性约简, 在包含度概念的基础上, 定义了齐次包含度.对两类模糊信息值的信息表, 条件属性是离散值,而决策属性是模糊的模糊决策信息表和条件属性与决策属性均为模糊的模糊信息表, 采用齐次包含度研究了条件属性在决策属性中的包含关系, 得到了包含度意义下模糊决策信息表的属性约简判定定理和决策规则获取方法. 给出了模糊条件属性的所有可能组合, 研究了模糊组合属性在模糊决策属性中的包含关系, 提出了最大属性协调集的概念,建立了在最大协调属性集下的模糊信息表属性约简和决策规则获取的算法步骤, 并通过算例演示了模糊决策规则获取和属性约简的过程, 从而为模糊信息表决策规则获取与属性约简提供了一类算法.  相似文献   

13.
一种基于互信息增益率的新属性约简算法   总被引:13,自引:1,他引:13  
为了获得决策系统中更好的相对属性约简,提出了一种基于互信息增益率的属性约简算法.该算法考虑了所选择条件属性与决策属性的互信息,还考虑了所选择属性的值的分布情况,从信息论角度定义了基于互信息增益率的属性重要性度量方法,并以此度量为启发式信息,算法从空集开始逐步将最重要的条件属性加入到选择属性集,直到所选择的条件属性集与决策属性集的互信息等于整个条件属性集与决策属性集的互信息时,算法停止.结果表明,算法能更有效地对决策系统进行约简,同时约简后的对象数目较少.  相似文献   

14.
决策表的属性约简方法有多种,常用的方法是利用区分矩阵生成区分函数,对区分函数进行化简,进而得到决策表的属性约简。文章提出了决策表的区分向量的概念,并给出了利用区分向量进行属性约简的方法。  相似文献   

15.
决策表中的对象被修改,核属性将会发生变化,需要对核属性及时更新。为此,首先,构造决策表等价类链表存储结构,并引入基于该存储结构的简化决策表定义和基于简化决策表的核属性定义;同时证明了该核属性与正区域核属性是等价的。然后,讨论修改指定对象情况下核属性更新方法,并给出相应的算法实现;算法以简化决策表为基础,仅需对等价类链部分搜寻,查找待修改对象,缩小了查找范围,提升了算法效率;另外,采用核属性计数方法,避免可分辨矩阵的存储,降低了空间复杂度。最后,通过实例验证了该算法的有效性。  相似文献   

16.
以信息增益作为属性重要性的度量方法,提出了一种基于信息增益的属性约简算法.该算法总是优先考虑对于决策更为重要的属性,用条件属性对决策属性的信息增益作为条件属性的属性重要性度量,并以此度量作为启发式信息,算法从空集开始逐步将重要的属性加入到选择属性集,直到决策表达到一致分类时结束.并通过实例分析验证了该算法能有效地对属性进行约简,同时可以得到简单规则集.  相似文献   

17.
基于信息增益的属性约简算法   总被引:1,自引:0,他引:1  
以信息增益作为属性重要性的度量方法,提出了一种基于信息增益的属性约简算法.该算法总是优先考虑对于决策更为重要的属性,用条件属性对决策属性的信息增益作为条件属性的属性重要性度量,并以此度量作为启发式信息,算法从空集开始逐步将重要的属性加入到选择属性集,直到决策表达到一致分类时结束.并通过实例分析验证了该算法能有效地对属性进行约简,同时可以得到简单规则集.  相似文献   

18.
一种基于粗糙集的K-means聚类算法   总被引:2,自引:0,他引:2  
对粗糙集进行了相关研究,并提出了一种以粗糙集理论为基础的K-平均聚类算法,该算法以信息表中条件属性和决策属性的一致性原理为基础,应用粗糙集的属性约简算法消除冗余属性,利用各属性重要度确定其权值,在此基础上应用改进的K-平均算法进行聚类分析.该方法的优势在于消除了不重要的属性,赋予了各属性权值,使聚类更有效,更客观.实验结果表明,该方法是有效的.  相似文献   

19.
为了解决区间信息多属性决策问题,建立了两种多属性决策算法(算法1和算法2).算法1: 首先利用区间数的积型贴近度公式将属性的区间信息数据转换为精确数值,然后使用Maclaurin对称平均算子集结属性的精确数值,进而通过比较其数值大小来判断方案的优劣.算法2: 首先利用区间数的积型贴近度公式算出各方案在所有属性上的积型模糊互补判断矩阵,然后通过求解积型模糊互补判断矩阵的排序向量来判断方案的优劣.研究表明,两种算法的决策路径虽然不同,但其排序结果相同,即不同决策路径不会影响方案的排序结果,因此决策者可以根据实际问题需要选择适当的决策算法及排序规则,以更好地满足决策需求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号