共查询到19条相似文献,搜索用时 78 毫秒
1.
李想 《计算机光盘软件与应用》2014,(7):302-303
文章在基于变精度粗糙集模型的基础上,研究了具有置信度规则的一种新的决策树构造方法。新算法对基于粗糙集的决策树生成方法进行改进,新算法以变精度加权平均粗糙度作为属性选择标准构造决策树,综合分析训练数据的噪声数据,引入在构造决策树的过程中存在的不一致性。在决策树生长过程中引入置信度,以控制决策树的生长,得到具有确切置信度的决策规则。 相似文献
2.
本文在应用变精度粗糙集模型构造决策树的研究基础上,提出了具有置信度规则的决策树的构造方法。该方法是对决策树生成方法的一个改进,所构造的决策树具有更强的实用性以及更高的可理解性。本文还针对两个甚至两个以上属性的分类质量量度相等的特殊情形,给出了如何选择较优的属性作为结点的方法。与传统的ID3算法相比,该方法所构造的决策树不仅结构简单,而且更加实用,利于理解。 相似文献
3.
基于变精度粗糙集理论提出了具有置信度规则决策树的新的构造方法,该方法采用β-边界域的大小作为选择分类属性的标准,并对叶节点的置信度进行了重新的定义。经实验证明,该方法能有效提高分类效率且更加容易理解。 相似文献
4.
基于变精度粗糙集的决策树优化算法研究 总被引:4,自引:2,他引:4
应用变精度粗糙集理论,提出了一种利用新的启发式函数构造决策树的方法。该方法以变精度粗糙集的分类质量的量度作为信息函数,对条件属性进行选择。和ID3算法比较,本方法充分考虑了属性间的依赖性和冗余性,尤其考虑了训练数据中的噪声数据,允许在构造决策树的过程中划入正域的实例类别存在一定的不一致性,可简化生成的决策树,提高决策树的泛化能力。 相似文献
5.
针对决策树构造中存在的最优属性选择困难、抗噪声能力差等问题,提出了一种新的基于变精度粗糙集模型的决策树构造算法.该算法采用近似分类精度作为节点选择属性的启发函数,与传统基于粗糙集的决策树构造算法相比,该算法构造的决策树结构简单,提高了决策树的泛化能力,同时对噪声也有一定的抑制能力. 相似文献
6.
介绍了Ziarko’s变精度粗糙集模型和粗糙模糊集模型,找出了它们的不足。基于支集相对错误分类率及误差参数β(0≤β<0.5),提出了变精度粗糙模糊集模型,讨论了模型中β上、下近似算子的性质;分析了该模型与Ziarko’s变精度粗糙集模型和粗糙模糊集模型的关系;最后给出了该模型中近似约简的定义和方法,并通过实例分析说明了约简算法的有效性。 相似文献
7.
8.
针对ID3算法构造决策树复杂、分类效率不高等问题,本文基于变精度粗糙集模型提出了一种新的决策树构造算法。该算法采用加权分类粗糙度作为节点选择属性的启发函数,与信息增益相比,该标准更能够全面地刻画属性分类的综合贡献能力,计算简单,并且可以消除噪声数据对选择属性和生成叶节点的影响。实验结果证明,本算法构造的决策树在规模与分类效率上均优于ID3算法。 相似文献
9.
10.
本文将粗糙集理论应用到决策树生成过程中,利用变精度粗糙集理论属性约简的特性在决策树生成过程中在保证分类能力不变的前提下减少分支数目,并考虑到实际问题中噪声数据的影响。 相似文献
11.
Wojciech Ziarko 《Computational Intelligence》2001,17(3):593-603
The Variable Precision Rough Set Model (VPRS) is an extension of the original rough set model. This extension is directed towards deriving decision table-based predictive models from data with parametrically adjustable degrees of accuracy. The imprecise nature of such models leads to quite significant modification of the classical notion of decision table. This is accomplished by introducing the idea of approximation region-based, or probabilistic decision table which is a tabular specification of three, in general uncertain, disjunctive decision rules corresponding to rough approximation regions: positive, boundary and negative regions. The focus of the paper is on the extraction of such decision tables from data, their relationship to conjunctive rules and probabilistic assessment of decision confidence with such rules. 相似文献
12.
13.
14.
Pawlak粗集模型所描述的分类是完全精确的,而没有某种程度上的近似。在利用Pawlak粗集模型构造决策树的过程中,生成方法会将少数特殊实例特化出来,使生成的决策树过于庞大,从而降低了决策树对未来数据的预测和分类能力。利用变精度粗集模型,对基于Pawlak粗集模型的决策树生成方法进行改进,提出变精度明确区的概念,允许在构造决策树的过程中划入明确区的实例类别存在一定的不一致性,可简化生成的决策树,提高决策树的泛化能力。 相似文献
15.
决策树算法是一种采用分治策略的自顶向下的归纳算法,传统的决策树算法往往是基于信息论度量的.文章以粗糙集合理论中的区分观点为基础,提出了两种新型的属性选择判据:区分度和区分价值.实验结果表明,采用区分价值的属性选择策略所生成的决策树要明显优于基于熵的属性选择策略. 相似文献
16.
通过正交实验,可以获得最少的实验次数,但是由于选择样本的盲目性决定所测得的样本中可能不包含最优样本,如果要找到最优样本就必须进行大量的后续实验。针对这些特点以及实验本身存在误差,提出了基于变精度粗糙集理论的正交实验设计方法,通过比较条件属性对决策属性的B分类质量来设计实验参数,结果表明大大提高了实验工作的效率和质量。 相似文献
17.
18.
粗糙集理论一直致力于研究不确定或不精确信息的数据分析问题。基于粗糙集的相关概念,对标准粗糙集模型与可变精度粗糙集模型进行了比较研究,着重描述了可变精度粗糙集模型的特点。 相似文献
19.
在多标记决策系统中,每个对象由单个实例进行表示,同时对应于多个决策属性。粗糙集理论已有的研究工作主要集中在单一决策系统的研究上,对于多决策系统只是简单地将它分解成多个单一决策系统。直接变换的方法忽视了决策属性之间的相关性和共现性,影响决策的精度。基于粗糙集模型,分别针对属性值为离散型和连续型的情况,提出了离散型多标记决策系统知识获取算法DML和连续型多标记决策系统知识获取算法CML。这两种算法均考虑了标记之间的相关性,在离散多标记决策系统中,采用决策链方式传递属性间的相关性,而在连续多标记决策系统中,扩展了传统粗糙集模型,重新定义了粗糙近似。实验表明,不论是离散型还是连续型决策系统,考虑决策属性之间的相关性均可以提高预测的准确率。 相似文献