首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
基于粗集的决策树构建的探讨   总被引:1,自引:0,他引:1  
杨宝华 《微机发展》2006,16(8):83-84
决策树是对未知数据进行分类预测的一种方法。自顶向下的决策树生成算法关键是对结点属性值的选择。近似精度是RS中描述信息系统模糊程度的参量,能够准确地刻画粗集。文中在典型的ID3算法的基础上提出了基于RS的算法。该算法基于近似精度大的属性选择根结点,分支由分类产生。该算法计算简单,且分类使决策树和粗集更易理解。  相似文献   

2.
决策树是对未知数据进行分类预测的一种方法。自顶向下的决策树生成算法关键是对结点属性值的选择。近似精度是RS中描述信息系统模糊程度的参量,能够准确地刻画粗集。文中在典型的ID3算法的基础上提出了基于RS的算法。该算法基于近似精度大的属性选择根结点,分支由分类产生。该算法计算简单,且分类使决策树和粗集更易理解。  相似文献   

3.
基于变精度粗糙集的决策树优化算法研究   总被引:4,自引:2,他引:4  
应用变精度粗糙集理论,提出了一种利用新的启发式函数构造决策树的方法。该方法以变精度粗糙集的分类质量的量度作为信息函数,对条件属性进行选择。和ID3算法比较,本方法充分考虑了属性间的依赖性和冗余性,尤其考虑了训练数据中的噪声数据,允许在构造决策树的过程中划入正域的实例类别存在一定的不一致性,可简化生成的决策树,提高决策树的泛化能力。  相似文献   

4.
乔梅  韩文秀 《计算机应用》2005,25(5):989-991
噪音数据是影响决策树训练效率和结果集质量的重要因素。目前的树剪枝方法不能消除噪音数据对选择决策树测试节点属性的影响。为改变这种状况,基于变精度Rough集(VPRS)模型,提出了一个在决策树算法中处理噪音数据的新方法---预剪枝法,该方法在进行选择属性的计算之前基于变精度正区域求取属性修正的分类模式,来消除噪音数据的对选择属性以及生成叶节点的影响。利用该方法对基本ID3决策树算法进行了改进。分析和实验表明,与先剪枝方法相比,该方法能进一步减小决策树的规模和训练时间。  相似文献   

5.
决策树是数据挖掘中常用的分类方法。针对高等院校学生就业问题中出现由噪声造成的不一致性数据,本文提出了基于变精度粗糙集的决策树模型,并应用于学生就业数据分析。该方法以变精度粗糙集的分类质量的量度作为信息函数,对条件属性进行选择,作为树的节点,自上而下地分割数据集,直到满足某种终止条件。它充分考虑了属性间的依赖性和冗余性,允许在构造决策树的过程中划入正域的实例类别存在一定的不一致性。实验表明,该算法能够有效地处理不一致性数据集,并能正确合理地将就业数据分类,最终得到若干有价值的结论,供决策分析。该算法大大提高了决策规则的泛化能力,减化了树的结构。  相似文献   

6.
朱一飞  武琳琳 《福建电脑》2012,28(7):111-112
本文将粗糙集理论应用到决策树生成过程中,利用变精度粗糙集理论属性约简的特性在决策树生成过程中在保证分类能力不变的前提下减少分支数目,并考虑到实际问题中噪声数据的影响。  相似文献   

7.
变精度双向S-粗集及其应用   总被引:3,自引:0,他引:3  
提出基于副集的双向S-粗集,变精度双向S-粗集;给出基于副集的双向S-粗集,变精度双向S-粗集的数学结构;给出变精度双向S-粗集的存在背景和意义解释。变精度双向S-粗集是对双向S-粗集理论的完善和发展。  相似文献   

8.
变精度粗糙集模型在决策树构造中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
针对ID3算法构造决策树复杂、分类效率不高等问题,本文基于变精度粗糙集模型提出了一种新的决策树构造算法。该算法采用加权分类粗糙度作为节点选择属性的启发函数,与信息增益相比,该标准更能够全面地刻画属性分类的综合贡献能力,计算简单,并且可以消除噪声数据对选择属性和生成叶节点的影响。实验结果证明,本算法构造的决策树在规模与分类效率上均优于ID3算法。  相似文献   

9.
食品安全决策是食品安全问题研究的一项重要内容。为了对食品安全状况进行分析,基于粗糙集变精度模型,提出了一种包含规则置信度的构造决策树新方法。这种新方法针对传统加权决策树生成算法进行了改进,新算法以加权平均变精度粗糙度作为属性选择标准构造决策树,用变精度近似精度来代替近似精度,可以在数据库中消除噪声冗余数据,并且能够忽略部分矛盾数据,保证决策树构建过程中能够兼容部分存在冲突的决策规则。该算法可以在生成决策树的过程中,简化其生成过程,提高其应用范围,并且有助于诠释其生成规则。验证结果表明该算法是有效可行的。  相似文献   

10.
文章在基于变精度粗糙集模型的基础上,研究了具有置信度规则的一种新的决策树构造方法。新算法对基于粗糙集的决策树生成方法进行改进,新算法以变精度加权平均粗糙度作为属性选择标准构造决策树,综合分析训练数据的噪声数据,引入在构造决策树的过程中存在的不一致性。在决策树生长过程中引入置信度,以控制决策树的生长,得到具有确切置信度的决策规则。  相似文献   

11.
Probabilistic Decision Tables in the Variable Precision Rough Set Model   总被引:5,自引:0,他引:5  
The Variable Precision Rough Set Model (VPRS) is an extension of the original rough set model. This extension is directed towards deriving decision table-based predictive models from data with parametrically adjustable degrees of accuracy. The imprecise nature of such models leads to quite significant modification of the classical notion of decision table. This is accomplished by introducing the idea of approximation region-based, or probabilistic decision table which is a tabular specification of three, in general uncertain, disjunctive decision rules corresponding to rough approximation regions: positive, boundary and negative regions. The focus of the paper is on the extraction of such decision tables from data, their relationship to conjunctive rules and probabilistic assessment of decision confidence with such rules.  相似文献   

12.
《Knowledge》2007,20(8):695-702
This paper presents a new approach for inducing decision trees based on Variable Precision Rough Set Model. The presented approach is aimed at handling uncertain information during the process of inducing decision trees and generalizes the rough set based approach to decision tree construction by allowing some extent misclassification when classifying objects. In the paper, two concepts, i.e. variable precision explicit region, variable precision implicit region, and the process for inducing decision trees are introduced. The authors discuss the differences between the rough set based approaches and the fundamental entropy based method. The comparison between the presented approach and the rough set based approach and the fundamental entropy based method on some data sets from the UCI Machine Learning Repository is also reported.  相似文献   

13.
一种基于容错粗糙集的Web文档分类方法   总被引:2,自引:0,他引:2  
为了充分利用Web这一宝贵资源,需要一种高效准确的Web分类方法.应用机器学习技术,如K-邻近法、贝叶斯概率模型等已经实现了Web文档半自动和自动分类,但是,大多数Web分类方法共同的特点是把类作为互斥的概念,很少考虑类与类之间存在一定的交叉概念.其实,一个Web文档有时可属于几个类别,说明web文档的类之间存在不确定的关系.粗糙集理论-l982年Pawlak提出的,它在不确定关系表示有显著优点.由近似关系产生的分类方法分类精度更高.在web文档常用向量模型基础上,利用特征词协同出现的价值,本文采用一种广义粗糙集……容错关系(tolerance relation)来表示文档,丰富特征词对Web文档的描述,实验结果表明它更适合表示Web文档,有利于提高Web分类的准确性.  相似文献   

14.
粗糙集对于学习分析系统的属性约减模型有着重要的研究意义和使用价值。针对教育大数据高维度、不完备、增量性等现状,提出了基于不完备决策表的差别信息增量更新算法,并结合树形结构对差别信息的高效存储和粗糙集的核属性概念,设计构建了MIX_FP树,实现高维属性的有效约减。实验结果验证了该算法具有较好的运行效率和空间性能,为教育大数据的属性约减提供了有效的方法,同时为基于粗糙集理论的属性约减算法研究和及其在学习分析领域的应用提供了新的研究思路。  相似文献   

15.
基于变精度粗糙集模型的Matlab实现   总被引:1,自引:0,他引:1  
结合Matlab语言和粗糙集理论的特点,提出了集合的二进制表示方案,巧妙地解决了基于变精度粗糙集模型的程序设计问题。  相似文献   

16.
可变精度粗糙集模型是标准粗糙集模型的扩展,通过引入参数β,改善了粗糙集模型对噪声数据的适应能力。通过对VPRS理论的应用,分析了决策表中分类质量γ与参数β值之间的反向相关关系,基于两者之间关系的分析结果,给出了依据γ来确定β精确取值区间的算法。  相似文献   

17.
粗糙集连续属性离散化模型研究与应用要点分析   总被引:10,自引:0,他引:10  
基于粗糙集理论,研究连续属性离散化问题的本质特点,提出粗糙集指标衡量和优化算法结构相统一的离散化思想,设计通用的离散化方法模型。分析主流的SOM网络、GA、层次聚类、信息熵等主流聚类方法的特点,并基于这种结构模型,给出了相应离散化方法的应用要点。  相似文献   

18.
属性频率划分和信息熵离散化的决策树算法   总被引:2,自引:0,他引:2       下载免费PDF全文
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的度量直接影响决策树分类的效果。基于粗糙集的属性频率函数方法度量属性重要性,并用于分枝划分属性的选择和决策树的预剪枝,提出一种决策树学习算法。同时,为了能处理数值型属性,利用数据集的统计性质为启发式知识,提出了一种改进的数值型属性信息熵离散化算法。实验结果表明,新的离散化方法计算效率有明显提高,新的决策树算法与基于信息熵的决策树算法相比较,结构简单,且能有效提高分类效果。  相似文献   

19.
邓松  王映龙  何火娇  罗东平  袁威 《微机发展》2011,(9):160-162,166
在销售决策支持系统中,存在着大量的信息和很多不确定的因素,这使得做出科学合理的决策变得很困难。粗糙集理论是处理不确定性知识与不完整数据的有效工具,因此可以根据粗糙集理论通过分析推理找出销售数据中存在的有用的知识。依据粗糙集理论实现了一种对销售决策表知识简化的方法,采用粗集理论处理大量销售信息,从中提取有用规则,通过分析和推理产生最小决策规则。通过实例分析,验证了粗糙集理论与销售决策支持系统相结合方法的可行性。该方法有效地解决了智能销售决策支持系统中决策规则的获取与理解等问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号