首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 531 毫秒
1.
基于不可分辨关系、复合运算、集合运算和逻辑运算等集合论概念,构造一种新型的多变量决策树算法。该算法包括5个步骤:依据决策属性值划分出决策类;利用决策类之间条件属性集相交判断二义性条件属性值;利用决策类各条件属性值域的不同判断独立决策条件属性值;利用决策类自身条件属性集进行复合运算,获得多变量决策方法;使用或运算符(∨)连接各个部分的决策规则以取得完整的决策规则。以决策树典型训练集(气象信息系统)为例进行验证,其结果表明,该算法行之有效。通过时间复杂度的分析结果表明,该算法较之粗糙集算法更优,而且不亚于ID3算法。    相似文献   

2.
决策树剪枝是将已生成的决策树进行简化的过程,包括预剪枝和后剪枝。为了提高后剪枝算法MEP的剪枝精度,防止因MEP影响因子选取不当造成决策树修剪过度而丢失特征信息的问题,提出一种改进的MEP算法即IMEP方法。首先引入k-折交叉验证(k-Fold Cross-Validation)方法用于选取最优的影响因子m,然后将m带入到MEP算法,再对原始决策树进行剪枝,可以得到最精确的决策树,并保持决策树的影响特征。其次,通过k次交叉验证,可以避免产生过拟合问题,和单独测试集方法相比,经过k次交叉验证后,已经减弱了随机性,防止出现"欠学习"问题。经过验证IMEP方法不仅提高了MEP的精度,能更精准简化决策树,并且保持决策树的影响特征。相比于PEP算法,在数据集较小时有更好的适用性,表现更加稳定。  相似文献   

3.
粒计算规则生成模型   总被引:3,自引:0,他引:3  
提出了一种粒计算规则生成模型GrCRule.该模型以最优粒化为基础来构造粒的最优划分,避免了决策树方法必需使用同一属性的所有属性值对来构造划分的局限.通过仿真实验说明,该模型能够得到比决策树方法更精简的规则集以及更强的泛化能力.  相似文献   

4.
一种改进的PEP决策树剪枝算法   总被引:1,自引:0,他引:1  
剪枝过程是决策树分类学习中的重要环节,能够简化决策树并提高决策树的泛化能力,避免对训练数据集的过适应。在PEP算法的基础上,本文提出了一种改进的决策树剪枝算法IPEP,实验结果表明,该算法剪枝效果较PEP算法更好。  相似文献   

5.
在粗糙集值约简算法中,需要对决策表的属性值进行分类.文中基于二进制可辨矩阵和为同一决策类的不同对象建立的二进制矩阵,提出一种简化的属性值分类方法,该方法能实现决策表属性值快速分类.最后通过实例分析验证了该方法的可行性和有效性.  相似文献   

6.
用知识发现的思想来解决决策型工艺知识获取问题。定义了工艺决策数据表(PDDT)的概念,用它存储工艺决策数据样本,并基于CLS(Concept Learning System)算法提出了一种改进的工艺决策树学习算法,采用ID3(Iterative Dichotomizer 3)算法来度量工艺决策数据表中条件属性对于工艺决策规则的重要性,进而构建工艺决策树,提出了工艺决策树简化处理的原则以及转换为工艺决策规则的方法。  相似文献   

7.
针对传统的基于信息熵的决策树算法所存在的问题,本研究从粗糙集理论的角度来考虑信息熵,定义了依赖决策熵的概念,并提出一种基于依赖决策熵的决策树算法DTDDE。在DTDDE算法中,采用依赖决策熵的概念来度量每个条件属性的重要性,并选择重要性最大的属性作为当前的分离属性。通过在多个UCI数据集上的实验表明:与现有的决策树算法相比,本研究所提出的算法能够获得更好的分类性能。  相似文献   

8.
现实世界中存在大量不相容数据.基于Rough集的有关理论,提出了一个在决策树生成过程中简单高效的识别、处理不相容数据,生成不一致决策叶节点的方法,并引入决策质量参数来刻画不一致叶节点,从而为利用决策树推理和决策提供更多有用信息.将这些方法结合进ID3算法,使算法对相容和不相容数据均可进行有效地处理.  相似文献   

9.
现实世界中存在大量不相容数据.基于Rough集的有关理论,提出了一个在决策树生成过程中简单高效的识别、处理不相容数据,生成不一致决策叶节点的方法。并引入决策质量参数来刻画不一致叶节点,从而为利用决策树推理和决策提供更多有用信息.将这些方法结合进ID3算法,使算法对相容和不相容数据均可进行有效地处理.  相似文献   

10.
将数据挖掘中的决策树与粗糙集理论进行有机结合,提出一种基于粗糙集属性依赖度的决策树算法,将该算法应用到电子商务的客户管理中,进行电子商务客户价值研究,提取分类规则,为企业管理客户提供决策支持.  相似文献   

11.
基于熵的决策树分枝合并算法   总被引:10,自引:0,他引:10  
目前,基于逻辑的示例学习算法主要分两大类,决策树算法和基于规则的算法,前者以ID3为代表,ID3使用“信息熵”作启发式得出较小的决策树,但ID3算法只注意到减少树的深度,忽视树的宽度,本文给出了一种决策树分枝合并算法。可减少决策树的宽度,从而得出比ID3更好的结果。  相似文献   

12.
基于决策树数据挖掘的分析与应用   总被引:1,自引:1,他引:0  
决策树技术是一种对海量数据集进行分类的非常有效方法。通过构造决策树模型,提取有价值的分类规则,帮助决策者做出准确的预测已经应用在很多领域。基于这种技术构造的蘑菇可食用性决策树模型,提供了通过蘑菇属性判别蘑菇可食用性的科学依据。决策树算法采用C4.5算法,它把信息增益率作为属性选择的度量标准。从实验结果来看,决策树模型虽然显示了一个很不平衡的结构,但得出了很容易理解的决策规则。  相似文献   

13.
提出了一种改进的扩充攻击树结构和攻击树算法,依据用户SPRINT计划来识别授权用户的恶意行为。该算法分为3个阶段:剪枝攻击树阶段:针对每个授权用户的SPRINT计划,判断子攻击树是否存在后构造相应子攻击树;最小攻击树阶段:剔除无用分支,判断其存在性后生成最小攻击树;风险分析阶段:动态生成最小攻击树中各节点当前的攻击概率,通过更加精确的量化方法辅助系统安全人员做出决策。  相似文献   

14.
针对数据挖掘决策树中迭代二叉树3代算法复杂的对数运算以及属性取值多向依赖的缺陷,提出了一种改进算法。该算法将对数运算改进为简易的普通运算,引入重要度、关联度概念以及调整系数,形成一个综合评价指数来确定作为决策树生成的划分结点的属性。仿真结果表明,改进算法简化了计算过程、提高了运算效率,同时使得决策树的形成不依赖属性多值取向。  相似文献   

15.
为了更高效准确地检测到P2P数据流,将目前在数据挖掘等领域比较成熟的决策树分类技术应用到截包分析研究中.在实际应用中,通过对流的特征属性进行计算统计处理作为训练样本集建立决策树,并对建立的决策树进行剪技优化,实验表明决策树分类技术更能快速准确地定位P2P数据流,在实时处理大量数据方面更能体现决策树分类技术的效率与准确度.  相似文献   

16.
以某运营商的校园套餐为例,根据学生实际使用状况,基于数据挖掘中决策树ID3算法,提出合理化建议来改进套餐内容以便于更贴近学生需要.  相似文献   

17.
决策树是数据挖掘技术中的重要方法,主要用于分类和预测.本文介绍了决策树算法中应用最广泛的ID3算法和C4.5算法,阐述了两种算法的主要思想,说明了构造决策树的基本步骤,对两种算法进行了分析和比较.  相似文献   

18.
一种完全基于高度的满二叉树判定算法   总被引:1,自引:0,他引:1  
分析了满二叉树具有的性质,得到了满二叉树的一个等价定义,利用该等价定义给出了一种完全基 于高度的满二叉树判定算法。该算法解决了传统上既要计算二叉树高度又要计算二叉树中结点个数来判定一棵二 叉树是否为满二叉树的问题,丰富了满二叉树的判定方法。应用结果表明,这种完全基于高度的满二叉树判定算法 运行正确,判定结论可信。  相似文献   

19.
SVM决策树能够较好地进行Web文本信息分类,在此基础上进一步结合遗传算法,将SVM决策树分类器的分类正确率作为GA适应度函数,对SVM决策树层次结构进行优化,在每一决策节点自动选择最优或近优的分类决策。实验结果表明,采用该方法进行多类分类,分类精度明显提高,体现了将遗传算法与SVM决策树结合的优越性。  相似文献   

20.
基于决策树的就业数据挖掘   总被引:12,自引:0,他引:12  
针对学生就业问题,给出了就业数据挖掘模型.决策树方法是数据挖掘中非常有效的分类方法,根据就业数据特点,采用了C4.5决策树算法.C4.5算法是决策树核心算法ID3的改进算法,它构造简单,速度较快,容易实现.模型对就业数据预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别,挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号