首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
决策树算法从一组无规则、无次序的事例中推理出分类规则,同样适用于医疗数据的挖掘。本文研究基于决策树的乳腺肿瘤医疗数据的分析和挖掘,提高癌症诊断的准确率。  相似文献   

2.
基于决策树的税务数据分析   总被引:1,自引:0,他引:1  
本文介绍了决策树的概念及生成过程,研究了利用基尼系数来选取值的算法,并将它集成到税务数据分析系统中,描述了构造税务数据分析系统所采用的方案,并提出了今后决策树研究要解决的一些问题。  相似文献   

3.
基于信息增益法的决策树构造方法   总被引:7,自引:1,他引:6  
决策树数据挖掘技术是目前最有影响和使用最多的一种数据挖掘技术。决策树构造的方法很多,本文提出一种基于信息增益法的决策树构造方法。给出了相应的决策树构造算法,并通过一个实例对其进行了说明。最后,本文对噪声问题、子树复制和碎叶等问题提出了解决思路。  相似文献   

4.
养殖业目前是农村收入主力增长点,本文主要通过对养殖业中的一种-生猪收益因素进行分析,采用决策树中经典算法,ID3算法生成决策树,对下一年养殖收益的情况进行预测,给予指导,并提供有效的建议.  相似文献   

5.
基于粗糙集合理论的决策树生成   总被引:4,自引:1,他引:3  
决策树算法是一种采用发治策略的自顶向下的归纳算法,传统的决策树算法往往是基于信息论度量的。文章以粗糙集合理论中的区分观点为基础,提出了两种新型的属性选择判据:区分度和区分价值。实验结果表明,采用区分价值的属性选择策略所生成的决策树要明显优于基于熵的属性选择策略。  相似文献   

6.
基于Rough Set的最简决策树确定算法的研究   总被引:6,自引:2,他引:6  
决策树是一种有效用于分类的数据采掘方法,有确定性和非确定性决策树。传统的方法是通过信息熵的计算去生成决策树,计算量大。目前有人用RS方法去计算信息熵,但存在局限性。该文将指出其局限性,并给出了一种有效的属性选择算法,确定了最简确定性和非确定性决策树的判别准则及其通用生成算法。  相似文献   

7.
基于遗传算法的多属性模糊决策树的优化   总被引:1,自引:0,他引:1       下载免费PDF全文
决策树是数据挖掘中的一种高效方法,但是当训练数据的属性很多时,构建的决策树的规模会随属性个数增加而指数级增长,进而会产生海量的规则。针对该问题,提出了一种基于遗传算法的优化方法。首先根据信息增益利用轮盘赌方法选取若干组属性,构建多棵决策树,然后利用遗传算法对多棵决策树进行组合,并最终形成规则集。最后给出了实验结果,证明了该方法的可行性和有效性。  相似文献   

8.
基于信息熵的决策树算法实现   总被引:5,自引:0,他引:5  
由数据挖掘中的分类技术引出ID3算法并对其进行了简要的概括,探讨基于信息增益的度量选择测试属性方法。以MFC Class Wizard的过滤记录集取代以往记录集,研制C++实现最优属性选择和ID3算法。  相似文献   

9.
决策树采掘技术及发展趋势   总被引:18,自引:0,他引:18  
介绍了决策树采掘技术的主要内容和最新应用,对决策树的生长和剪枝算法进行了比较。指出了决策采掘技术的研究方向。  相似文献   

10.
通过分析ID3算法的基本原理及其多值偏向问题,提出了一种基于相关系数的决策树优化算法。首先通过引进相关系数对ID3算法进行改进,从而克服其多值偏向问题,然后运用数学中泰勒公式和麦克劳林公式的性质,对信息增益公式进行近似简化。通过具体数据的实例验证,说明优化后的ID3算法能够解决多值偏向问题。标准数据集UCI上的实验结果表明,在构建决策树的过程中,既提高了平均分类准确率,又降低了构建决策树的复杂度,从而还缩短了决策树的生成时间,当数据集中的样本数较大时,优化后的ID3算法的效率得到了明显的提高。  相似文献   

11.
杨杰  叶晨洲  黄欣 《计算机仿真》2000,17(6):19-20,35
有许多优化问题中,目标值是连续的。对这类问题,首先对目标值进行离散化,再采用决策树方法提取规则。在一定程度上,相比直接对连续的目标值优化可提高正确率,并增加结果的可理解性。为了克服分段划分带来的突变性,可将目标值进行模糊划分,再采用决策树方法提取规则,这样进一步可提高正确率。  相似文献   

12.
基于信息论的决策树算法探讨   总被引:5,自引:0,他引:5  
信息论是数据挖掘技术的重要指导理论之一,是决策树算法实现的理论依据.决策树算法是一种逼近离散值日标函数的方法,其实质是在实例学习的基础上,得到分类规则.本文简要介绍信息论的基本原理,重点阐述基于信息论的决策树算法,分析了它们目前主要的代表理论以及存在的问题.  相似文献   

13.
岳根霞  刘金花  刘峰 《计算机仿真》2021,(1):451-454,459
从大数据的基本特点和医疗大数据研究现状出发,分析处理过程中存在的问题,提出在决策树算法下的医疗大数据填补及分类方法.分析医疗数据的关联规则,采用关联分析(Apriori)算法和频繁模式树(Frequent Pattern Growth,FP-Growth)算法挖掘数据.以挖掘数据为基础填补其中的缺失数据,按照医疗数据特...  相似文献   

14.
张棪  曹健 《计算机科学》2016,43(Z6):374-379, 383
决策树作为机器学习中的一个预测模型,因其输出结果易于理解和解释,而被广泛应用于各个领域,成为了学术界研究的热点。随着数据产生速度的剧增,由于内存容量和处理器速度等限制,常规的决策树算法无法对大数据集进行处理,因此需要对决策树算法的实现进行针对性的处理。首先阐述了决策树的基本算法和优化方法,在此基础上结合大数据带来的挑战,分类比较了各类针对性算法的优缺点,并介绍了支撑这些算法运行的平台。最后讨论了面向大数据的决策树算法的未来发展方向。  相似文献   

15.
基于信息增益比的决策树用于毕业生就业预测   总被引:5,自引:0,他引:5  
程昌品  陈强 《计算机仿真》2010,27(2):299-302
关于毕业生就业的预测研究,对毕业生就业及学校招生与教育教学管理工作具有指导作用。针对目前毕业生就业预测存在的不可靠性,提出了一种基于信息增益比的决策树应用于毕业生就业预测分析的方法,通过计算样本空间的信息熵和测试属性的期望信息熵以求得测试属性的信息增益比,从而构造出基于信息增益比的决策树,据此能够准确预测毕业生的就业情况。以广东教育学院的毕业生就业情况为例进行预测,实验结果表明所用方法的有效性和可靠性。  相似文献   

16.
数据挖掘中决策树算法的探讨   总被引:50,自引:1,他引:49  
决策树算法是DM的一个活跃的研究领域,首先给出了DM中决策树算法的基本思想,然后讨论了决策树算法中的难点问题,提出了利用熵与加权和的思想来选择取值的算法。  相似文献   

17.
Webshell是一种基于Web服务的后门程序.攻击者通过Webshell获得Web服务的管理权限,从而达到对Web应用的渗透和控制.由于Webshell和普通Web页面特征几乎一致,所以可逃避传统防火墙和杀毒软件的检测.而且随着各种用于反检测特征混淆隐藏技术应用到Webshell上,使得传统基于特征码匹配的检测方式很难及时检测出新的变种.本文将讨论Webshell的特点和机理,分析其混淆隐藏技术,发掘其重要特征,提出并实现了一种基于决策树的检测模型.该模型是一种监督的机器学习系统,对先验网页样本进行学习,可有效检测出变异Webshell,弥补了传统基于特征匹配检测方法的不足,而结合集体学习方法Boosting,可以增强该模型的稳定性,提高分类准确率.  相似文献   

18.
基于信息增益率的决策树对入侵检测的改进   总被引:2,自引:0,他引:2  
唐谦  张大方  黄昆 《计算机工程》2006,32(7):146-148
用构造决策树的方法来对入侵规则进行分类组织,将并行处理的机制引入到数据包与入侵规则集的匹配检测过程中。该文对于构造入侵规则决策树的过程,采用信息增益率为新的分类属性选择标准,并用它替代了原有的信息增益标准。实验证明,对于某些特定的攻击类型,在产生相同告警数量的前提下,采用信息增益率的检测引擎比采用信息增益的检测引擎,在检测速度上有明显的提高,有力地提高了基于特征的入侵检测性能,可及时地发现入侵行为。  相似文献   

19.
利用决策树进行数据挖掘中的信息熵计算   总被引:19,自引:1,他引:19  
张维东  张凯  董青  孙维华 《计算机工程》2001,27(3):71-72,89
介绍了怎样通过信息量和熵的比较来构造一个决策树的数据挖掘算法,并且就一些特殊的地方进行了讨论分析,例如怎样处理高分枝属性,数值属性和缺失数据以及怎样剪枝,利用模型系统的一些源代码来具体地实现算法中的一些模块,并且描述了国内外的有关数据挖掘的研究情况。  相似文献   

20.
决策树是一种采用分治策略的聚类分析方法,构建决策树的关键是选择合适的属性。传统的决策树通常从最大化信息熵的角度来构造,不能对属性的分类能力进行足够好的区分。对传统的决策树生成算法的不足,本文提出了一种基于马氏距离的决策树生成算法。算法使用马氏距离来区分不同特征属性子集的分类能力。试验结果表明,基于度量的决策树的性能优于传统的决策树。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号