首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
基于大量实测数据,将数据挖掘C4.5算法引入2型糖尿病的数据处理之中,建立了多条有效规则,通过测试其患病与未患病的平均正确识别率达97%。重要的是建立的这些规则同医学上的认识基本一致,可以说这些规则的建立为解释糖尿病发病因素之间的相互关系以及影响程度提供了一种新的方法,为建立2型糖尿病的预警和干预控制的研究提供了基础。  相似文献   

2.
数据挖掘在2型糖尿病数据处理中的应用   总被引:5,自引:0,他引:5  
基于大量实测数据探索2型糖尿病的发病规律,寻求其有效的数据处理方法。将数据挖掘技术引入到2型糖尿病数据处理中得出决策分类树,再同医学认识相对照。利用11400条实测数据,采用C4.5算法得出分类树,经实验患病人群的正确识别率为80.90%,未患病人群的正确识别率为92.05%。给出的决策分类树同目前医学上认识的高危因素趋于一致,同时给出了血糖值等于5.85的临界性数值。数据挖掘方法的引入为2型糖尿病数据处理提供了一种新的方法,为其预警、干预和有效控制提供了一种新的解决方案。  相似文献   

3.
知识发现在2型糖尿病数据处理中的应用研究   总被引:2,自引:0,他引:2  
目的:首次将知识发现理论引入到2型糖尿病发病相关因素数据处理中,从大量实测数据中识别出有效的、潜在的、有用的、可理解的发病规律。方法:根据2型糖尿病数据的特点,选用数据挖掘C4.5算法对17072条有效的整群抽样横断面健康调查数据进行决策树分类。结果:通过训练模型给出糖尿病患病与否的决策分类树,该决策树可以直观地给出发病相关因素的不同层次的相对影响,经实验测试结果对于未患病的正确识别率为92.05%,对于患病的正确识别率为80.90%,同时得出了血糖值为5.85的分类临界值。结论:决策分类树结果同目前认识的高危因素趋于一致,说明数据挖掘C4.5算法适用于2型糖尿病的发病相关因素数据分析处理,是2型糖尿病数据处理的一种新方法,其在疾病的宏观控制中有着广阔的应用前景。  相似文献   

4.
C4.5算法在冠状造影数据处理中的应用   总被引:1,自引:0,他引:1  
首先采用数据清理、数据变换、数据规约等预处理技术处理原始数据,并借助weka平台,通过C4.5算法生成决策树;然后针对决策树对正确率判断不够理想的地方,调整比例因子变量再进行测试提高判断的正确率。由两种方法的比较,以及与医学认识相对照,可以得出,文中所得决策分类树的构成特点同目前已知的高危因素趋于一致。通过C4.5算法建立判定决策树,降低了冠状动脉造影(CAG)的危险,为冠心病的分析预测提出了一种新的方法。  相似文献   

5.
决策树是归纳学习和数据挖掘的重要方法,该文对c4.5算法、决策树的构建和剪枝进行了介绍,然后将C4.5算法应用于信息检索结果分类中,实现了检索结果的分层分类处理。  相似文献   

6.
将C4.5决策树分类算法用于高职就业预测,并提取挖掘规则。对学生基本信息、各科考试成绩,以及就业信息进行处理,选取决策属性,构造决策树,由提取的规则,获得就业和学生成绩之间的关系,挖掘结果显示,该算法能将学习成绩属性和是否是学生干部属性进行正确分类,做出一定的就业预测,对辅助决策具有一定的帮助。  相似文献   

7.
大数据时代已经到来,对数据的处理越来越受到关注,人们迫切需要海量数据背后的重要信息和知识,发现数据中潜在的联系并且发现可以有效运用的方式,取得对获取知识有用的信息,然后根据当前的信息对今后的发展趋势进行预测。目前最常用的评价方式就是运用C4.5算法,将日常的数据有效汇总,然后对客户的相关数据分析比对,根据客户之间不同的特征进行不同的改善方式,达到了提升满意度的效果。  相似文献   

8.
决策树C4.5算法在数据挖掘中的分析及其应用   总被引:5,自引:0,他引:5  
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。分类器是数据挖掘的一种基本方法。本文对分类器的基本概念、C4.5算法、决策树的构建和剪枝进行了介绍,然后将C4.5算法应用于篮球比赛的技术统计分析中,通过对这些数据分析从而得到一些较实用的预测胜负规则。  相似文献   

9.
根据高血压病电子病历、实验室检查报告和医师处方数据,将C4.5决策树算法用于高血压分类规则的提取,挖掘出影响高血压病人血压值的重要因素.针对C4.5算法在属性选择方面的不足,引入相关度概念对算法做出改进,改进后的算法生成更合理和有效的分类规则,为高血压的分析预测提出了一种新的方法.  相似文献   

10.
稳定客户和吸引客户是移动通信企业提高竞争力的关键.基于大量实验数据将数据挖掘的决策树方法引入移动通信行业客户流失分析中,通过对数据的预处理,利用C4.5算法创建决策树,通过测试流失的与未流失的客户,平均正确识别率为91.6%.决策树体现的规则与经验基本一致,为移动通信企业建立客户流失的预警机制提供了决策支持.  相似文献   

11.
李一平  姚宏亮 《微型电脑应用》2011,27(6):51-53,57,3
对如何将数据挖掘技术应用于成绩分析的问题进行了研究。通过调查淮北职业技术学院08级学生学习《数据结构》的学习情况,与现有的成绩分析方法完全不同的角度,通过采用数据挖掘中的C4.5算法,建立了学生成绩分析决策树模型,并提取了分类规则,可以对今后的教学工作发挥积极的指导作用,实验结果及分析表明了该方法的有效性。  相似文献   

12.
阐明决策树分类器在用于分类的数据挖掘技术中依然重要,论述基于决策树归纳分类的ID3、C4.5算法,并且对决策属性的选取法则进行说明。通过实例解析ID3、C4.5算法实现过程,结果表明C4.5算法相比较于ID3算法的优越性.尤其在处理具有多属性值的数据时的更加合理和正确。  相似文献   

13.
基于C4.5挖掘算法的纳税评估模型设计   总被引:1,自引:0,他引:1  
倪涛  刘耀 《现代计算机》2007,(9):83-86,102
介绍应用C4.5挖掘算法进行行业理论税负测算的理论依据,为了提高算法的计算效率,结合税收领域知识对挖掘算法进行了改进,利用改进后的算法实现了行业理论税负的测算.  相似文献   

14.
列车轨道故障检测的实现需要对大量的数据进行分析来判定检测结果,决策树是进行数据挖掘与分类分析的常用工具。文中主要讨论如何应用C4.5算法构造列车轨道故障检测的决策树以及根据生成的决策树实现轨道故障的判决。  相似文献   

15.
C4.5算法在在线学习行为评估系统中的应用   总被引:7,自引:0,他引:7  
基于数据挖掘技术构建了在线学习行为评估系统。利用C4.5算法挖掘学生在线学习行为与学习效果的历史数据,建立“学习行为——效果”模型。用此模型评估未来学生的在线学习状况,给出形成性评估的成绩。通过测试,评估结果较准确,教师和学生的认可度达90%以上。系统的应用为在远程教学环境下客观、公正、合理的评估学生在线学习提供了有效方法和手段。  相似文献   

16.
本文讨论了基于互信息的决策树分类算法——ID3算法及其改进算法C4.5。  相似文献   

17.
上报可疑交易报告是保险公司日常工作之一,目前对可疑交易的识别基本上是工作人员依照中国人民银行公布的《金融机构大额交易和可疑交易报告管理办法》对交易逐条进行识别。本文利用经典的决策树C4.5算法对交易进行分析,自动识别出部分可疑交易。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号