共查询到17条相似文献,搜索用时 187 毫秒
1.
数据挖掘在2型糖尿病数据处理中的应用 总被引:5,自引:0,他引:5
基于大量实测数据探索2型糖尿病的发病规律,寻求其有效的数据处理方法。将数据挖掘技术引入到2型糖尿病数据处理中得出决策分类树,再同医学认识相对照。利用11400条实测数据,采用C4.5算法得出分类树,经实验患病人群的正确识别率为80.90%,未患病人群的正确识别率为92.05%。给出的决策分类树同目前医学上认识的高危因素趋于一致,同时给出了血糖值等于5.85的临界性数值。数据挖掘方法的引入为2型糖尿病数据处理提供了一种新的方法,为其预警、干预和有效控制提供了一种新的解决方案。 相似文献
2.
3.
4.
基于决策树C4.5改进算法的交通数据挖掘 总被引:1,自引:0,他引:1
针对交通拥堵等问题,给出了交通数据挖掘模型.在已有的理论之上,对决策树C4.5算法进行了分析,提出了由简化信息熵构造决策树的改进算法.并将其应用到交通数据的挖掘中,结果证明了该改进算法能够正确将交通数据分类,并得到若干有价值的结论,供决策分析. 相似文献
5.
稳定客户和吸引客户是移动通信企业提高竞争力的关键.基于大量实验数据将数据挖掘的决策树方法引入移动通信行业客户流失分析中,通过对数据的预处理,利用C4.5算法创建决策树,通过测试流失的与未流失的客户,平均正确识别率为91.6%.决策树体现的规则与经验基本一致,为移动通信企业建立客户流失的预警机制提供了决策支持. 相似文献
6.
张晓 《电脑编程技巧与维护》2011,1(16):110-111,124
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法,它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤。将C4.5算法应用于高校财务预警系统的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在高校财务预警调查数据分析中具有广泛的应用前景。 相似文献
7.
对于高校就业管理信息系统中积累的大量数据,运用数据挖掘算法中的决策村方法挖掘出潜在的有用的信息,为高校开展就业工作提供决策支持.根据就业数据的特点,采用C4.5决策树算法,对就业数据进行预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别.挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析. 相似文献
8.
首先采用数据清理、数据变换、数据规约等预处理技术处理原始数据,并借助weka平台,通过C4.5算法生成决策树;然后针对决策树对正确率判断不够理想的地方,调整比例因子变量再进行测试提高判断的正确率。由两种方法的比较,以及与医学认识相对照,可以得出,文中所得决策分类树的构成特点同目前已知的高危因素趋于一致。通过C4.5算法建立判定决策树,降低了冠状动脉造影(CAG)的危险,为冠心病的分析预测提出了一种新的方法。 相似文献
9.
交通流量数据的分类规则挖掘 总被引:2,自引:0,他引:2
巩帅 《计算机工程与应用》2006,42(6):219-220,232
概述了数据挖掘的分类算法,并简要介绍了C5.0决策树算法。以北京市“三横两纵”主干道交通流量数据为例,采用C5.0决策树算法提取交通流量的分类规则,用于分析交通流量规律、信息模式和数据趋势,并对分类树进行量化,为交通信号设计、路网规划、道路设计、路网节点设计等提供决策支持。 相似文献
10.
近年来,由大学生心理疾病引发的各种社会问题频发,把数据挖掘技术引入大学生心理健康状况的诊断研究具有其他技术不可比拟的优势,它能挖掘事物中隐含的规律。对决策树C4.5算法的原理进行阐述,并通过C4.5建立一个心理健康评估模型,构造决策树,由提取规则对心理健康进行预测。实验结果表明,该算法能将学生心理健康进行正确分类。挖掘结果能指导心理健康教育工作者制定正确的辅导计划,对辅助决策有很好的帮助。 相似文献
11.
阐明决策树分类器在用于分类的数据挖掘技术中依然重要,论述基于决策树归纳分类的ID3、C4.5算法,并且对决策属性的选取法则进行说明。通过实例解析ID3、C4.5算法实现过程,结果表明C4.5算法相比较于ID3算法的优越性.尤其在处理具有多属性值的数据时的更加合理和正确。 相似文献
12.
ID3算法和C4.5算法是经典的决策树算法,通过对ID3算法和C4.5算法的数据结构、算法描述和分裂属性选取等方面进行比较,为其他研究者提供参考. 相似文献
13.
14.
决策树分类算法C4.5中连续属性过程处理的改进 总被引:1,自引:1,他引:0
决策树分类算法C4.5是数据挖掘中最常用、最经典的分类算法。但是C4.5算法也存在一些不足之处,针对C4.5算法处理连续属性比较耗时的特点,本文对连续的处理过程进行改进,以提高算法的计算效率。改进的C4.5算法与原C4.5算法相比,在构造决策树时具有相同的准确率和更高的计算速度。 相似文献
15.
马冲 《计算机与数字工程》2009,37(5):17-21
决策树是归纳学习和数据挖掘的重要方法,主要用于分类和预测。文章引入了广义决策树的概念,实现了分类规则集和决策树结构的统一。同时,提出一种新颖的基于DNA编码遗传算法构造决策树的方法。先用C4.5算法对数据集进行分类得到初始规则集,再通过文章中算法优化规则集并由此构建决策树。实验证明了该方法有效地避免了传统决策树构建过程的缺点,且有较好的并行性。 相似文献
16.
17.
Decision trees have been widely used in data mining and machine learning as a comprehensible knowledge representation. While ant colony optimization (ACO) algorithms have been successfully applied to extract classification rules, decision tree induction with ACO algorithms remains an almost unexplored research area. In this paper we propose a novel ACO algorithm to induce decision trees, combining commonly used strategies from both traditional decision tree induction algorithms and ACO. The proposed algorithm is compared against three decision tree induction algorithms, namely C4.5, CART and cACDT, in 22 publicly available data sets. The results show that the predictive accuracy of the proposed algorithm is statistically significantly higher than the accuracy of both C4.5 and CART, which are well-known conventional algorithms for decision tree induction, and the accuracy of the ACO-based cACDT decision tree algorithm. 相似文献