共查询到16条相似文献,搜索用时 639 毫秒
1.
杜丽英 《吉林建筑工程学院学报》2014,(5):48-50
决策树是数据挖掘技术中的重要方法,主要用于分类和预测.本文介绍了决策树算法中应用最广泛的ID3算法和C4.5算法,阐述了两种算法的主要思想,说明了构造决策树的基本步骤,对两种算法进行了分析和比较. 相似文献
2.
3.
决策树构造过程中的属性选择标准一直是数据挖掘领域的研究热点。本研究在分析ID3算法和C4.5算法属性选择策略的基础上,基于通信系统中的平均自信息与平均互信息提出了两种决策树的构造算法。研究过程中从理论证明了所提出的两种算法与ID3算法以及C4.5算法是等价的,即,信息增益等价于通信系统中的平均互信息,而信息增益率等价于通信系统中平均互信息与平均自信息的比值。在AllElectronics数据集进行的实验表明:与信息增益和信息增益率相比,本研究提出的属性选择标准具有计算方便、且容易理解的特点。 相似文献
4.
基于ID3算法的考试成绩分析决策树的构造 总被引:1,自引:0,他引:1
决策树是数据挖掘任务中分类的常用算法,ID3算法是决策树学习的核心算法.论述了ID3算法的基本思想和实现方法,分析了节点选择的方法,并根据ID3算法构造了考试成绩分析决策树,同时针对算法的缺点提出了改进意见. 相似文献
5.
基于面向对象方法的ID3算法的设计与实现 总被引:1,自引:1,他引:0
ID3算法是最基本的决策树学习算法,有很广的应用。现从面向对象方法出发,运用C 的标准模板库和通用工具,讨论了基于ID3算法的通用学习系统,并进行了面向对象分析、设计和实现。 相似文献
6.
7.
8.
当前,远程教学系统缺少智能性,不能提供个性化教学,引入ID3算法后可以根据学习者的特征对其分类,从而实现对不同学习者的针对性教学.然而传统的决策树ID3算法存在多值倾向的问题,选择分裂属性不符合客观事实.运用一种基于灰色关联分析的修正因子属性选择方法予以改进,对取值较多但灰色关联度低的属性,在计算其信息增益时通过灰色关联度的正弦值作为修正因子,克服传统ID3算法的不足.将改进的ID3算法引入到远程教学系统中,可以更好地对学习者进行分类以实现智能化导学. 相似文献
9.
CET-4是一个客观、准确的大学生英语能力测量平台,C4.5算法在应用于CET-4成绩分析中仍存在一些问题。针对运用C4.5算法对高职院校CET-4成绩数据构建分析决策树时存在的离散化运算繁琐、忽视各属性影响度等典型问题,提出一种面向高职院校CET-4成绩分析的改进C4.5算法。首先通过在C4.5算法中引入成绩正态分布规律确立初始聚类中心、K-means算法来离散连续属性;其次引入CET-4中听、读、写的权重来修正信息增益率的计算;最后运用改进的C4.5算法、经典的C4.5算法分别构建决策树模型并进行预测分析。实验结果表明,改进的C4.5算法所构建高职院校CET-4成绩分析的模型效率、预测能力均有明显提高。运用改进的C4.5算法有效地分析出影响CET-4达标各因素间的关系,从而提升CET-4反拨英语教学效应。 相似文献
10.
数据挖掘中分类算法分析与量化研究 总被引:2,自引:0,他引:2
采用交叉验证方法对C4.5、Bayesian置信网络、序贯最小优化(SMO)3种主流数据挖掘分类算法进行了实验分析,分别得出了在相同训练、测试样本数据下3种算法建立模型所需时间、分类准确性、覆盖率及margin曲线。分析了训练样本数量对3种算法的不同影响,为使用者在不同的样本质量下选择相应的分类算法提供理论和实验依据。 相似文献
11.
基于决策树的就业数据挖掘 总被引:12,自引:0,他引:12
针对学生就业问题,给出了就业数据挖掘模型.决策树方法是数据挖掘中非常有效的分类方法,根据就业数据特点,采用了C4.5决策树算法.C4.5算法是决策树核心算法ID3的改进算法,它构造简单,速度较快,容易实现.模型对就业数据预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别,挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析。 相似文献
12.
于淑香 《沙洲职业工学院学报》2011,14(2):27-30
介绍了数据挖掘原理及决策树分类方法,对ID3算法的基本思想和具体实现方法进行阐述,并在根据天气决定是否打网球的应用中运用该算法,最终构造出决策树模型。 相似文献
13.
为充分挖掘隐藏于遥测数据中的规则知识,发现数据间的关联性,采用ID3算法对卫星太阳帆板遥测数据进行挖掘分析,计算各类参数的信息增益值,以最大增益值为分裂属性构建出相关性决策树,得到决策知识,发现影响太阳帆板状态变化的参数间的关联性,为卫星在轨性能分析和故障诊断提供依据.分析结果表明,采用ID3算法对遥测数据进行分析可以获得预期的结果. 相似文献
14.
从国际电气和电子工程师协会学习技术标准委员会(IEEE LTCS)制定提出的IEEE 1484.2PAPI学习者模型入手,分析了影响个性化学习的一些个性化参数,并在此基础上提出了改进的ID3算法在学习者个性挖掘中的应用关键技术。 相似文献
15.
C4.5作为一种重要的决策树算法尚存一些不足之处。针对C4.5对于连续属性最优分割阈值选择比较耗时的缺点,基于Fayyad边界点判定定理,提出一种改进最优阈值选择方法。针对C4.5不具备增量式学习能力的缺点,在改造树结构体的基础上,提出C4.5增量学习的改进方法。 相似文献
16.
提出了一种基于DCT理论的空域数字水印算法-DAS算法,该算法继承了频域算法与空域算法的优点,同时又避免了频域算法与空域算法中的一些缺陷,经实验验证,取得了较好的效果. 相似文献