首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
针对在C4.5决策树构造过程中,测试属性选择未考虑属性之间影响的缺点,提出了一种改进的C4.5决策算法.该算法使用一个属性与其他属性的平均信息熵表示这个属性与其他属性的冗余度,然后在选择测试属性的过程中,加入测试属性与其他属性的冗余度,通过信息增益、分裂熵和冗余度三个因素的评价,选择信息增益率高而与其他属性冗余度低的测试属性.实验结果表明,在选定的实验数据集上,改进后的C4.5决策树算法平均分类正确率提高.  相似文献   

2.
Iterative Dichotomiser version3(ID3)算法是数据挖掘中经典的决策树分类算法,其核心是分裂训练集属性的选择标准,即分裂前后的信息增益量最大,用该标准选择属性时对于取值较多的属性具有较强依赖性。剖析了ID3算法存在的不足并加以改进,引入了属性关注度,提出了改进算法AAID3算法。实验表明改进算法对原ID3算法的取值偏向问题有所克服并使分类更加准确,决策树更加简明。  相似文献   

3.
基于决策树数据挖掘的分析与应用   总被引:1,自引:1,他引:0  
决策树技术是一种对海量数据集进行分类的非常有效方法。通过构造决策树模型,提取有价值的分类规则,帮助决策者做出准确的预测已经应用在很多领域。基于这种技术构造的蘑菇可食用性决策树模型,提供了通过蘑菇属性判别蘑菇可食用性的科学依据。决策树算法采用C4.5算法,它把信息增益率作为属性选择的度量标准。从实验结果来看,决策树模型虽然显示了一个很不平衡的结构,但得出了很容易理解的决策规则。  相似文献   

4.
利用数据挖掘技术对当前毕业生的就业数据进行分析,发现影响就业的主要因素.其中使用C4.5算法计算了学业成绩、社团实践、获奖情况等分裂属性的增益率,以此构造决策树并对其归纳总结出一些就业规则.  相似文献   

5.
针对以信息增益为划分标准的ID3算法中存在偏向属性取值多的属性等问题,提出了一种融合GINI指数的ID3改进算法。计算每个属性的信息增益和对应的GINI指数值,并计算所有属性的GINI指数算术平均值,筛选GINI指数低于算术平均值的属性记为候选属性集;从候选属性集中选择信息增益最大的属性建立分支,用递归方法构建决策树。实验使用6组UCI数据集进行验证。结果表明:该决策树的准确率均有所提高,对多值偏向问题有很好的克服作用。  相似文献   

6.
一种基于互信息增益率的新属性约简算法   总被引:13,自引:1,他引:13  
为了获得决策系统中更好的相对属性约简,提出了一种基于互信息增益率的属性约简算法.该算法考虑了所选择条件属性与决策属性的互信息,还考虑了所选择属性的值的分布情况,从信息论角度定义了基于互信息增益率的属性重要性度量方法,并以此度量为启发式信息,算法从空集开始逐步将最重要的条件属性加入到选择属性集,直到所选择的条件属性集与决策属性集的互信息等于整个条件属性集与决策属性集的互信息时,算法停止.结果表明,算法能更有效地对决策系统进行约简,同时约简后的对象数目较少.  相似文献   

7.
ID3决策树算法是构造决策树的重要算法之一,然而实验表明该算法在选择分裂属性时存在着多值偏向问题。以往的大多数学者都是基于实验分析多值偏向问题。该文针对这个问题,基于粗糙集理论及凹函数性质,引入函数重要度概念,从理论上分析多值偏向问题,并分析了属性多值对属性的重要度的影响。最后实验验证该理论分析方法的正确性与可行性。  相似文献   

8.
在构造决策树的过程中,分离属性选择的标准直接影响分类的效果.基于变精度粗糙集的理论将属性重要度作为选择分离属性的标准.经实验证明,使用该方法构造的决策树与经典ID3决策树算法相比,具有复杂性低,能有效提高分类效果的优点.  相似文献   

9.
针对ID3算法用信息增益作为在各级非叶节点上选择属性的标准的局限性,结合统计学独立检验思想,给出一种新的属性依赖性和重要性定义,以新的属性重要性为启发式信息设计决策树规则提取算法。实例分析的结果表明,该算法能提取更为简洁有效的决策规则。  相似文献   

10.
针对现有方法对与正常消息相似度较高的畸形SIP消息检测效果不佳的问题,提出了一种基于c4.5决策树的IMS网络畸形SIP消息检测方法。该方法首先利用n—gram技术将SIP消息映射至高维空间,利用样本属性的信息增益进行特征提取;然后基于C4.5决策树算法,根据特征属性的信息增益率构建决策树并对畸形SiP消息进行检测;最后定义了畸形SIP消息构造函数并构建相应样本数据集,对该方法进行了仿真验证。仿真结果表明,该方法对与正常消息相似度较高的畸形SIP消息具有94.8%的检测率。  相似文献   

11.
对解码转发协作式MIMO系统中的功率分配问题进行了研究.分析了系统误比特率和能量增益特性,在此基础上提出了一种基于黄金分割迭代的功率优化分配算法和2种简化的分配算法,在满足一定误比特率要求的条件下,使源节点和中继节点总的发射功率最小.考虑准静态平坦衰落信道,根据瞬时信道状态信息进行功率分配.理论分析与仿真结果表明,基于黄金分割迭代的功率优化分配算法可以以较少的迭代次数得到较高精度的最优解,而2种简化功率分配算法均可以获得与基于黄金分割迭代的功率分配算法相近的系统能量增益,并且计算的复杂度大大降低.  相似文献   

12.
基于决策树的ID3算法与C4.5算法   总被引:1,自引:0,他引:1  
论述了在数据挖掘中基于决策树的ID3算法以及C4.5算法,说明了两种算法的优缺点.通过实例解析了ID3算法和C4.5算法的实现过程,能够直观看出C4.5算法相比较与ID3算法的优越性.  相似文献   

13.
提出了一种基于平均信道增益矩阵的分布式天线无线通信系统下行功率控制算法.该算法根据接收端通过理想信道估计获得的信道状态信息(CSI),对各中心基站经光纤传送的发射功率在其所属各天线单元处进行加权分配,在保证整个覆盖区域内的所有移动台达到平衡的信干比的前提下使各个中心基站的发射功率达到最小.仿真结果表明,与现有的分布式天...  相似文献   

14.
根据就业数据的特点,采用C4.5决策树算法对就业数据进行预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别.挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析.  相似文献   

15.
针对多目标跟踪系统中信息增量最大化只是传感器资源分配的必要条件而非充分条件,提出了一种新的目标权重和信息增量相结合的传感器分配方法,探讨了目标的距离和速度这两个特征参量影响目标权重的量化方法。仿真结果表明,该方法能够更有效地实现传感器资源对多目标的分配。  相似文献   

16.
针对基因表达谱数据的特点,提出了一种基于样本加权的基因特征选取模型。首先提出一种样本权重的计算方法;其次结合样本权重改进信息增益度量标准,并用其衡量基因信息量的大小,同时将基因之间信息量的重复性视为基因噪声干扰,建立未消噪和消噪的基因特征选取模型;最后结合支持向量机、逻辑回归、神经网络和决策树4种分类器,将所提模型与常见的基因选取模型进行比较分析。实验结果表明,所提选取模型在不影响分类性能的前提下,具有较好的稳定性。  相似文献   

17.
决策树是数据挖掘技术中的重要方法,主要用于分类和预测.本文介绍了决策树算法中应用最广泛的ID3算法和C4.5算法,阐述了两种算法的主要思想,说明了构造决策树的基本步骤,对两种算法进行了分析和比较.  相似文献   

18.
数据仓库中的数据必须进行预处理后才能达到数据挖掘的要求.将数据预处理集成于数据仓库的构建过程中,提出一种基于数据仓库的数据预处理过程模型.讨论了数据预处理的各种算法并通过实例说明利用信息增益进行数据预处理的过程.  相似文献   

19.
传统无线通信传输和网络接入依赖射频通信技术.随着海量移动设备涌入,频谱资源匮乏、移动设备电能受限等问题对新一代物联网的可持续发展提出了严峻挑战.本文通过融合传统无线射频通信技术与新型可见光通信技术,构建一种基于可见光信息能量同传(simultaneous lightwave information and power ...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号