首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
房立  黄泽宇 《微机发展》2006,16(8):106-109
构建决策树分类器关键是选择分裂属性。通过分析信息增益和增益比率、Gini索引、基于Goodman-Kruskal关联索引这三种选择分裂属性的标准,提出了一种改进经典决策树分类器C4.5算法的方法(竞争选择分裂属性的决策树分类模型),它综合三种选择分裂属性的标准,通过竞争机制选择最佳分裂属性。实验结果表明它在大多数情况下,使得不牺牲分类精确度而获得更小的决策树成为了可能。  相似文献   

2.
在介绍了现有数值型属性分裂方法的基础上,引出了纯区间的概念,提出了一种基于纯区间归约的数值型属性分裂方法。该方法将属性值域用等宽直方图的方法划分为多个区间,对纯区间和非纯区间分别处理。理论分析和实验结果表明该方法在保证了分裂精度的同时,减小了搜索空间。  相似文献   

3.
决策树是数据挖掘技术中一种常用的分类方法,易于理解,应用范围广泛。随着对决策树算法的持续深入地研究,以及对应用中发现的问题加以解决和不断改进,提高了决策树的分类速度、精度和实用性,并形成了多种独特的算法。该文以某商业银行信用卡消费为例对决策树及常用算法进行了详细解析,以期在今后使用或改进算法时能提供有益的帮助。  相似文献   

4.
决策树是数据挖掘技术中一种常用的分类方法,易于理解,应用范围广泛。随着对决策树算法的持续深入地研究,以及对应用中发现的问题加以解决和不断改进,提高了决策树的分类速度、精度和实用性,并形成了多种独特的算法。该文以某商业银行信用卡消费为例对决策树及常用算法进行了详细解析,以期在今后使用或改进算法时能提供有益的帮助。  相似文献   

5.
基于遗传算法的多属性模糊决策树的优化   总被引:1,自引:0,他引:1       下载免费PDF全文
决策树是数据挖掘中的一种高效方法,但是当训练数据的属性很多时,构建的决策树的规模会随属性个数增加而指数级增长,进而会产生海量的规则。针对该问题,提出了一种基于遗传算法的优化方法。首先根据信息增益利用轮盘赌方法选取若干组属性,构建多棵决策树,然后利用遗传算法对多棵决策树进行组合,并最终形成规则集。最后给出了实验结果,证明了该方法的可行性和有效性。  相似文献   

6.
刘星毅 《微机发展》2008,18(5):70-72
分类问题是数据挖掘和机器学习中的一个核心问题。为了得到最大程度的分类准确率,决策树分类过程中,非常关键的是结点分裂属性的选择。常见的分裂结点属性选择方法可以分为信息熵方法、GINI系数方法等。分析了目前常见的选择分裂属性方法——基于信息熵方法的优、缺点,提出了基于卡方检验的决策树分裂属性的选择方法,用真实例子和设置模拟实验说明了文中算法的优越性。实验结果显示文中算法在分类错误率方面好于以信息熵为基础的方法。  相似文献   

7.
养殖业目前是农村收入主力增长点,本文主要通过对养殖业中的一种-生猪收益因素进行分析,采用决策树中经典算法,ID3算法生成决策树,对下一年养殖收益的情况进行预测,给予指导,并提供有效的建议.  相似文献   

8.
决策树的属性选取策略综述   总被引:2,自引:0,他引:2  
决策树的属性选取标准在决策树算法中处于核心地位,针对数据集的不同特征人们提出了多种不同属性选取标准。该文首先回顾了几种常用的决策树属性选取标准,并把它们概括为属性间相互独立的选取策略和属性间相互关联的选取策略然后介绍了各个属性选取标准的多值偏向问题。  相似文献   

9.
针对C4.5决策树算法在构造决策树时只考虑属性对类的影响,忽视了属性间相互影响的问题。提出一种改进的决策树算法DTEAT(Decision Tree with Elimination of Attribute Dependency),该算法通过计算属性间的信息增益率来量化属性间相互影响的程度(依赖度)。在构造决策树的过程中,计算待分裂属性与其他每个属性的依赖度,将其均值作为选择分裂属性时的主要度量标准之一,从而消除属性间的依赖。实验结果表明,改进后的算法在UCI的样本数据集上的分类准确率有了显著的提升,最高提升了7个百分点。  相似文献   

10.
一种改进的决策树分类属性选择方法   总被引:2,自引:0,他引:2       下载免费PDF全文
分析了ID3算法的基本原理、实现步骤及现有两种改进分类算法的优缺点,针对ID3算法的取值偏向问题和现有两种改进算法在分类时间、分类精确度方面存在的不足,提出了一种新的分类属性选择方案,并利用数学知识对其进行了优化。经实验证明,优化后的方案克服了ID3算法的取值偏向问题,同时在分类时间及分类精确度方面优于ID3算法及现有两种改进的分类算法。  相似文献   

11.
We present an alternative model of human cognitive development on the balance scale task. Study of this task has inspired a wide range of human and computational work. The task requires that children predict the outcome of placing a discrete number of weights at various distances on either side of a fulcrum. Our model, which features the symbolic learning algorithm C4.5 as a transition mechanism, exhibits regularities found in the human data including orderly stage progression, U-shaped development, and the torque difference effect. Unlike previous successful models of the task, the current model uses a single free parameter, is not restricted in the size of the balance scale that it can accommodate, and does not require the assumption of a highly structured output representation or a training environment biased towards weight or distance information. The model makes a number of predictions differing from those of previous computational efforts.  相似文献   

12.
We present an alternative model of human cognitive development on the balance scale task. Study of this task has inspired a wide range of human and computational work. The task requires that children predict the outcome of placing a discrete number of weights at various distances on either side of a fulcrum. Our model, which features the symbolic learning algorithm C4.5 as a transition mechanism, exhibits regularities found in the human data including orderly stage progression. U-shaped development, and the torque difference effect. Unlike previous successful models of the task, the current model uses a single free parameter, is not restricted in the size of the balance scale that it can accommodate, and does not require the assumption of a highly structured output representation or a training environment biased towards weight or distance information. The model makes a number of predictions differing from those of previous computational efforts.  相似文献   

13.
14.
视频语义分类中常遇到多峰正态分布属性,如采用单峰值正态分布设计的贝叶斯分类模型会造成较大分类误差。本文采用定步长组合划分算(FLCPA)对多峰分布属性值域按类进行划分,以留一校验法(LOOCV)估算分类错误,找出给定步长下属性的多峰分布边界点,并用监督参数估计推断出每个分段区间上的概率分布函数,从而得到整个值域上的总体分布。此外,文中给出了涉及多峰分布属性的视频语义分类器设计步骤。实验数据表明,该方法能明显降低分类错误,有效提高分类性能。  相似文献   

15.
一种基于模糊感知器的模糊神经分类器   总被引:2,自引:0,他引:2       下载免费PDF全文
隶属函数应能客观反映模式的不确定性分布情况, 模糊神经分类器中为每个输入特征划分相同数量的模糊变量显然是不合理的. 针对这一问题, 根据模糊积分的思想, 本文通过分析隶属函数的变化曲线来确定模糊密度, 以此为依据为输入特征划分合适的模糊变量, 并以Iris数据集为例验证了该方法的有效性.  相似文献   

16.
隶属函数应能客观反映模式的不确定性分布情况,模糊神经分类器中为每个输入特征划分相同数量的模糊变量显然是不合理的.针对这一问题,根据模糊积分的思想,本文通过分析隶属函数的变化曲线来确定模糊密度,以此为依据为输入特征划分合适的模糊变量,并以Iris数据集为例验证了该方法的有效性.  相似文献   

17.
个人信用体系是社会信用体系的基础,而高校学生个人信用评价体系是社会信用体系下个人信用建设的重要组成部分以大学生群体为试点,选取与评价对象密切关系的13个指标建立大学生信用评价指标体系,并利用贝叶斯网络分类器的原理建立高校学生个人信用评价模型.模型结合关联分析的方法来寻找属性变量间的依赖关系,提出了模块化属性结点的思路,能同时实现用户信用分类和用户群体细分的功能.数据实验结果表明,模型有较好的信用评价分类效果.  相似文献   

18.
基于径向基概率神经网络的人脸识别方法   总被引:3,自引:0,他引:3       下载免费PDF全文
本文提出了一种基于径向基概率神经网络的人脸图像识别方法。与传统方法相比,该方法在训练效率和识别率上取得了较大的提高。  相似文献   

19.
A Further Comparison of Splitting Rules for Decision-Tree Induction   总被引:10,自引:0,他引:10  
One approach to learning classification rules from examples is to build decision trees. A review and comparison paper by Mingers (Mingers, 1989) looked at the first stage of tree building, which uses a splitting rule to grow trees with a greedy recursive partitioning algorithm. That paper considered a number of different measures and experimentally examined their behavior on four domains. The main conclusion was that a random splitting rule does not significantly decrease classificational accuracy. This note suggests an alternative experimental method and presents additional results on further domains. Our results indicate that random splitting leads to increased error. These results are at variance with those presented by Mingers.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号