首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
决策树剪枝是将已生成的决策树进行简化的过程,包括预剪枝和后剪枝。为了提高后剪枝算法MEP的剪枝精度,防止因MEP影响因子选取不当造成决策树修剪过度而丢失特征信息的问题,提出一种改进的MEP算法即IMEP方法。首先引入k-折交叉验证(k-Fold Cross-Validation)方法用于选取最优的影响因子m,然后将m带入到MEP算法,再对原始决策树进行剪枝,可以得到最精确的决策树,并保持决策树的影响特征。其次,通过k次交叉验证,可以避免产生过拟合问题,和单独测试集方法相比,经过k次交叉验证后,已经减弱了随机性,防止出现"欠学习"问题。经过验证IMEP方法不仅提高了MEP的精度,能更精准简化决策树,并且保持决策树的影响特征。相比于PEP算法,在数据集较小时有更好的适用性,表现更加稳定。  相似文献   

2.
提出了一种利用多功能地磁传感器采集道路环境磁场数据,并基于决策树模型实现车型的在线分类方法。文中提取8种与车速无关的车辆波形时域特征作为模型输入,基于最优最小划分样本数的CART算法对决策树模型进行训练。对训练得到的决策树,基于最小误差剪枝原则进行剪枝,得到具有更高样本鲁棒性的最佳剪枝树。通过在北京市某道路上布设地磁传感器获取了两种车型数据,正、反向测试的平均准确率分别为88.9%和94.4%。与现有多个分类方法进行了对比实验,结果表明:本文方法能够进行在线车型分类,并在分类准确率、样本鲁棒性和算法执行时间等方面更具优势,能够应用于实际城市道路现场进行车型分类。  相似文献   

3.
C5.0算法是一种直观、效率高的分类方法,但该算法存在信息增益率计算复杂、容易出现过拟合和决策树偏倚的问题。针对这些问题,通过公式的转换简化信息增益率的计算过程,在剪枝过程采用了损失矩阵和置信区间的结合进行剪枝判断,以及对建立的多个模型的权重进行调整,提出了一种新的C5.0改进算法,并将其应用于信贷逾期预测上。使用借款人的历史还款数据进行实验,并与其他算法进行比较,结果表明:C5.0改进算法相比其他算法具有更高的准确率和效率。  相似文献   

4.
针对人脸表情识别特点,首先使用几何特征与基于灰度共生矩阵纹理特征的低维混合特征提取方法来提取易分类表情图片的特征向量,然后使用C4.5决策树分类器识别出脸部变化较为明显的表情,再使用SVM支持向量机对较难分类表情图片进行分类。实验结果表明,通过改变决策树算法剪枝中错误样本比率的方法可以获得最佳预测精度,识别率达到90%。  相似文献   

5.
为了降低特征挖掘结果的汉明损失和错误率,提出了一种基于决策树的供应商全链路动态特征挖掘算法.对数据实施数值化、离散化和归一化处理,通过降低数据值域的差异来降低汉明损失和错误率.利用处理后的数据建立决策树,通过剪枝操作提高了数据分类的精度,采用改进的CHI值和RBF神经网络有效挖掘全链路动态特征.该算法降低了挖掘结果的汉明损失和错误率,且分类处理精度、准确率、召回率均有所提高.该算法有效提高了供应商全链路动态特征的挖掘效果.  相似文献   

6.
关联性识别对于系统演化规律的确定意义重大,从测试数据累积、更新的视角,针对皮肤指标与中医体质之间的关联性进行探索,构建分类模型。提出基于建模数据动态修订决策树和模糊朴素贝叶斯融合算法的权重,建立具有较好分类及解释性的分类模型。其中决策树采用最佳后剪枝方式,避免过拟合弊端;朴素贝叶斯算法则通过定义指标归属区间的模糊隶属度来解决属性分类中存在的随机与模糊性。实证结果表明随着建模数据的变化,分类模型的融合权重动态调整,目前模型的准确率为86.7%,高于独立决策树、朴素贝叶斯的83.3%和80%,亦高于对照组小数据分类模型的76.7%。可见此动态分类模型可有效利用参与建模的数据信息识别出外在皮肤与内在体质之间的关联性,为皮肤-体质间的定量研究奠定了基础。目的:针对人体面部皮肤状态指标与中医体质类型之间的关联性进行科学、定量研究,从测试数据持续累积与知识发现深入推进的过程视角,尝试揭示人体内在中医体质与外观皮肤状态指标间的复杂动态演化规律。方法:本文综合小样本条件下决策树的良好归纳特性及大样本条件下贝叶斯算法分类准确率高的优势。提出基于建模数据量会不断增多的趋势,构建可自适应修订决策树和模糊朴素贝叶斯融合分类算法的权重,以适用于测试数据从小到大积累过程中分类模型均具有较好分类特性及可解释性的应用要求。其中决策树采用最佳后剪枝方式,避免了常规决策树存在的过拟合弊端;朴素贝叶斯算法则通过定义指标归属区间的模糊隶属度来解决皮肤属性测试与分类中存在的随机性与模糊性。结果:实证结果表明本文提出的分类模型的融合权重可动态调整且随着建模数据的增多分类精度会相应提高。目前对应151个建模数据的分类模型的分类准确率为86.7%,高于独立决策树、朴素贝叶斯的83.3%和80%,亦高于对照组80个建模数据对应分类准确率的76.7%。结论:可见此皮肤—体质动态分类模型通过有效利用参与建模的数据信息,能识别出人体面部外观皮肤状态指标与内在中医体质之间的复杂关联性,建立的分类模型具有较好的精度与可解释性,为基于数据驱动的中医理论的科学化、智能化发展进行了有益的探索。  相似文献   

7.
流式计算形态下的大数据分析一直是当前需要解决的问题,而且研究成果和实践经验较少。随机森林方法是目前应用较多的分类算法,但在流式计算应用场景中,数据所呈现出来的实时性、易失性、无序性等特征会使得算法准确度逐渐降低。针对这个问题,分析了随机森林的算法特点,提出了根据决策树的准确度进行随机森林剪枝的思路。同时为了适应数据的变化,结合准确度间隔的概念提出生成、验证并补充新决策树的方法,最终形成可以不断随数据更新的随机森林,满足流式大数据环境对算法的要求。使用实际数据对改进后方法的可行性进行了验证,证明新方法在真实流式大数据场景中有着更高的分类准确度,最后分析讨论了随机森林方法如何进一步研究改进的主题。  相似文献   

8.
针对大数据集中存在海量数据,当数据规模扩大到一定程度时,离散点检测处理效率受到限制的问题,提出了一种基于分类和回归树(CART)决策树的网络大数据集离群点动态检测算法。首先,划分大数据集异常数据标准,利用方差衡量数据离散程度,使用支持向量机建立异常数据样本关联规则矩阵,明确大数据集异常数据范围,并通过动态网格划分策略降低离群点检测计算量;然后,运用CART决策树方法在分支节点采取布尔检测,将待检测数据统一拟作连续数据,升序排列训练数据集,计算数据最高信息增益,剪枝决策树直到没有非叶子节点可被替换,得到离群点动态检测结果。仿真结果证明,本文算法离群点检测准确率高、检测耗时短,具备显著的计算优势,能为大数据集的可靠应用提供积极帮助。  相似文献   

9.
分析决策树的基本模型,给出决策树的方法概述.进一步对决策树的算法进行了深入的分析,最后给出了构建决策树.并且应用决策树进行线性分类和2次分类,进行了算法的实践.  相似文献   

10.
为从理论层次上深度解析决策树分类算法的逻辑可行性,根据可拓理论中可拓逻辑和可拓思维的全新视角,对构建决策树过程中节点的选择、规则提取和预测等步骤,进行理论上的分析和评价.以可拓思维中的菱形思维模式来分析决策树算法中节点的选择,以可拓逻辑中基元变换理论来评价决策树算法的规则提取,以可拓逻辑中的基元发散规则来解释决策树算法的预测步骤,在验证决策树算法各个步骤符合可拓理论处理矛盾问题的思维模式的同时,也对决策树算法的分类结果建立了基于可拓理论的评价体系.  相似文献   

11.
为了更高效准确地检测到P2P数据流,将目前在数据挖掘等领域比较成熟的决策树分类技术应用到截包分析研究中.在实际应用中,通过对流的特征属性进行计算统计处理作为训练样本集建立决策树,并对建立的决策树进行剪技优化,实验表明决策树分类技术更能快速准确地定位P2P数据流,在实时处理大量数据方面更能体现决策树分类技术的效率与准确度.  相似文献   

12.
提出了一种改进的扩充攻击树结构和攻击树算法,依据用户SPRINT计划来识别授权用户的恶意行为。该算法分为3个阶段:剪枝攻击树阶段:针对每个授权用户的SPRINT计划,判断子攻击树是否存在后构造相应子攻击树;最小攻击树阶段:剔除无用分支,判断其存在性后生成最小攻击树;风险分析阶段:动态生成最小攻击树中各节点当前的攻击概率,通过更加精确的量化方法辅助系统安全人员做出决策。  相似文献   

13.
针对博弈树迭代加深搜索和向前剪枝搜索中误剪最佳分支的弱点,利用向前剪枝搜索与预评估搜索间的双重迭代调用,提出了一种新的博弈树迭代向前剪枝搜索方法.预评估搜索通过节点排序及调整剪枝比率可以更加准确地选取排序在前的最佳分支,进而使迭代向前剪枝搜索实现在预评估所保留的最佳分支方向进行深度搜索,二者迭代相互调用以提高向前剪枝搜索的有效性及效率.定性分析与中国象棋计算机博弈实验结果表明,迭代向前剪枝搜索提高了实时行棋决策的效率和效果,与α-β剪枝搜索相比,提高的搜索效率超过160倍,同时取得了胜负比近7倍的博弈效果.  相似文献   

14.
该文基于小波包调制系统在不同信道中各子带的传输性能的研究,从信道对小波包调制系统传输性能影响的角度,利用对满树调制结构的剪枝合并,探讨与频率选择性信道相匹配的小波包调制结构。仿真表明所选择的小波包树结构,不仅保证了小波包调制系统的传输性能,具有更简单的结构模式,而且具备数据多速率传输的特性。  相似文献   

15.
基于决策树数据挖掘的分析与应用   总被引:1,自引:1,他引:0  
决策树技术是一种对海量数据集进行分类的非常有效方法。通过构造决策树模型,提取有价值的分类规则,帮助决策者做出准确的预测已经应用在很多领域。基于这种技术构造的蘑菇可食用性决策树模型,提供了通过蘑菇属性判别蘑菇可食用性的科学依据。决策树算法采用C4.5算法,它把信息增益率作为属性选择的度量标准。从实验结果来看,决策树模型虽然显示了一个很不平衡的结构,但得出了很容易理解的决策规则。  相似文献   

16.
决策树是当前预测、决策和数据挖掘中常用的方法之一。通过对决策树的生成过程进行分析,针对现有方法中决策树过度生长带来的弊端,提出了一种结合贝叶斯推理技术思想的决策树的改进方法,并给出了该方法中数据的存储结构和决策树的生成过程。该方法利用数据挖掘所产生的规则对决策树每个分支节点的分裂条件进行判断,一方面能限制决策树生长,另一方面又能帮助选择最优线路,从而使决策效率明显提高。  相似文献   

17.
SVM决策树能够较好地进行Web文本信息分类,在此基础上进一步结合遗传算法,将SVM决策树分类器的分类正确率作为GA适应度函数,对SVM决策树层次结构进行优化,在每一决策节点自动选择最优或近优的分类决策。实验结果表明,采用该方法进行多类分类,分类精度明显提高,体现了将遗传算法与SVM决策树结合的优越性。  相似文献   

18.
为提高自适应小波包调制(WPM)系统抗窄带干扰能力,提出一种基于单音干扰的小波包树(WPT)优选算法.算法以误码率(BER)和有限信号传输能量为条件构造WPT节点处的代价函数,将树优选问题转化为搜索拉格朗日最小代价函数问题,通过剪枝方式搜索窄带干扰下的最优树.理论分析和仿真结果表明,优选算法在窄带干扰环境下能够简单准确地搜索到最优树,在不需要定时发送训练序列的条件下显著提高自适应WPM系统抗窄带干扰能力.  相似文献   

19.
决策树方法是一种重要的可完成分类任务的知识发现技术 ,目的是通过构造一个分类模型 ,把数据库中的元组映射到给定类别中的某一个。决策树分类算法效率高且应用广泛 ,但是不能处理在决策树的构建和分类过程中的不确定数据。针对决策树分类算法的局限 ,利用证据理论是对概率论的扩展 ,将置信函数与概率的上下值相联系 ,可用于不确定数据的表达这个有力工具 ,把决策树分类技术扩展到含有不确定数据的环境中 ,提出了 D- S决策树分类算法。实验结果表明 D- S决策树分类算法能有效的对不确定数据进行分类。  相似文献   

20.
以五子棋为例,用UML开发人机博弈程序。五子棋博弈算法采用了博弈树的方法,应用了剪枝和极大极小值原理进行搜索寻找最优的下子位置。用面向对象的思想并结合UML建模工具,对程序进行分析、设计。此外,程序可以通过增加机器学习,对棋局进行记忆、总结学习,可以进一步提高系统的智能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号