首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
基于模糊模式与决策树融合的脚本病毒检测算法   总被引:2,自引:0,他引:2  
构建决策树进行脚本病毒检测可以全面利用训练样本的信息,在样本特征较为复杂、样本数较大的情况下会产生大量节点,计算时间复杂度高,在剪枝过程中影响分类准确度。为融合模糊模式的信息以提高分类器性能,该文设计了决策树分类基础上的融合算法。该算法将关于模糊模式贴近度的3个特性作为决策树样本信息向量中的属性。使用训练样本集,根据上述属性在划分点上的分裂信息值及信息增益率选择分裂属性,逐步构建决策树。实验结果验证了算法的稳定性与准确度,表明这种融合方法可增加属性的区分度,减少决策树的分支数。  相似文献   

2.
文章应用决策树模型分类方法对银行贷款风险进行研究,针对算法往往偏向于取值较多的属性、而取值较多的属性不一定最优的缺点,对ID3进行改进,用平均信息增益代替信息增益作为选取分支属性的依据,进而建立评估模型。  相似文献   

3.
王源  王甜甜 《电子科技》2010,23(9):89-91,95
针对ID3算法倾向于取值较多的属性的特点,同时为避免特定领域主观属性影响分类结果,提出了一种改进的决策树算法。该方法利用决策树算法构造决策树,通过对分类结果中主客观属性进行标记并逻辑运算,最终得到较客观的决策信息,并进行实验验证。  相似文献   

4.
针对电子称重仪表属性的多参数集对仪表性能的影响程度不同,引入了基于粗糙集理论的属性约简进行属性的降噪和排序处理,然后结合决策树理论的C4.5算法来对自诊断电子称重仪表进行分析,取信息增益率最大的结点作为决策树的根。以此使分裂信息项惩罚了多值属性最后建立了决策树模型。结果表明:此方法得到了属性的影响程度排序,使得建树快速、建模准确,利于决策分析。  相似文献   

5.
作业车间的历史调度隐含着丰富的调度信息,文章在传统调度规则、数据挖掘、遗传算法相结合的作业车间调度方法的基础上,提出了基于数据挖掘的调度算法。选择与优化目标相关的工序信息作为历史离线调度数据集的属性,提出了一种应用于决策树的属性分类方法,再利用决策树C4.5算法从数据集中获得调度知识,形成C4.5多叉树规则,进一步与启发式算法融合,改进了初始种群随机的局限性,实现作业车间的实时调度优化。仿真表明,文章所提出的算法在优化性能和收敛速度方面具有明显的优势。  相似文献   

6.
典型网络高维数据软子空间聚类方法采用软子空间聚类算法,根据目标函数最优解判断聚类是否最优,最优解计算过程容易过度拟合陷入局部最优,导致分类结果精度低。故文中提出基于决策树的网络高维数据软子空间聚类方法,根据信息增益选择决策树节点,在信息增益基础上添加分裂信息项防止决策树节点过度分类,获取不同树节点属性类别划分结果。在此基础上采用后剪枝技术删除含有噪音和干扰属性结点,将包含样本数量最多的分类结果视为网络高维数据软子空间的分类结果。仿真实验结果表明,所提方法聚类分析正确率随着网络高维数据集维数的增加而增加,且随样本数量增加的同时运行时间增长幅度较低,用时较短,是一种应用价值高的网络高维数据软子空间聚类方法。  相似文献   

7.
基于决策树的一种改进算法   总被引:2,自引:0,他引:2  
王静红  李笔 《电讯技术》2004,44(5):175-178
首先介绍了ID3算法的基本思想,然后讨论了决策树算法中的难点问题,针对ID3算法中所存在的不足,提出了一种利用优值法的思想来改进信息增益的算法,并且与ID3算法进行了实验对比。实验表明,这种方法从树的规模和分类精度都优于许多决策树算法,使决策效率明显提高。  相似文献   

8.
李颖 《信息技术》2022,(2):116-120,126
为了提高数据挖掘准确性和效率,文中提出了基于决策树算法的信息系统数据挖掘方法.以C4.5决策树算法计算属性的信息增益率和属性值的信息熵为基础,提出基于余弦相似度改进的C4.5决策树算法,若任意两个属性值的信息熵之差在阈值范围内,通过计算其余弦相似度合并在阈值范围内的属性值,并重新计算合并后属性的信息增益率,实现信息系统...  相似文献   

9.
海量数据的索引是提高分布式环境下海量数据的查询重要手段。为了构建高效的索引结构,人们提出了多种异构数据索引优化方法。文中给出了基于决策树分类算法下的索引优化方法。基于决策树分类算法构建索引决策树,利用该索引决策树对各个子空间表的属性列进行决策,建立索引表,根据索引表数据建立索引,再根据各子空间上的索引构建全局索引。该二级索引结构为快速定位索引信息提供了技术支持。实验结果表明,索引决策树是一个对优化异构数据索引合适的方法。  相似文献   

10.
为了提高网络信息的安全性,引进决策树算法,设计基于决策树算法的网络信息安全威胁识别方法。提取网络信息属性,获取数据的划分规则,从决策树的根节点开始执行构造行为,进而生成可用于识别威胁源端的决策树;将测试样本数据集合中的数组作为依托,对数据生成中影响决策树稳定性的数据或信息作为初步生成规则,以此将决策树中的数据集合进行冗余值删除处理,实现基于决策树剪枝处理的网络信息分类处理;根据检测到的攻击路径识别攻击的源端,实现识别网络信息安全威胁。实验表明,相比传统方法,设计的识别方法,可以在确保威胁识别具有时效性的基础上,提升信息安全威胁识别结果的准确率,准确率最高达到100.0%,远高于传统方法。  相似文献   

11.
刘军 《微电子学与计算机》2012,29(1):109-112,116
针对完全以核属性为首选构建决策树算法的不足,本文以粗糙集的分辨关系为基础,提出以决策属性的分辨量和分辨类别两个参数确定条件属性的重要性,择优自顶向下构造决策树.该算法的优点在于算法简洁有效和时空复杂度低.实例分析的结果表明,该方法能获得更为简洁有效的决策树.  相似文献   

12.
杨明  郭树旭  王隽 《中国通信》2011,8(5):151-156
The ID3 algorithm is a classical learning algorithm of decision tree in data mining.The algorithm trends to choosing the attribute with more values,affect the efficiency of classification and prediction for building a decision tree.This article proposes a new approach based on an improved ID3 algorithm.The new algorithm introduces the importance factor λ when calculating the information entropy.It can strengthen the label of important attributes of a tree and reduce the label of non-important attributes.The...  相似文献   

13.
针对斜划分决策树算法普遍存在时间效率低、部分算法仅能应用于二分类问题,提出了一种基于加权距离的聚类决策树算法。通过Relief-F算法为预测属性计算权重,并将权重用于树结点中数据的聚类过程,使用分簇结果对结点进行多路划分,得到可直接用于多分类问题的决策树。理论分析和实验结果表明,该算法与经典轴平行决策树相比,拥有更好的泛化能力以及相近的算法时间复杂度,与大部分斜决策树相比,在付出更少计算代价的前提下,获得了近似的正确率以及模型简洁度。  相似文献   

14.
决策树算法是数据挖掘中的一种重要算法,介绍了决策树的构建过程中数据预处理方法及决策树构造方法与步骤.数据预处理是为了提高数据挖掘对象的质量,主要包括数据清洗、数据集成与数据消减.数据预处理之后,在训练样本集的基础上,通过选择适当的属性做为树根、子树根,不断重复,基于剪枝方法,最终建立了经过优化的决策树.  相似文献   

15.
易巧玲  邓家先  王海荣  王成成 《通信技术》2010,43(7):163-164,212
星载图像编码系统要求图像压缩算法具有一定压缩比、低复杂度的特点,同时希望尽可能减少码流比特错误造成的误码扩散。为了减少误码扩散,提出了一种易于硬件实现、低复杂度、抗误码强的树块数据无损压缩算法。图像数据经过小波变换后,将各级分辨率的系数按照树的结构进行排序,并由若干棵相邻的树构成树集合,称之为树块,每个树块独立进行比特平面编码,产生的码流独立进行打包。结果表明,这种编码方法有较低复杂度,易于硬件实现,能够有效优化,使输出码率达到最短,而且可以有效提高系统的抗误码性能。  相似文献   

16.
基于数据挖掘的电信客户流失预测分析   总被引:1,自引:0,他引:1  
针对电信客户日益严重地流失问题,通过某电信运营商的历史资料,对电信PAS流失客户的自然属性和行为属性进行研究,利用决策树算法建立了客户流失预测模型。通过对模型进行评估分析,得到预测效果较好的模型,最后加入成本因素,进一步优化了模型。  相似文献   

17.
数据挖据是一种处理海量数据的技术。分类挖掘是数据挖掘的重要方法。决策树算法能有效在训练数据集上建立数据属性和类别的映射。利用决策树算法建立目标数据库分类器,对数据对象的缺失属性预测。针对分类预测模型对单个目标多个预测类别的现象,提出一种单个目标预测结果的综合分析算法,处理结果得到单个目标的预测类别及其可信度。分类结果可用于空缺或错误字段补全或校正。  相似文献   

18.
《电子学报:英文版》2017,(5):999-1007
The simplicity and interpretability of decision tree induction makes it one of the more widely used machine learning methods for data classification.However,for continuous valued (real and integer) attribute data,there is room for further improvement in classification accuracy,complexity,and tree scale.We propose a new K-ary partition discretization method with no more than K-1 cut points based on Gaussian membership functions and the expected class number.A new K-ary crisp decision tree induction is also proposed for continuous valued attributes with a Gini index,combining the proposed discretization method.Experimental results and non-parametric statistical tests on 19 real-world datasets showed that the proposed algorithm outperforms four conventional approaches in terms of both classification accuracy,tree scale,and particularly tree depth.Considering the number of nodes,the proposed methods decision tree tends to be more balanced than in the other four methods.The complexity of the proposed algorithm was relatively low.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号