首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
针对电子称重仪表属性的多参数集对仪表性能的影响程度不同,引入了基于粗糙集理论的属性约简进行属性的降噪和排序处理,然后结合决策树理论的C4.5算法来对自诊断电子称重仪表进行分析,取信息增益率最大的结点作为决策树的根。以此使分裂信息项惩罚了多值属性最后建立了决策树模型。结果表明:此方法得到了属性的影响程度排序,使得建树快速、建模准确,利于决策分析。  相似文献   

2.
基于模糊粗糙集的知识获取方法在模糊粗糙集的研究中具有十分重要的作用,通过矩阵来刻画粗糙集理论,用模糊矩阵定义了模糊粗糙集和粗糙模糊集的上(下)近似、重要度等概念,给出模糊信息系统的属性约简算法,并用UCI数据集说明算法的可行性。  相似文献   

3.
为了更好地提高入侵检测的准确率,节省检测时间,文章提出了一种基于增量式的决策树检测算法。该方法采用了基于粒度决策熵和改进的主成分分析方法对数据集中的冗余以及不相关属性进行归类、降维。该方法将数据挖掘增量学习技术与决策树分类算法相结合,在属性降维后的决策树基础上,对于新的测试样本实例,引入扩展贝叶斯结点,比较贝叶斯分类方法与决策树分类方法的准确率,返回更新后的决策树。针对属性降维,主成分分析方法在约简属性的基础上,能够有攻击分类结果准确率高、耗时少的特点。将增量式决策树算法与贝叶斯算法、ID3算法进行对比,发现在检测精确率、检测效率的指标下,增量式决策树算法在一定程度上优于其他算法,并且误报率有效降低。  相似文献   

4.
基于粗糙集理论,对基于属性重要度的启发式属性约简算法进行了改进,并将改进后算法运用于纳税人属性约简的实际工作中.该算法解决了原有基于属性重要度的启发式属性约简算法结果中存在冗余属性问题,实现了属性选择较小化,并保持原有数据分类能力不发生大的变化.通过属性约简实验结果和实际工作情况对比,证明该算法具有很好的性能.  相似文献   

5.
针对电信企业客户流失问题,提出一种基于Weka平台知识自动获取的客户流失预测模型。针对决策树算法偏向于选择取值较多的属性作为测试属性的缺点,结合OIR算法选择相关属性子集进行分类,降低相关度较小属性与重复属性对分类的影响。通过在Weka平台上使用6个UCI数据集和移动公司客户数据的实验结果表明,优化后的决策树算法克服了决策树算法的取值偏置问题,从而获得比J48算法更高分类准确率。  相似文献   

6.
海量数据的索引是提高分布式环境下海量数据的查询重要手段。为了构建高效的索引结构,人们提出了多种异构数据索引优化方法。文中给出了基于决策树分类算法下的索引优化方法。基于决策树分类算法构建索引决策树,利用该索引决策树对各个子空间表的属性列进行决策,建立索引表,根据索引表数据建立索引,再根据各子空间上的索引构建全局索引。该二级索引结构为快速定位索引信息提供了技术支持。实验结果表明,索引决策树是一个对优化异构数据索引合适的方法。  相似文献   

7.
连续值属性决策表中的知识获取方法   总被引:3,自引:1,他引:2  
冯林  王国胤  李天瑞 《电子学报》2009,37(11):2432-2438
 提出了一种从连续值属性决策表中获取知识的方法KACVA(Knowledge Acquisition from decision tables containing Continuous-Valued Attributes).该方法将经典粗糙集理论对数据空间的等价划分转换为相似划分,把传统粗糙集理论中正域的表示方法扩充到连续值属性决策表中;通过计算连续值属性决策表中各条件聚类对决策类的分类能力,生成决策规则.不同数据集的实验测试结果表明:对连续值属性决策表中的知识获取,KACVA方法与传统的粗糙集相关知识获取方法及C4.5决策树分类方法相比,有更高的分类准确率.  相似文献   

8.
基于粒度的粗集-决策树雷达信号识别模型   总被引:2,自引:1,他引:1  
通过引入知识粒度的概念,对信息系统中属性的重要度进行了定义,并以属性重要度为启发式信息,进行粗集的属性约简.在构造决策树的过程中,基于粗集的理论运用了加权平均粗糙度的概念,并将其作为选择分离属性的标准.将这种联合粗集与决策树的模型应用到雷达信号识别中,经实验证明,用该方法构造的决策树复杂性低,且能有效提高分类效果.  相似文献   

9.
C4.5决策树改进算法研究   总被引:2,自引:0,他引:2  
决策树是数据挖掘分类算法中非常重要的一个算法分支。文章介绍了决策树算法中应用最广泛的典型算法-ID3和C4.5算法,并基于四个通用的数据集,针对这两个算法进行定量分析对比,研究两个算法的性能优劣。文章对C4.5算法中的连续属性离散化方法提出一些优化改进,并通过实际数据实验证实了优化的可行性。  相似文献   

10.
针对传统高精度分类算法在面对不定因子时,无法确定计算数据信噪度,造成计算精度不佳的问题,提出基于属性约简的粗糙集数据的高精度分类算法。通过对影响粗糙集数据分类精度的各影响因素进行详细分析,对粗糙集数据属性进行约简,抵消对应不定因子以及信噪数据,提高粗糙集数据分类精度。实验结果表明,采用改进分类算法相比传统分类方法,其分类精度及抗噪性均有提高,且其记录结果数据致盲率较低,具有一定优势。  相似文献   

11.
王源  王甜甜 《电子科技》2010,23(9):89-91,95
针对ID3算法倾向于取值较多的属性的特点,同时为避免特定领域主观属性影响分类结果,提出了一种改进的决策树算法。该方法利用决策树算法构造决策树,通过对分类结果中主客观属性进行标记并逻辑运算,最终得到较客观的决策信息,并进行实验验证。  相似文献   

12.
针对斜划分决策树算法普遍存在时间效率低、部分算法仅能应用于二分类问题,提出了一种基于加权距离的聚类决策树算法。通过Relief-F算法为预测属性计算权重,并将权重用于树结点中数据的聚类过程,使用分簇结果对结点进行多路划分,得到可直接用于多分类问题的决策树。理论分析和实验结果表明,该算法与经典轴平行决策树相比,拥有更好的泛化能力以及相近的算法时间复杂度,与大部分斜决策树相比,在付出更少计算代价的前提下,获得了近似的正确率以及模型简洁度。  相似文献   

13.
基于决策树的分组分类算法因易于实现和高效性,在快速分组分类中广泛使用。决策树算法的基本目标是构造一棵存储高效且查找时间复杂度低的决策树。设计了一种基于规则集统计特性和评价指标的决策树算法——HyperEC 算法。HyperEC算法避免了在构建决策树过程中决策树高度过高和存储空间膨胀的问题。HyperEC算法对IP地址长度不敏感,同样适用于IPv6的多维分组分类。实验证明,HyperEC算法当规则数量较少时,与HyperCuts基本相同,但随着规则数量的增加,该算法在决策树高度、存储空间占用和查找性能方面都明显优于经典的决策树算法。  相似文献   

14.
数据挖掘分类技术研究与分析   总被引:1,自引:0,他引:1  
分类技术是数据挖掘中的核心和基础技术,在此就数据挖掘分类技术的主要算法进行了对比分析研究。对目前研究比较多的基于决策树、贝叶斯和人工神经网络的分类方法做了详细的讨论,对其他新提出的几种算法做了简要分析,论述了每种分类算法的优缺点,并给出了相应的应用领域,最后对分类技术的研究重点和发展趋势做了展望。  相似文献   

15.
对不同类别的应用数据流,根据其在最初若干分组中进行握手和参数协商的差异性,通过通信模式、载荷长度以及信息熵等特征,采用基于最短划分距离的方法构建决策树模型,对其进行流量分类。经过在4个不同类型的真实网络数据集上的离线分类实验,以及在校园网环境中的在线流量分类实验。结果表明该模型对8种常见协议的网络流量,分析其前4到6个分组的特征,能够在分类准确性和系统开销上取得较好的效果。与其他机器学习算法相比,该模型构建的决策树规模较小,分类时间较短,适合于实时流量分类问题。  相似文献   

16.
针对区域分割包分类算法存在的规则分布差异较大的缺陷,该文提出一种基于启发式分割点计算的区域分割包分类算法。首先依据规则集的分布规律进行分割点计算,然后再进行结构化建树。规则检索时间主要包括分割点匹配时间和分割点内规则的线性查找时间。该算法能够尽量将规则平分到各分割点,减少了规则分布的差异。仿真实验结果表明该算法降低了规则数增加对算法性能的影响,支持规则集的实时更新。  相似文献   

17.
邵璐熠  洪文 《雷达学报》2016,5(6):681-691
决策树模型在极化SAR数据分类中有着极大的应用价值,既能描述分类结果的极化散射机制,又能获得较好的分类精度。但在对散射机制相似的地物进行分类时,由于经典决策树模型的节点采用的是单个特征,分类精度不理想。因此,该文提出了节点采用2维特征的方法,即在特征集相同的前提下,每次取两个特征组成特征矢量用于节点,提高了经典决策树难以区分的地物的分类精度;并且利用分类结果的混淆矩阵准确定位了导致分类误差的节点,进而对节点进行有针对性的反馈调整,进一步提高了指定地物的分类精度。利用AIRSARFlevoland数据验证了该方法的有效性,并结合极化特征描述了Flevoland地区多种植被的极化散射机制。   相似文献   

18.
Activity classification using realistic data from wearable sensors   总被引:1,自引:0,他引:1  
Automatic classification of everyday activities can be used for promotion of health-enhancing physical activities and a healthier lifestyle. In this paper, methods used for classification of everyday activities like walking, running, and cycling are described. The aim of the study was to find out how to recognize activities, which sensors are useful and what kind of signal processing and classification is required. A large and realistic data library of sensor data was collected. Sixteen test persons took part in the data collection, resulting in approximately 31 h of annotated, 35-channel data recorded in an everyday environment. The test persons carried a set of wearable sensors while performing several activities during the 2-h measurement session. Classification results of three classifiers are shown: custom decision tree, automatically generated decision tree, and artificial neural network. The classification accuracies using leave-one-subject-out cross validation range from 58 to 97% for custom decision tree classifier, from 56 to 97% for automatically generated decision tree, and from 22 to 96% for artificial neural network. Total classification accuracy is 82% for custom decision tree classifier, 86% for automatically generated decision tree, and 82% for artificial neural network.  相似文献   

19.
基于模糊模式与决策树融合的脚本病毒检测算法   总被引:2,自引:0,他引:2  
构建决策树进行脚本病毒检测可以全面利用训练样本的信息,在样本特征较为复杂、样本数较大的情况下会产生大量节点,计算时间复杂度高,在剪枝过程中影响分类准确度。为融合模糊模式的信息以提高分类器性能,该文设计了决策树分类基础上的融合算法。该算法将关于模糊模式贴近度的3个特性作为决策树样本信息向量中的属性。使用训练样本集,根据上述属性在划分点上的分裂信息值及信息增益率选择分裂属性,逐步构建决策树。实验结果验证了算法的稳定性与准确度,表明这种融合方法可增加属性的区分度,减少决策树的分支数。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号