首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
针对PHM(Prognostic and Health Management)中数据挖掘和知识获取困难的问题,提出一种以J48决策树算法为基础的故障诊断方法。采用了开源数据挖掘软件Weka,对CTSV滤波器故障仿真数据进行计算,对故障数据进行属性清理和参数选择。生成的决策树模型有很高的交叉验证率和分类效果。  相似文献   

2.
基于关联规则的决策树算法   总被引:1,自引:0,他引:1       下载免费PDF全文
汪海锐  李伟 《计算机工程》2011,37(9):104-106,109
通过将关联规则与决策树算法相结合,形成一种基于关联规则的决策树算法。该算法对不同时期同一事务的异种数据结构进行处理,得到一种可扩展的多分支分类决策树,使得改进后的决策树算法具有良好的可扩展性。该算法解决了传统分类算法在数据集维度发生变化时分类过程无法持续进行的问题。  相似文献   

3.
决策树在客户价值分析中的应用   总被引:1,自引:0,他引:1  
决策树算法是数据挖掘的一个活跃的研究领域。文中介绍了一种决策树的构建方法及其步骤。在训练样本的基础上,通过不断的计算选择比较合适的属性作为树根、子树根,并且不断重复,基于前向剪枝方法,最终建立了经过优化的决策树。经过Weka系统验证后,决策树和建立的相应规则性能良好。最后将决策树应用于客户价值分析中,并得到了一定的实用价值。  相似文献   

4.
人乳头瘤病毒(HPV)是导致宫颈癌的一大要素。利用Weka这个数据挖掘平台,对中国肿瘤防治数据库山西子宫颈癌医学数据集进行C4.5决策树分类研究,从决策树中提取了一些比较有意义的规则,发现一些容易导致感染HPV病毒的因素。  相似文献   

5.
采用Spring、Hibernate、Webwork做统一的底层技术框架实现,提供统一的对象持久化处理,通过简单配置就可以实现对象的增、删、修改与分页查询操作,并提供一致的缓存实现、JNDI数据源、Web服务支持与事务配置方式。决策树通信机制界面库建立在Ext2.0 Widget库上的,通过模板引擎对Ext进行了Tag封装。  相似文献   

6.
模糊决策树算法与清晰决策树算法的比较研究   总被引:10,自引:2,他引:10  
ID3算法是一种典型的决策树归纳算法,这种算法在假定示例的属性值和分类值是确定的前提下,使用信息熵作为启发式建立一棵清晰的决策树。针对现实世界中存在的不确定性,人们提出了另一种决策树归纳算法,即模糊决策树算法,它是清晰决策树算法的一种推广。这两种算法在实际应用中各有自己的优劣之处,针对一个具体问题的知识获取过程,选取哪一种算法目前还没有一个较明确的依据。该文从5个方面对这两种算法进行了详细的比较,指出了属性为连续值时这两种算法的异同及优缺点,其目的是在为解决具体问题时怎样选择这两种算法提供一些有用的线索。  相似文献   

7.
一种基于决策树的快速关联规则挖掘算法   总被引:2,自引:0,他引:2  
陈雪飞 《计算机科学》2008,35(7):252-254
本文对关联规则的挖掘问题进行了深入研究.在总结现有算法优缺点的基础上,提出了一种新的基于决策树的快速关联规则挖掘算法(RABDT),结合决策树的构造过程,给出了算法的原理和实现步骤,并通过实验对比验证了算法的有效性.  相似文献   

8.
决策树(Decision Tree)曾在很长的时间里是非常流行的人工智能技术,随着数据挖掘技术的发展,决策树作为一个构建决策系统的强有力的技术在数据挖掘和数据分析过程中起到了非常重要的作用.决策树在数据挖掘中主要用于分类、预测以及数据的预处理等.  相似文献   

9.
林静 《福建电脑》2012,28(11):60-62
决策树,英文名为Deciyion Tree,是一种很久以前就开始风靡全球的人工智能技术。随着数据挖掘技术的不断进步,决策树已经成为构建决策系统不可缺少的技术,它不仅在数据挖掘方面起着关键性的作用,在数据分析方面也是一个领军者。决策树在数据挖掘中被用于预测、解决、分类等。  相似文献   

10.
基于决策树的神经网络   总被引:5,自引:0,他引:5  
传统人工神经网络模型采用试探的方法确定合适的网络结构,并随机地初始化参数值,导致神经网络训练效率低、结果不稳定.熵网络是一种建立在决策树之上的3层前馈网络,在熵网络基础上,提出了基于决策树的神经网络设计方法(DTBNN). DTBNN中提供了对神经网络参数的初始值合理设置的方法,并提出了由决策树确定的只是熵网络的初始结构,在实际的网络构造中需要根据实际应用添加神经元和连接权以提高网络的性能.理论分析和实验结果表明了这种方法的合理性.  相似文献   

11.
由于电力营销(EPM)领域的数据海量、庞杂而且质量差,如何构造出精确性高的预测模型成为亟待解决的问题.采用智能决策树分类算法,按照数据中的属性值进行分类.对属性值,取缺损数据所属类别中所有属性值的算术平均值取代,对于非属性值,取同一属性中非属性值出现频率最高的值来替代.从而对需进入EPM模型的缺损数据进行补齐,保证了进入模型的数据最优化.在此基础上,提出了一种将BP神经网络应用于EPM中的新方法,通过改进BP神经网络中隐层的节点数目,降低了神经网络的计算复杂度.结果表明,该模型具有良好的预测效果.  相似文献   

12.
基于决策分类熵的决策树构造算法及应用   总被引:1,自引:0,他引:1  
董广  王兴起 《计算机应用》2009,29(11):3103-3106
为了更好地完成金融数据集上的分类挖掘任务,以粗糙集理论为基础提出决策分类熵的概念,进而以属性的决策分类熵为属性分裂度量提出基于决策分类熵的决策树构造算法,并针对过拟合问题提出一种抑制参数来实现树规模的良好控制。实例分析及金融数据集上的实验表明:相比经典的C4.5决策树算法,新算法能够较好地克服其缺点和不足,构建更优的决策树,能够更好地完成分类任务。  相似文献   

13.
赵晓峰  叶震 《计算机应用》2007,27(5):1041-1043
传统的决策树分类方法(如ID3和C4.5)对于相对小的数据集是很有效的。但是,当这些算法用于入侵检测这样的非常大的数据时,其有效性就显得不足。采用了一种基于随机模型的决策树算法, 在保证分类准确率的基础上,减少了对系统资源的占用,并设计了基于此算法的分布式入侵检测模型。最后通过对比试验表明该模型在对计算机入侵数据的分类上有着出色的表现。  相似文献   

14.
对于非崩溃的错误,测试人员往往花费大量的时间才能发现。为了快速准确地定位这类错误,降低软件开发成本,提高软件质量,提出一种辅助定位非崩溃错误的方法。该方法通过收集程序的执行轨迹信息,构造出程序调用图。提取频繁边,运用J48决策树算法,得到基于方法粒度的故障决策树,可辅助人员判定软件缺陷。通过实验与分析,进一步验证了该方法的有效性。  相似文献   

15.
一种多变量决策树的构造与研究   总被引:3,自引:0,他引:3       下载免费PDF全文
单变量决策树算法造成树的规模庞大、规则复杂、不易理解,而多变量决策树是一种有效用于分类的数据挖掘方法,构造的关键是根据属性之间的相关性选择合适的属性组合构成一个新的属性作为节点。结合粗糙集原理中的知识依赖性度量和信息系统中条件属性集的离散度概念,提出了一种多变量决策树的构造算法(RD)。在UCI上部分数据集的实验结果表明,提出的多变量决策树算法的分类效果与传统的ID3算法以及基于核方法的多变量决策树的分类效果相比,有一定的提高。  相似文献   

16.
目前关于决策树剪枝优化方面的研究主要集中于预剪枝和后剪枝算法。然而,这些剪枝算法通常作用于传统的决策树分类算法,在代价敏感学习与剪枝优化算法相结合方面还没有较好的研究成果。基于经济学中的效益成本分析理论,提出代价收益矩阵及单位代价收益等相关概念,采用单位代价收益最大化原则对决策树叶节点的类标号进行分配,并通过与预剪枝策略相结合,设计一种新型的决策树剪枝算法。通过对生成的决策树进行单位代价收益剪枝,使其具有代价敏感性,能够很好地解决实际问题。实验结果表明,该算法能生成较小规模的决策树,且与REP、EBP算法相比具有较好的分类效果。  相似文献   

17.
决策树算法的一种改进算法   总被引:2,自引:0,他引:2  
决策树是归纳学习和数据挖掘的重要方法,主要用于分类和预测.ID3算法是决策树中应用最广泛的算法,通过对数据挖掘中决策树的基本思想进行阐述,讨论了ID3算法倾向于取值较多属性的缺点,引入无关度对ID3算法作了改进.实验数据结果分析表明,改进后的算法能得到更合理、更有效的规则.  相似文献   

18.
基于模糊决策树的文本分类规则抽取   总被引:8,自引:0,他引:8  
王煜  王正欧 《计算机应用》2005,25(7):1634-1637
提出一种合并分枝的模糊决策树文本分类方法对相似文本类进行分类,并可抽取出分类精度较高的模糊分类规则。首先研究改进了的χ2统计量,并根据改进的χ2统计量对文本的特征词条进行聚合,有效地降低了文本向量空间的维数。然后使用一种合并分枝的模糊决策树进行分类,大大减少了抽取的规则数量。从而既保证了决策树分类的精度和速度,又可抽取出可理解的模糊分类规则。  相似文献   

19.
保持隐私的决策树的生成过程研究   总被引:1,自引:0,他引:1  
路慧萍  童学锋 《计算机应用》2005,25(6):1382-1384
介绍了保持隐私的数据挖掘技术,研究了决策树分类器在保持隐私的数据挖掘中的应用。在传统的决策树算法中引入标量积协议,既保持决策树算法本身的优点,又满足了保持隐私的需求。  相似文献   

20.
在数据挖掘问题中,一个基本假设是训练集样本与测试集样本的数据分布一致,但随着数据量逐渐增加,如何在海量数据中找出具有代表意义的数据也变得尤为困难。对现有的数据选择方法研究发现,传统的简单随机抽样和渐进抽样等数据选择方法,由于没有和数据挖掘工具进行结合,采样结果具有偶然性和不确定性,抽样数据很难保证数据挖掘的基本假设,这也使得最终模型的泛化误差较大。为了解决数据采样过程中类间的不平衡问题,提出一种基于双决策树的结构化数据采样方法。首先通过C4.5算法生成一棵决策树,借助决策树在数据源中选择适合的数据和数据采集点,同时通过使用另一棵决策树对选择出的数据集的质量进行评估来达到高效率和高质量的数据采样。实验表明,与简单随机抽样相比,新采样数据下训练的模型准确率有明显提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号