首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
数据挖掘在体育领域的应用还比较少。如何利用好体育运动的训练数据,从中挖掘出有用信息,是数据挖掘技术在体育领域中的一项重要任务。决策树方法是一种常用的数据挖掘技术,该文把决策树方法应用于网球训练,对有关数据进行挖掘,形成一棵网球训练的决策树,从而协助体育工作人员更合理地制定网球训练方案,提高网球训练的效率。  相似文献   

2.
在数据挖掘问题中,一个基本假设是训练集样本与测试集样本的数据分布一致,但随着数据量逐渐增加,如何在海量数据中找出具有代表意义的数据也变得尤为困难。对现有的数据选择方法研究发现,传统的简单随机抽样和渐进抽样等数据选择方法,由于没有和数据挖掘工具进行结合,采样结果具有偶然性和不确定性,抽样数据很难保证数据挖掘的基本假设,这也使得最终模型的泛化误差较大。为了解决数据采样过程中类间的不平衡问题,提出一种基于双决策树的结构化数据采样方法。首先通过C4.5算法生成一棵决策树,借助决策树在数据源中选择适合的数据和数据采集点,同时通过使用另一棵决策树对选择出的数据集的质量进行评估来达到高效率和高质量的数据采样。实验表明,与简单随机抽样相比,新采样数据下训练的模型准确率有明显提高。  相似文献   

3.
数据挖掘就是从海量的数据中挖掘出可能有潜在价值的信息的技术。决策树方法是一种典型的分类算法.首先对数据进行处理,利用归纳算法生成可读的规则和决策树模型,然后使用决策树模型对新数据进行分析。该文以大学生专业方向指导辅助系统的开发过程为实例从理论上论述了数据挖掘的概念、数据挖掘研究内容和本质以及进行数据挖掘的主要方法。讲述了使用MATLAB7.0开发实现决策树算法子系统的方法和实现,并且对生成的决策树模型进行分析。  相似文献   

4.
1 决策树数据挖掘技术中的决策树技术是首先从机器学习领域得来的,它与关联规则技术作为数据挖掘技术的两个大方向,在许多领域都有广泛的应用,如:医学、地质学、天文学、物理学、金融领域等等,并发挥着巨大的作用。决策树技术能建立分类系统及产生预测系统。从训练样本集出发,它的建立是一个速归过程。它重复执行以下过程:根据评价标准选择数据中的某一属性作为分割标准,将当前节点(数据集)分割成子节点(数据子集),如果各个子节点中的数据属于同一类,以类名标注,过程结束,否则过程在包含不同类数据的子节点中进行。  相似文献   

5.
提出了一个基于决策树理论的数据挖掘模型,该模型是数据挖掘中对样本进行分类的一种有效方法,它通过采用分级的形式,可以使复杂的分类问题逐步得到解决。在应用模型进行决策分析时,用给定的训练集构造一棵性能良好的决策树,然后选取合适的决策原则得出结论。在本文的最后给出了模型应用于交通领域的一个例子,说明如何在实际中运用该数据挖掘模型。  相似文献   

6.
数据挖掘技术是对海量数据信息进行分析和处理的技术,能为制定客户决策提供有价值的信息,银行客户关系管理系统运用数据挖掘技术施以有效的客户关系管理,能够提高客户服务水平,增强市场竞争能力。决策树是归纳学习和数据挖掘的重要方法。本文对决策树C4.5算法进行介绍,阐述数据挖掘技术在银行客户关系管理系统中的应用。  相似文献   

7.
数据挖掘技术初探   总被引:15,自引:0,他引:15  
数据挖掘技术已成为机器学习、数据库系统、人工智能等领域内热门的研究方向 .本文将讨论数据挖掘的基本概念 ,并在此基础上介绍、分析挖掘关联规则技术、决策树、聚类分析、数据管道等常用数据挖掘技术  相似文献   

8.
决策树(Decision Tree)曾在很长的时间里是非常流行的人工智能技术,随着数据挖掘技术的发展,决策树作为一个构建决策系统的强有力的技术在数据挖掘和数据分析过程中起到了非常重要的作用.决策树在数据挖掘中主要用于分类、预测以及数据的预处理等.  相似文献   

9.
叶片气动优化设计过程中产生的海量过程仿真数据中隐含着丰富的领域设计知识,为了获取其中隐含的设计知识,将基于粗糙集的决策树数据挖掘方法应用到叶片气动过程仿真数据的知识挖掘中。以跨音速压气机转子叶片NASA Rotor37气动优化设计为例,利用K-Means聚类分析对仿真数据进行离散化处理,采用粗糙集属性重要性算法进行属性约简,采用决策树算法构建叶片优化设计知识决策树,挖掘出叶片优化设计变量弯扭、周向积迭线的控制点偏移量与目标函数总压损失系数之间隐含的设计规则。结果表明,基于粗糙集的决策树的数据挖掘技术为叶片气动优化设计领域知识获取提供了一条有效的新途径。  相似文献   

10.
决策树算法及其常见问题的解决   总被引:16,自引:0,他引:16  
决策树这种数据挖掘技术是目前最有影响和使用最多的数据挖掘技术之一,生成决策树的算法也比较多,但是在这些生成决策树的算法中都需要解决两个问题——数据过分近似和测试属性的选择。  相似文献   

11.
一种基于多进化神经网络的分类方法   总被引:9,自引:0,他引:9  
商琳  王金根  姚望舒  陈世福 《软件学报》2005,16(9):1577-1583
分类问题是目前数据挖掘和机器学习领域的重要内容.提出了一种基于多进化神经网络的分类方法CABEN(classification approach based on evolutionary neural networks).利用改进的进化策略和Levenberg-Marquardt方法对多个三层前馈神经网络同时进行训练.训练好各个分类模型以后,将待识别数据分别输入,最后根据绝对多数投票法决定最终分类结果.实验结果表明,该方法可以较好地进行数据分类,而且与传统的神经网络方法以及贝叶斯方法和决策树方法相比,在  相似文献   

12.
如何能从海量数据中以更快速、高效、低成本的方式挖掘出有价值的信息成为如今数据挖掘技术面临的新课题。文中在研究Hadoop平台的特征和决策树的C4.5算法的过程中,决定在决策树算法领域中引入云计算思维,实现其在Ha-doop平台上的并行化,并且采用MapReduce模型来解决海量数据挖掘问题。最后用打高尔夫球的数据集对新的算法进行验证。实验结果表明对海量数据,基于Hadoop平台的决策树算法可以明显提高数据挖掘的效率,具有可观的高效性和可扩展性,在一定程度上解决了C4.5算法在处理海量数据时计算量大、构建决策树时间长的问题。  相似文献   

13.
马菁  顾景文 《微机发展》2008,18(2):66-69
在软件测试中,测试用例生成是其关键环节,也对软件测试的自动化有着重要影响。为了提高测斌用例生成的效率,提高其自动化的程度,从不同角度对软件测试用例选择策略进行介绍。决策树是数据挖掘领域中一种重要的数据分类技术.在现有的一些功能测试用例生成方法基础上提出了一种基于决策树算法的测试用例生成方法,并对其中一些关键问题进行了初步的探讨。  相似文献   

14.
张晓龙  骆名剑 《计算机应用》2005,25(9):1986-1988
决策树是机器学习和数据挖掘领域中一种基本的学习方法。文中分析了C4.5算法以及该算法不足之处,提出了一种决策树裁剪算法,其中以规则信息量作为判断标准。实验结果表明这种方法可以提高最终模型的预测精度,并能够很好克服数据中的噪音。  相似文献   

15.
数据挖掘是一种对大量信息进行分析和处理的技术,银行客户关系管理系统使用数据挖掘技术实施有效的客户关系管理,为企业决策提供有价值的信息,提高市场竞争能力。决策树方法是数据挖掘技术常用的分类方法,本文对决策树ID3算法的进行了介绍,阐述了数据挖掘技术在银行客户关系管理系统的应用。  相似文献   

16.
将据挖掘方法引入学习评价领域,仔细研究了决策树技术,通过构建决策树从考生测验数据库中挖掘出学习评价的规则,为在学习评价领域有效应用数据挖掘技术进行研究提供了一个方向。  相似文献   

17.
分类是数据挖掘的一种非常重要的方法。分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型。该函数或模型能够把数据库中的数据记录映射到给定类别中的某一个,从而可以应用于数据预测。大部分数据挖掘工具采用规则发现或决策树分类技术来发现数据模式和规则,其核心是某种归纳算法。这类工具通常是对数据库的数据进行开采,生产规则和决策树,然后对新数据进行分析和预测。本文研究基于SLIQ的数据挖掘分类算法。  相似文献   

18.
决策树在软件测试用例生成中的应用   总被引:1,自引:1,他引:0  
在软件测试中,测试用例生成是其关键环节,也对软件测试的自动化有着重要影响.为了提高测试用例生成的效率,提高其自动化的程度,从不同角度对软件测试用例选择策略进行介绍.决策树是数据挖掘领域中一种重要的数据分类技术,在现有的一些功能测试用例生成方法基础上提出了一种基于决策树算法的测试用例生成方法,并对其中一些关键问题进行了初步的探讨.  相似文献   

19.
基于遗传算法的多属性模糊决策树的优化   总被引:1,自引:0,他引:1       下载免费PDF全文
决策树是数据挖掘中的一种高效方法,但是当训练数据的属性很多时,构建的决策树的规模会随属性个数增加而指数级增长,进而会产生海量的规则。针对该问题,提出了一种基于遗传算法的优化方法。首先根据信息增益利用轮盘赌方法选取若干组属性,构建多棵决策树,然后利用遗传算法对多棵决策树进行组合,并最终形成规则集。最后给出了实验结果,证明了该方法的可行性和有效性。  相似文献   

20.
并行决策树算法的研究   总被引:5,自引:0,他引:5  
数据挖掘在科研和商业应用中正发挥着越来越重要的作用。随着数据量的增加,数据挖掘工具处理海量数据的能力问题显得日益突出。研究并行算法,是解决这个问题的有效途径。分类器是数据挖掘的一种基本方法,决策树是一种最重要的分类器。文章首先介绍了分类器中的决策树算法,然后设计了一种并行决策树算法,最后探讨了该并行算法在PVM系统下的实现。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号