首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
决策树算法在天气评估中的应用   总被引:1,自引:0,他引:1  
巩固  张虹 《微计算机信息》2007,23(34):245-247
分类算法是数据挖掘中的一个最重要技术.本文分析了决策树分类算法中的ID3算法和C4.5算法.利用它们建立天气评估的决策树模型.研究了该决策树模型在天气评估中的应用,分析了决策树算法应用于数据分类和知识发现的过程和特点.同时文章中也指出了分类算法的不足之处和待解决的问题。  相似文献   

2.
程克非  程蕾  黄永东 《计算机工程》2012,38(11):264-267
提出一种以J48决策树算法为基础的水质评价方法。通过分析K最近邻法、贝叶斯分类法、向量空间模型法等常用的水质评价方法,针对某地区2008年的水质监测数据,采用J48决策树算法和单因子污染指数法对该地区水质进行计算,并对水质分类数据进行分类、属性清理和J48决策树参数的选择,以此建立模型。实验结果表明,该方法的交叉验证率约为95%,具有较好的分类评估效果。  相似文献   

3.
处理连续属性离散化是决策树分类方法中C5.0算法在创建决策树时对数据表示空间的简化的一个重要问题,采用合理有效的连续属性离散化方法可以提高创建决策树的分类预测精度.在分析C5.0算法的离散化方法的不足之处后,提出一种改进Chi2算法的方法,能更合理更准确地对连续属性进行离散化,在此基础上创建的决策树具有更好的准确率.实验结果表明,基于改进方法的C5.0算法创建的决策树分类模型具有较高的分类准确率.  相似文献   

4.
属性频率划分和信息熵离散化的决策树算法   总被引:2,自引:0,他引:2       下载免费PDF全文
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的度量直接影响决策树分类的效果。基于粗糙集的属性频率函数方法度量属性重要性,并用于分枝划分属性的选择和决策树的预剪枝,提出一种决策树学习算法。同时,为了能处理数值型属性,利用数据集的统计性质为启发式知识,提出了一种改进的数值型属性信息熵离散化算法。实验结果表明,新的离散化方法计算效率有明显提高,新的决策树算法与基于信息熵的决策树算法相比较,结构简单,且能有效提高分类效果。  相似文献   

5.
基于粗糙集的决策树构造算法   总被引:7,自引:2,他引:5  
针对ID3算法构造决策树复杂、分类效率不高问题,基于粗糙集理论提出一种决策树构造算法。该算法采用加权分类粗糙度作为节点选择属性的启发函数,与信息增益相比,能全面地刻画属性分类的综合贡献能力,并且计算简单。为消除噪声对选择属性和生成叶节点的影响,利用变精度粗糙集模型对该算法进行优化。实验结果表明,该算法构造的决策树在规模与分类效率上均优于ID3算法。  相似文献   

6.
丁春荣  李龙澍 《微机发展》2007,17(11):110-113
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,分离属性的选择标准直接影响到分类的效果,传统的决策树算法往往是基于信息论度量的。基于粗糙集的理论提出了一种基于属性重要度和依赖度为属性选择标准的决策树规则提取算法。使用该算法,能提取出明确的分类规则,比传统的ID3算法结构简单,并且能提高分类效率。  相似文献   

7.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,分离属性的选择标准直接影响到分类的效果,传统的决策树算法往往是基于信息论度量的。基于粗糙集的理论提出了一种基于属性重要度和依赖度为属性选择标准的决策树规则提取算法。使用该算法,能提取出明确的分类规则,比传统的IDB算法结构简单,并且能提高分类效率。  相似文献   

8.
房立  黄泽宇 《微机发展》2006,16(8):106-109
构建决策树分类器关键是选择分裂属性。通过分析信息增益和增益比率、Gini索引、基于Goodman-Kruskal关联索引这三种选择分裂属性的标准,提出了一种改进经典决策树分类器C4.5算法的方法(竞争选择分裂属性的决策树分类模型),它综合三种选择分裂属性的标准,通过竞争机制选择最佳分裂属性。实验结果表明它在大多数情况下,使得不牺牲分类精确度而获得更小的决策树成为了可能。  相似文献   

9.
变精度粗糙集模型在决策树构造中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
针对ID3算法构造决策树复杂、分类效率不高等问题,本文基于变精度粗糙集模型提出了一种新的决策树构造算法。该算法采用加权分类粗糙度作为节点选择属性的启发函数,与信息增益相比,该标准更能够全面地刻画属性分类的综合贡献能力,计算简单,并且可以消除噪声数据对选择属性和生成叶节点的影响。实验结果证明,本算法构造的决策树在规模与分类效率上均优于ID3算法。  相似文献   

10.
煤矿瓦斯预警可视为是否安全的分类问题,数据呈现不平衡分布特点。为此,提出一种混合策略属性选择多决策树分类算法:算法融合代价敏感因子,结合C4.5和CART属性选择方法作为分裂指标,并采用了基于不同根节点信息的多决策树建树方法。首先采用11个非平衡数据集进行算法有效性验证,实验结果表明,该方法可以有效针对不平衡数据进行分类,保证高准确率的前提下,有效提高了少数类预测准确性;进而将该算法用于煤矿瓦斯数据预测,结果表明,所提出方法可以有效提高煤矿瓦斯数据的总体预测性能。  相似文献   

11.
危化企业的安全监控数据具有社会价值,对安全隐患进行实时精确的预测是预警研究的热点,本文从人、设备、环境和管理四个维度出发,对安全生产隐患预警的相关指标进行分析,构建隐患预警指标体系,在此基础上,构建了自底向上的基于支持向量机的决策树多分类预警模型,实现对安全等级的的准确分类并用于预警未来的安全生产状态,通过与自顶向下的多分类模型比较,证实本文所采用的预警模型具有较好的实时性和精确度,满足对预警模型的基本要求.  相似文献   

12.
在大数据时代,在城市复杂交通环境中,实现实时、准确的交通流预测,是实现智能交通系统的必要前提。提出了一种在Spark平台上基于梯度优化决策树的分布式城市交通流预测模型(distributed urban traffic prediction with GBDT,DUTP-GBDT);并提出了分布式情况下梯度优化决策树模型实现的优化方法,包括切分点抽样、特征装箱和逐层训练三种,提高了分布式情况下梯度优化决策树训练效率。基于Spark分布式计算平台高效、可靠、弹性可扩展的优势,以及梯度优化决策树模型准确率较高和时间复杂度较低的优点,利用时间特征、道路状况特征以及天气特征等特征参数,建立了DUTP-GBDT模型,实现了实时、准确的交通流预测。通过与GABP、GA-KNN、MSTAR等模型的对比,证明了利用Spark平台,DUTP-GBDT模型在分布式环境下准确率和训练速度方面均有所提高,符合城市交通流预测系统的各项要求。  相似文献   

13.
决策树模型是数据挖掘中最常用的一种方法,具有较好的分类预测能力,并能方便提取决策规则。基于相似性原理,以测试属性和决策属性的相似度作为启发规则构建决策树。提出了一种新的决策树生成算法。并在高校教师综合考评系统中采用了这种新算法,实验结果表明这种新的决策树生成算法预测精度较高,计算也比较简便。  相似文献   

14.
杨杨  赵政 《计算机应用》2006,26(10):2457-2459
针对公共危机应急系统数据库中数据庞杂,记录分类较难的情况,提出了一种采用遗传算法选择参数的模糊决策树算法,提高了决策树分类算法的准确率和得到规则的可解释性。将设计的分类器应用到实际的公安系统数据库当中,在对原有记录进行分类的基础上,得到了有效的规则,成功地帮助警务人员对当前的危急事件做出快速准确的预测和判断。  相似文献   

15.
基于粗糙集理论的决策树分类方法   总被引:1,自引:0,他引:1  
决策树是数据挖掘中常用的分类方法。本文提出了基于粗糙集的决策树方法,利用粗糙集近似精确度来选择决策树的根节点,分支由分类产生。该方法计算简单,易于理解。本文还提出用悲观剪枝法简化决策树,提高决策树的预测与分类能力。实例说明了本文方法均简单有效。  相似文献   

16.
建立了一种基于聚类分析与决策树分析相结合的服务订制预测模型,阐述了聚类分析K-means算法、决策树算法C5.0算法原理、建模流程的设计,将模型应用于某地区用户对有线电视交互服务的订制意愿预测,最终确定高响应率客户群.实验证明.该模型相对于仅通过决策树进行预测能更大程度地提高分类精度,并能更有效地识别出高响应率客户群.  相似文献   

17.
为解决山洪监测预警能力不足的问题,结合山洪成灾特点,在分析目前山洪监测预警系统存在主要问题的基础上,利用当前先进数字和物联感知技术,依托数据分析算法,采用水位和雨量模块化设计思路,设计和研发山洪监测声光电一体化预警系统。搭建以水位监测、雨量监测、视频监控、预警广播为一体的监测预警系统结构框架,能够显示实时水位、雨量等数据,根据水位和降雨量的预警阈值自行演算进行现地预警,并且能够将采集数据、图像及预警信息传输到云端。基于及时、准确、可靠的山洪监测声光电预警一体化系统,切实提高山洪灾害全天候、全过程的监测预警能力,在实践应用中预警系统适用于沟渠、河道等多种场景,具有实时监测数据准确、预警精度高、预见期足够、预警设备适用性强等优点。  相似文献   

18.
针对电信企业客户流失问题,提出采用贝叶斯决策树算法的预测模型,将贝叶斯分类的先验信息方法与决策树分类的信息熵增益方法相结合,应用到电信行业客户流失分析中,分别将移动公司的客户数据以及UCI数据纳入到模型中得出相应的结果。加入贝叶斯节点弥补决策树不能处理缺失值以及二义性数据的缺点。检验结果表明,基于贝叶斯推理的决策树算法在牺牲了较小的训练时间与分类时间的情况下,得到了比仅基于决策树算法更高的覆盖率与命中率。  相似文献   

19.
将C4.5决策树分类算法用于高职就业预测,并提取挖掘规则。对学生基本信息、各科考试成绩,以及就业信息进行处理,选取决策属性,构造决策树,由提取的规则,获得就业和学生成绩之间的关系,挖掘结果显示,该算法能将学习成绩属性和是否是学生干部属性进行正确分类,做出一定的就业预测,对辅助决策具有一定的帮助。  相似文献   

20.
以天气预报客户端设计为研究对象,首先阐述Android系统的四层架构,介绍各个层的功能;其次进行天气预报客户端设计,进行系统功能的整体规划,将天气预报客户端功能划分为天气预报、天气预警、专业气象和辅助服务四个模块,阐述每一个模块的具体功能;在此进行通信接口的设计,客户端的通信接口包括客户端与气象服务数据库的通信接口和与客户应用的通信接口;最后介绍客户端应用操作的流程。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号