共查询到18条相似文献,搜索用时 82 毫秒
1.
决策树算法是数据挖掘中一种非常重要的分类方法.决策树具有属性结构和较好的分类预测能力,提供了基本的提取决策规则.本文阐述了决策树算法的基本思想,并分析了决策树算法运用中会遇到的一些问题,并针对性的提出一些建议. 相似文献
2.
针对电信CRM中“数据丰富但知识贫乏”现象,提出数据挖掘技术,利用SUQ决策树构造算法建立一棵决策树模型,在CRM中根据客户的年龄、所属城市和性别对客户分类,预测客户类型,防止用户流失,争取新用户具有重要意义。 相似文献
3.
针对海量数据中存在的造假与欺诈问题,文中提出了一种基于数据挖掘与改进决策树的数据分析算法来识别其中的异常数据。该算法将主成分分析法与改进决策树算法C4.5相结合,利用数据挖掘技术对海量数据进行预处理,并提取重要特征,通过加入信息增益率的改进决策树算法C4.5识别出异常数据。在海量医疗财务数据中进行的实验仿真结果表明,所提算法的准确率达到了96.91%,且其对数据的预处理操作也使算法的识别速度提升了1.25 s。同时还对各种机器学习算法与数据挖掘技术进行了对比,进而证明了该文算法的识别准确率最高,且与SVM算法相比提升了10.8%。 相似文献
4.
为了更好地辅助决策人员进行空袭目标选择,首先分析了影响空袭目标选择的因素;利用Netica软件得到训练样本集;利用ID3算法构造决策树模型,并从中挖掘出空袭目标选择的14条规则;最后总结出目标选择遵循的6条指导原则。仿真结果表明,利用决策树进行空袭目标数据挖掘,准确率比较满意,是一种目标选择的新思路。 相似文献
5.
为精准获取情绪量化识别结果,研究多元线性回归与决策树的情绪量化识别算法。利用多元线性回归模型获取情绪影响因素;通过分割相似度获取最优特征,将其作为最佳分类规则,按照最佳分类规则塑造最佳决策树;在求解信息熵时,由詹森不等式替换熵函数的上凸性,剔除邻近的匹配叶节点;将情绪影响因素输入改进决策树,输出情绪量化识别结果。实验证明:该算法的平均精确匹配率高达98%,平均绝对误差低至0.18,具备较优的情绪量化识别性能。 相似文献
6.
在数据挖掘中,决策树方法是一个重点研究方向。ID3方法是著名的决策树算法,在这种算法中,互信息的计算依赖于特征值数目较多的特征,这样不太合理.为此,从离散度的角度,对ID3算法进行改进,通过2种算法的对比实验,证明利用改进后的算法挖掘分类规则,不仅提高了分类的正确率,而且非常高效。 相似文献
7.
基于决策树的一种改进算法 总被引:2,自引:0,他引:2
首先介绍了ID3算法的基本思想,然后讨论了决策树算法中的难点问题,针对ID3算法中所存在的不足,提出了一种利用优值法的思想来改进信息增益的算法,并且与ID3算法进行了实验对比。实验表明,这种方法从树的规模和分类精度都优于许多决策树算法,使决策效率明显提高。 相似文献
8.
利用高校已有的毕业生就业信息,应用统计规律性和决策树数据挖掘理论,发现隐藏在毕业生就业信息后的信息,为学校根据社会需求变化而变更培养人才结构提供决策支持。 相似文献
9.
决策树在数据挖掘中的新进展和发展前景 总被引:6,自引:0,他引:6
决策树是数据挖掘分类方法的一种。本文简单介绍了决策树及其生成过程和算法;着重叙述了决策树近年来在数据挖掘中的主要进展,探讨了各个方面的优缺点;讨论了目前决策树技术面临的挑战和发展前景。 相似文献
10.
为提高数据挖掘算法的挖掘速度,同时提高其精准度,提出基于电力营销聚类分析数据挖掘算法研究。首先运用聚类算法筛选数据,再计算数据结构和相异度矩阵相异度,得出最接近的类距离。完成上述步骤后,在聚类分析框架下,设计聚类分析数据挖掘算法流程。先输入数据,再设计数据挖掘算法基本策略,最后提出SLIO算法处理离散字段,得到有价值的数据信息。由此,完成基于电力营销聚类分析的数据挖掘算法设计。实验结果表明,与基于支持度-置信度-提升度的配网自动化系统数据挖掘算法和基于神经网络和粒子群优化的数据挖掘算法相比,文中基于电力营销聚类分析的数据挖掘算法的挖掘速度稳定,挖掘效果更好。同时测试精准度较高,可有效提高数据挖掘的可信度。 相似文献
11.
12.
针对工业光纤网络通信故障检测过程繁琐、效率低的问题,设计了一种基于优化的决策树数据挖掘算法的光纤网络通信故障检测系统。系统以减少检测器重复工作和准确定位为目标,引入以决策树为核心的故障数据挖掘模块,降低了对非己空间的故障挖掘时间。将第一阶光纤网络故障分类时仅以IP地址作为参量变成第二阶分类时使用指定的网络指标为基础构建决策树,进一步提高故障检测精度。对某车辆制造企业现有的光纤网络应用结果表明,与标准决策树方法相比,该算法将精度从69.0%提升到99.9%,将误报率从3.14%降低到0.48%,优化效果明显。 相似文献
13.
目前,大型企业信息系统规模和复杂度快速增长,但对故障的诊断分析仍主要依赖传统的人工经验,这不仅耗时、耗力,还影响对故障的及时处理.针对这一问题,创新性地提出了基于决策树的企业信息系统故障自动诊断分析方法,根据信息系统运行监控指标告警信息,实现对信息系统故障的自动诊断.利用某大型国有企业的实际生产运行数据,提取典型告警数据特征对该方法进行了验证,并在R语言环境下对决策树模型及其训练方法进行了仿真和对比分析.实验结果证明,该方法可以较为准确地实现故障自动快速诊断,有助于提高信息系统故障诊断分析效率. 相似文献
14.
15.
传统的网络购物只是对商品进行一个简单的分类和陈列,对于电子商务的商家并没有对网络消费者的购物数据进行深入研究探讨.针对网络购物过程中消费者选择商品的趋向性的不同,引入了基于决策树分类方法对网络客户购买商品的行为进行分析,并从决策树中挖掘出影响网络购物的主要因素以及各因素对网络购买行为的强弱影响程度.实验结果表明,此方法可以有效的对网络客户进行分类,有利于决策分析. 相似文献
16.
冠状动脉性心脏病简称冠心病,属于心脑血管疾病中的常见病,会严重地危害人们的身体健康,目前已经成为引发人类死亡的重大疾病之一。根据段富津教授历年来治疗冠心病病例中药方剂数据为研究样本,采用最普通常见的数据挖掘方法——决策树分类方法,从海量冠心病中医临床诊疗数据中高效地挖掘出蕴含数据中的潜在关联规则,最终将产生的关联规则恰到好处地应用于冠心痛的中医临床诊断中。 相似文献
17.
18.
本文针对大规模无线参数历史数据,以自学习的数据挖掘方法建立决策树智能分析模型,并对现网数据实现联机分析处理,是一种智能的主动发现无线参数配置问题的算法模型。 相似文献