首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
《Planning》2015,(23)
本文以现代人才管理和现有的数据库挖掘理论为指导,研究基于数据挖掘和决策树技术,结合某高职院校毕业生管理数据,提出C4.5的决策树算法在毕业生管理系统中的应用。本文对实验过程中产生的毕业生特征分析决策树模型和分类规则做了详细的介绍,发现决策属性在毕业生就业特征类别的决定性作用,以此为高校领导层提供决策支持,提高业务水平、完善的培训机制,对高校课程的开设和毕业生管理指导工作具有一定的意义。  相似文献   

2.
《Planning》2019,(2):26-29
数据挖掘技术的飞速发展为高校研究人员提供了一种实证研究的手段。很多高校研究员在高校教学、科研、实习、就业等方面开展数据挖掘的应用研究,对提高高校的教学管理水平、科研水平、毕业生就业率等方面都起到了很好的指导作用。本文以计算机专业为例,采用数据挖掘中的决策树算法,实现了毕业生成绩数据和就业数据的整合研究,并给出了毕业生精准就业的路径。首先实时抽取教务处学生成绩数据与就业中心毕业生回访数据建立学生数据中心,然后采用决策树算法对数据中心的学生各个维度的数据进行分析,找出影响学生就业的各科权值,通过计算加权平均数得出在校学生的能力指标分数。该分数可以为在校学生就业推荐提供参考依据,能够有效地实现毕业生的精准就业。  相似文献   

3.
《Planning》2014,(20)
随着计算机硬件和软件的飞速发展,尤其是数据库技术与应用的日益普及,人们面临着快速扩张的数据海洋,如何有效利用这一丰富数据海洋的宝藏为人类服务,业已成为广大信息科技工作者所重点关注的焦点之一。为有效解决这一问题,自20世纪80年代开始,数据挖掘技术逐步发展起来。而分类作为数据挖掘中的一个重要的方法,目前的研究在商业上应用最多。决策树算法是分类的一种重要方法,同时也是一种典型的数据挖掘技术。本文分析了决策树方法的优缺点,同时也阐述了决策树方法在各个领域的研究进展。  相似文献   

4.
《Planning》2014,(5)
通过介绍数据挖掘的概念和决策树分类方法,论述决策树技术中ID3算法的基本思想和改进方法,并用该算法对高校招生录取数据进行分析,建立基于改进决策树方法的高校招生决策应用研究模型,并运用模式匹配算法及朴素贝叶斯方法进行验证,分析出影响考生报到的潜在因素,为提高报到率提供参考依据。  相似文献   

5.
《Planning》2015,(6)
根据Fayyad的研究成果,对C4.5算法的连续属性离散化过程进进行了改进,提高了分类准确率和计算速度。针对所调研的学生学习成绩和就业信息数据,利用改进后的C4.5算法进行数据挖掘,分别构建了学生学业成绩模型和就业分析模型。该模型分析结果显示,学校培养的人才和企业需求的人才之间存在差异,影响了大学生的就业。所建模型为有效地分析大学生就业失衡的原因提供了帮助,也为学校制订科学合理的人才培养方案提供决策辅助。  相似文献   

6.
对于一个城市尺度的居民用气、用水数据系统,其数据量之大通常是人力无法或难以处理与分析的,往往需要借助于数据挖掘技术。基于天津市某城区3个小区用户2 a的用水、用气数据,采用数据标准化、基于临近性检测、箱线图等数据挖掘方法,对用户数据进行了用能异常、邻月用能数据变化异常等检测,并横向比较了3个小区的总体用能水平。结合问卷调研数据,提出了通过信息增益理论及C4.5决策树等数据挖掘算法建立用户用能水平与用户特征及用户行为间的关联关系的方法。本文的研究工作展示了从建筑用能数据中提取有效信息的过程,可为建筑能耗数据管理平台构建和应用提供新思路。  相似文献   

7.
《Planning》2016,(5)
针对原有岩性分类方法精度较低、泛化能力不足、结果较不稳定以及不符合地质情况的事实,提出基于谱聚类-Adaboost集成算法的数据挖掘技术,应用谱聚类算法对噪音数据不敏感及可收敛到全局最优解的特点,解决样本数据过滤的问题,有效去除数据冗余;依据数据挖掘集成思想中的Adaboost集成算法对基分类器C4.5进行集成优化,将弱分类器提升为强分类器,提升分类能力。通过对某地区498块致密砂岩岩样资料进行处理,结果表明:谱聚类方法的样本筛选能力较交会图方法与经典聚类方法更强;而Adaboost集成算法不仅精度较BP神经网络等经典分类算法高,而且具有着较强的泛化能力,较好地解决了基分类器存在的稳定性弱、泛化能力差等问题;利用谱聚类去除样本冗余-Adaboost集成算法判别的思想使得算法的稳定性更高,岩性判别率稳定到81.96%,明显高于其他判别方法;该方法思路新颖,效果较好,可以进行推广。  相似文献   

8.
《Planning》2020,(4)
决策树是数据挖掘领域的经典算法,应用领域非常广泛。在信用评价任务中,数据之间存在关系,而传统的决策树算法无法解决这类问题。有决策树的提出有效地解决此类问题,能够从中发现新的知识,然而很多任务中属性与决策存在单调关系,并且样本之间无法比较,这影响有分类器的性能。因此,文章提出一种改进的有决策树算法(Rank-DT)并应用于信用评价任务中,实验证明提出的算法改进传统决策树算法的性能,获得较好的效果。  相似文献   

9.
《Planning》2017,(7)
分析影响提水量的主要因素,以入库泵站运行周期能源单耗最小为目标函数,对历史资料进行优化调度得到水库提水调度数据集,采用决策树C4.5算法从中提取提水调度规则决策树。丁东水库的实例表明,提水调度规则决策树的调度结果相较于实际调度,具有提高供水保证率和泵站效率以及减少能源消耗的优点;相较于遗传算法,具有操作性强的优点。  相似文献   

10.
提出一种基于事件检测的住宅用电负荷非侵入式识别方法。改进滑动窗双边累计和事件检测方法中确定事件发生阈值的设定措施,并在程序能够检测事件发生时刻的基础上,进一步提出事件发生后进入稳态时刻的检测方法。在负荷识别问题中,提出采用C4.5决策树算法和最近邻法结合的分类分层负荷识别算法。经过试验验证,事件检测算法和负荷识别算法均取得良好的负荷识别效果。  相似文献   

11.
To sustain acceptable indoor air quality in a building, it is essential to frequently inspect and clean the Heating, Ventilation and Air-Conditioning (HVAC) ductwork. Nowadays the condition inspection is mostly conducted manually according to the video acquired by a pipeline robot. This situation has been significantly resulting in subjectivity, high-cost and inefficiency for HVAC ductwork cleaning and maintenance.In this paper an automatic defect and contaminant inspection system of HVAC duct is developed. The system consists of an infrared-CCD diagnosis device and a novel supervised method for duct inspection by cascading seeded k-means and C4.5 decision tree. The seeded k-means feature-clustering method first partitions the features of training instances into k clusters using Euclidean distance similarity. C4.5 decision tree is then used to refine the decision boundaries by learning the subgroups within the cluster. Finally the decisions of the k-means and C4.5 methods are combined to achieve the inspection results. To improve the classification performance on the minority classes as well as reduce the computation load during the process, Tabu search is employed for the feature selection and the cost-sensitive function is introduced into Tabu search. Experimental results on real-world data sets demonstrate that the proposed system is effective and efficient in inspecting the condition of HVAC ductwork.  相似文献   

12.
波密县地处西藏东南部,地貌地质环境特殊,滑坡灾害频发。本文选取地层岩性、边坡高度、边坡角度、坡面走向、水系距离和植被覆盖度作为评价因子,通过ArcGIS提取滑坡灾害评价因子相关数据,并利用C4.5算法建立的决策树分类模型对研究区域滑坡灾害的风险性进行了定量评估。结果表明:该模型总体预测精度达到89.7%,有效预测精度高达96.2%。表明该模型具有较高的精度和置信度,为波密县滑坡灾害的预测性分析提供参考。  相似文献   

13.
利用ETM+高分辨遥感数据对甘蔗监测的研究,在遥感数据中提取甘蔗空间分布信息,同时进行面积估算。在分区范围内采用决策树分类和监督分类相结合的方法,取得了理想的效果,以供读者学习和参考。  相似文献   

14.
周智勇  东启亮  韦锐  贺军亮 《矿产勘查》2019,(10):2660-2666
矿山环境提取一直是遥感技术在矿山调查监测和治理应用中的重要环节。采用国产高分二号遥感数据,基于面向对象的分类方法,对山东省招远市北部花岗岩矿区独特的光谱特征和纹理特征进行分析,找出合适的特征参数并确定其阈值,从而构建决策树算法实现了研究区露天花岗岩矿山边界的自动提取,提取总体精度达到86.29%,Kappa系数达到0.807。  相似文献   

15.
为了能够更加方便、快捷和准确地采用分类方法对遥感影像进行分类,对lsodata分类法、最大似然分类法以及决策树分类法这三种遥感图像分类方法进行了机理分析,并以阜新TM遥感影像作为实验数据,对这三种方法进行实验数据比较分析,实验数据表明决策树分类法精度最高,不仅能有效利用地物的光谱信息,而且增强了地物非光谱信息对分类结果的作用。  相似文献   

16.
基于数据挖掘技术的黄土分类问题研究   总被引:1,自引:0,他引:1  
依据数据挖掘技术,采用分类回归树决策树和概率神经网络对黄土的分类规则进行挖掘。利用主成分分析法对数据进行了清洗和降维处理,以处理后的新变量作为挖掘对象,使挖掘出的分类模型和规则得到了简化,提高了计算精度;同时归纳出了影响黄土分类的因素,所挖掘出的分类规则可用于黄土地层的智能划分。研究结果表明,挖掘出的知识具有良好的实用性。  相似文献   

17.
Pipe failure modelling is an important tool for strategic rehabilitation planning of urban water distribution infrastructure. Rehabilitation predictions are mostly based on existing network data and historical failure records, both of varying quality. This paper presents a framework for the extraction and processing of such data to use it for training of decision tree-based machine learning methods. The performance of trained models for predicting pipe failures is evaluated for simple as well as more advanced, ensemble-based, decision tree methods. Bootstrap aggregation and boosting techniques are used to improve the accuracy of the models. The models are trained on 50% of the available data and their performance is evaluated using confusion matrices and receiver operating characteristic curves. While all models show very good performance, the boosted decision tree approach using random undersampling turns out to have the best performance and thus is applied to a real world case study. The applicability of decision tree methods for practical rehabilitation planning is demonstrated for the pipe network of a medium sized city.  相似文献   

18.
胡琨菠  周亦  李军英 《矿产勘查》2019,(9):2440-2445
文章以天津市为研究区,以GF-1 WFV为遥感数据源,选取了该区2016年主要农作物——冬小麦生长关键期影像,结合地面实地调查样方数据,综合运用RS、GIS等技术,采用决策树分类法提取了天津市冬小麦的空间分布数据,并利用混淆矩阵法对分类精度进行了验证,为其他地区农作物空间分布遥感调查提供借鉴意义。  相似文献   

19.
Abstract: Debugging of the input data of a structural analysis program is a troublesome task which is heavily dependent on empirical knowledge. The paper describes an effort that applies machine learning to build an expert system for debugging faults in structural analysis program input data. ID3 decision tree induction algorithm is employed to build the automatic learning mechanism. This method Oflkrs an attractive potential for knowledge acquisition in the civil engineering domain in which expertise plays a dominant role. This paper is novel in at least three aspects: (1) machine learning is employed to build expert systems automatically; (2) a novel impurity function is proposed for splitting the decision tree; (3) a formulated comparison is proposed for evaluating learning results.  相似文献   

20.
Clarifying traffic flow phases is a primary requisite for applying length‐based vehicle classifications with dual‐loop data under various traffic conditions. One challenge lies in identifying traffic phases using variables that could be directly calculated from the dual‐loop data. This article presents an innovative approach and associated algorithm for identifying traffic phases through a hybrid method that incorporates level of service method and K‐means clustering method. The “phase representative variables” are identified to represent traffic characteristics in the traffic flow phase identification algorithm. The traffic factors influencing the vehicle classification accuracy under non‐free traffic conditions are successfully identified using video‐based vehicular trajectory data, and the innovative length‐based vehicle classification models are then developed. The result of the concept‐of‐evidence test with use of sample data indicates that compared with the existing model, the accuracy of the estimated vehicle lengths is increased from 42% to 92% under synchronized and stop‐and‐go conditions. The results also foster a better understanding of the traffic stream characteristics and associated theories to lay out a good foundation for further development of relevant microscopic simulation models with other sensing traffic data sources.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号