首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
利用MODIS L1B 1km分辨率数据和NASA 的V5.2 气溶胶改良业务反演算法,对南京都市圈2013年9月至2014年1月期间的气溶胶光学厚度(AOD)进行反演,并运用AERONET地基气溶胶监测网的AOD产品对反演结果进行验证。然后,将经过验证后的AOD与国家环保部建立的国家空气质量自动监测点实测得到的PM2.5质量浓度和PM10质量浓度根据经典统计学进行线性回归性分析,并用气溶胶细模态光学厚度AODf和气象因子对PM2.5质量浓度与MODIS AOD之间的模型进行修正,修正后的模型为y=136.78+9.16x1-0.36 x2-3.98x3,R2=0.79,并应用该模型,证实气溶胶光学厚度可以用来对城市空气质量进行评价。  相似文献   

2.
张小胡 《现代信息科技》2023,(7):117-119+123
通过利用加州大学欧文分校数据库的心脏病数据集,通过建立logistic模型和决策树模型分析确诊心脏病的危险因素。采用ROC曲线和AUC面积作为标准来评价模型预测效果,结果显示两种模型对于数据的拟合都表现不错。与此同时两种模型显示胸痛类型、静息血压、荧光染色法测定的主要血管数和是否患地中海贫血症对于最终是否确诊心脏病有显著影响。  相似文献   

3.
基于随机森林回归分析的PM2.5浓度预测模型   总被引:1,自引:0,他引:1  
针对神经网络算法在当前PM2.5浓度预测领域存在的易过拟合、网络结构复杂、学习效率低等问题,引入RFR(random forest regression,随机森林回归)算法,分析气象条件、大气污染物浓度和季节所包含的22项特征因素,通过调整参数的最优组合,设计出一种新的PM2.5浓度预测模型—RFRP模型.同时,收集了西安市2013-2016年的历史气象数据,进行模型的有效性实验分析.实验结果表明,RFRP模型不仅能有效预测PM2.5浓度,还能在不影响预测精度的同时,较好地提升模型的运行效率,其平均运行时间为0.281 s,约为BP-NN(back propagation neural network,BP神经网络)预测模型的5.88%.  相似文献   

4.
人才是企业的核心竞争力,针对企业对员工离职意愿缺乏预见性,管理效果差的问题,提出将决策树模型应用于员工离职意愿预测。借助某企业的员工离职数据,通过特征探索,CART分类模型学习、参数调优等步骤搭建了模型。发现影响员工离职意愿的最主要因素是员工对企业满意程度。数据验证及ROC(AUC)曲线显示模型具有较好的实用价值。研究...  相似文献   

5.
软件可靠性建模是软件可靠性评估的主要方法之一。现在还没有一个可适用于所有软件项目的通用模型,所以可靠性模型的选择已成为一个重要的研究方向。决策树是数据挖掘的一种算法。文中首先介绍数据挖掘与软件可靠性模型选择的结合应用概念,然后重点分析决策树的生成算法。最后以一组数据仿真决策树生成过程,并验证此方法的可行性和准确性。  相似文献   

6.
C4.5算法是进行数据分类分析的经典决策树数据挖掘算法.本文介绍了决策树及其常用算法,并根据1971-2000年全国气象站点记录的数据信息,采用C4.5决策树算法建立全国积雪模型.通过积雪模型预测区域积雪分布情况的实验表明正确率达到83.96%,可以用于辅助遥感图像雪区检测进行判断决策.  相似文献   

7.
基于决策树的一种改进算法   总被引:2,自引:0,他引:2  
王静红  李笔 《电讯技术》2004,44(5):175-178
首先介绍了ID3算法的基本思想,然后讨论了决策树算法中的难点问题,针对ID3算法中所存在的不足,提出了一种利用优值法的思想来改进信息增益的算法,并且与ID3算法进行了实验对比。实验表明,这种方法从树的规模和分类精度都优于许多决策树算法,使决策效率明显提高。  相似文献   

8.
中国科教事业飞速进步,大学生数量越来越多,高校毕业生综合素质低、能力不足等问题越来越突出。创建与素质教育要求相符合,促进教师发展、学生成长以及提高教育教学质量的教育评估体系,是新课程改革中的重要任务。本研究基于大数据决策树的学生成绩预测模型,根据学生学习状态,间接建立成绩预测系统,以解决学生成绩预测困难、模型复杂等问题,通过研究发现,基于大数据决策树系统预测学生成绩精准率达到94%,对学生成绩的监控极为有利,而且也可预测学生成绩的提升。  相似文献   

9.
刘军 《微电子学与计算机》2012,29(1):109-112,116
针对完全以核属性为首选构建决策树算法的不足,本文以粗糙集的分辨关系为基础,提出以决策属性的分辨量和分辨类别两个参数确定条件属性的重要性,择优自顶向下构造决策树.该算法的优点在于算法简洁有效和时空复杂度低.实例分析的结果表明,该方法能获得更为简洁有效的决策树.  相似文献   

10.
钟蜜  刘斌 《信息技术》2011,(10):222-224,227
决策树分类方法是一种非常有效的机器学习方法,具有分类精度高、对噪声数据有很好的健壮性以及形成树状模式等优点,对决策树算法的优化也主要是从分支属性的选择标准,对决策树的修剪,以及引入模糊理论、粗糙集理论、遗传算法和神经网络算法等几个方面进行优化。引入粗糙集理论中的属性重要性原理来对决策树进行优化,首先计算出每个条件属性对分类的重要度,然后根据重要度大小来对样本集进行一个筛选,在不损害分类准确率的同时减小决策树的规模。整个算法在Visual C++6.0环境下编程实现,并应用于热轧工艺模型中,通过对热轧数据的处理,验证了算法的有效性。  相似文献   

11.
潘浩  蔺莉 《信息技术》2010,34(8):80-83
利用高校已有的毕业生就业信息,应用统计规律性和决策树数据挖掘理论,发现隐藏在毕业生就业信息后的信息,为学校根据社会需求变化而变更培养人才结构提供决策支持。  相似文献   

12.
目前网络环境日益复杂,传统的入侵检测效率较低,为提高网络入侵检测的效率和准确性,本文提出一种基于决策树算法的入侵检测模型.针对决策树算法准确性高、速度快和可以处理高维数据等特点,采用多种类型的决策树算法对入侵数据特征分析处理,对比效果,最后对网格搜索算法进行改进,提高网格搜索算法优化模型参数的效率.通过实验分析,在模型...  相似文献   

13.
针对海量数据中存在的造假与欺诈问题,文中提出了一种基于数据挖掘与改进决策树的数据分析算法来识别其中的异常数据。该算法将主成分分析法与改进决策树算法C4.5相结合,利用数据挖掘技术对海量数据进行预处理,并提取重要特征,通过加入信息增益率的改进决策树算法C4.5识别出异常数据。在海量医疗财务数据中进行的实验仿真结果表明,所提算法的准确率达到了96.91%,且其对数据的预处理操作也使算法的识别速度提升了1.25 s。同时还对各种机器学习算法与数据挖掘技术进行了对比,进而证明了该文算法的识别准确率最高,且与SVM算法相比提升了10.8%。  相似文献   

14.
随着"互联网+教育"不断发展,在线学习已成为人们关注的热点.基于在线学习的学习行为数据来预测学生学习成绩,从而用于提前干预学生学习,是目前亟须解决的关键问题.本文首先收集学生在线学习的高维行为特征数据,对行为特征数据预处理后进行相关分析;随之,采用决策树C4.5算法构造成绩预测模型,通过模型预测学生成绩,与实际成绩对比...  相似文献   

15.
基于决策树的分组分类算法因易于实现和高效性,在快速分组分类中广泛使用。决策树算法的基本目标是构造一棵存储高效且查找时间复杂度低的决策树。设计了一种基于规则集统计特性和评价指标的决策树算法——HyperEC 算法。HyperEC算法避免了在构建决策树过程中决策树高度过高和存储空间膨胀的问题。HyperEC算法对IP地址长度不敏感,同样适用于IPv6的多维分组分类。实验证明,HyperEC算法当规则数量较少时,与HyperCuts基本相同,但随着规则数量的增加,该算法在决策树高度、存储空间占用和查找性能方面都明显优于经典的决策树算法。  相似文献   

16.
针对群体智能优化算法具有随机性、盲目性、可编程性差的问题,提出了一种简单有效且不具有随机性的全局搜索算法,用于求解非线性规划问题。通过对每个决策变量的可行域离散化处理后得到的数据构建决策树,采用深度优先的规则对最优解进行搜索,搜索的同时用指数衰减函数调整搜索步长,从而逐步缩小搜索范围,直到结果收敛。算法不具有随机性,不需要编码、解码、交叉、变异等复杂操作,也不需要随机生成初始种群,可编程性强。对非线性规划的六个测试函数进行求解,并与文献中报道的结果对比,结果表明基于决策树的遍历搜索对解决非线性规划问题有效,对于多决策变量的复杂优化问题,采用分组搜索的策略既能保证求解精度,也能保证收敛速度。  相似文献   

17.
李颖 《信息技术》2022,(2):116-120,126
为了提高数据挖掘准确性和效率,文中提出了基于决策树算法的信息系统数据挖掘方法.以C4.5决策树算法计算属性的信息增益率和属性值的信息熵为基础,提出基于余弦相似度改进的C4.5决策树算法,若任意两个属性值的信息熵之差在阈值范围内,通过计算其余弦相似度合并在阈值范围内的属性值,并重新计算合并后属性的信息增益率,实现信息系统...  相似文献   

18.
资产识别是网络安全动态风险评估过程的首要环节,在基于层面的信息资产划分方法上,通过数据挖掘技术中的决策树算法,研究了信息资产识别问题。实现了数据挖掘技术在资产识别中的应用。在对C4.5算法的基本流程进行描述的基础上,以信息资产数据集中的操作系统为例,利用C4.5算法实现了对数据的正确分类,并进行了规则的提取,为以后进行资产识别提供了依据,并指明了今后该算法在信息资产识别其他方面的研究方向。  相似文献   

19.
为精准获取情绪量化识别结果,研究多元线性回归与决策树的情绪量化识别算法。利用多元线性回归模型获取情绪影响因素;通过分割相似度获取最优特征,将其作为最佳分类规则,按照最佳分类规则塑造最佳决策树;在求解信息熵时,由詹森不等式替换熵函数的上凸性,剔除邻近的匹配叶节点;将情绪影响因素输入改进决策树,输出情绪量化识别结果。实验证明:该算法的平均精确匹配率高达98%,平均绝对误差低至0.18,具备较优的情绪量化识别性能。  相似文献   

20.
本文针对如何提高研究生遴选质量、选拔出更多优秀生源的问题,提出一种基于决策树算法的研究生遴选质量评价方法。首先通过分析研究生生源学校以及初试和复试等招生信息,同时结合对研究生的课程学习成绩、参与科研项目情况、硕士毕业论文质量的跟踪,建立了适合于计算机专业研究生质量的评价指标。然后采用经典的ID3决策树算法对相关数据进行分析挖掘,以评价现有研究生招生体系中各项指标对研究生培养质量的影响,并通过统计学方法对结论进行逆向分析验证。结果表明在研究生入学考核的各项指标中,面试成绩和上机考试成绩在区分考生能力、优秀研究生遴选中具有关键作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号