首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
随着人工智能技术的快速发展,机器学习被广泛应用于各行各业,并在多个领域都取得了较好的成果.房价是一个影响因素复杂的热点问题,难以对其做出全面准确的预测.因此,本文尝试在一个相对稳定条件下将相关的机器学习算法应用于房价预测中.本文首先对数据进行缺失值处理、样本的因变量相关分析及标准化处理等一系列预处理,然后结合互联网数据和机器学习中的XGBoost算法对数据集进行建模和训练,最终实现对房价的精准预测.  相似文献   

2.
为解决岩爆数据集中存在离群值、强烈岩爆数目少,导致强烈岩爆预测准确率较低等问题,提出LOF(local outlier factor)与改进SMOTE(synthetic minority oversampling technique)算法组合的方法。首先搜集国内外305组岩爆案例构建原始岩爆数据集,使用平均化处理法对数据集进行无量纲化处理;其次用LOF算法剔除各岩爆等级中的离群值,改进SMOTE算法在强烈岩爆样本与中等岩爆样本边界处增加强烈岩爆样本数目,增加少数类样本数目,在数据预处理阶段改善数据集结构;最后用6种常用机器学习模型分别对原始岩爆数据集和预处理后的岩爆数据集进行预测,验证预处理过程的有效性。结果表明:经过预处理后的岩爆数据集,整体的岩爆预测准确率平均提高18.35%,强烈岩爆预测准确率平均提高44.55%。因此基于LOF与改进SMOTE算法组合对岩爆数据集进行预处理,改善岩爆数据分布结构,能有效提高强烈岩爆预测准确率。  相似文献   

3.
确定燃气管道安全风险大数据预警模型采用怀卡托智能分析环境。确定数据预处理流程,包含原始数据的获取、数据清洗、特征变量确定与提取、缺失值填补、训练样本的选取。指出内部因素数据为管龄、管材、管径、压力级制、埋深、管理单位,外部因素数据为铁路、地铁等电气化轨道、水系面(河流与湖泊)等影响管道腐蚀的3类。从数据库中随机提取正样本1份,负样本4份,每份各855个样本点。将训练数据集分成3组:训练样本1、训练样本2、训练样本3,组成分别为正样本+负样本1,正样本+负样本2,正样本+负样本3。确定缺失值填补采用KNN算法。选择决策树C4.5、随机森林、贝叶斯网络、朴素贝叶斯、支持向量机和逻辑回归6种算法作为预警模型训练算法。根据选择的算法,同时考虑内外部因素的影响,进行预警模型训练(即实验)。根据实验结果比较分析,选出随机森林为最优算法。同时考虑内外部因素比仅考虑内部因素,模型准确率提高5.07%。  相似文献   

4.
岩爆是地下工程面临的一个巨大灾害,岩爆预测可以降低岩爆带来的危害。机器学习是岩爆预测方法的研究热点和发展方向,但现阶段各机器学习算法表现不同,并且相互独立工作,没有融合,不能优势互补,导致各机器学习算法的准确率、泛化性和稳定性较低。本文采用Stacking集成算法,融合现阶段使用较多的8个机器学习算法(4个集成算法和4个基本算法),充分发挥各算法的优势,实现优势互补;为保证新特征信息具有多样性,结合各种机器学习算法的原理和岩爆样本库的特点,提出3组考虑多个岩爆预测指标的Stacking集成算法,每组算法拥有不同基模型和多个元模型,解决了传统Stacking集成算法接受特征信息受限和元模型选择困难的难题。对比分析各组Stacking集成算法与独立算法的准确率、精确率、召回率和F1值,结果表明构建的Stacking集成算法可以有效融合各机器学习算法,预测性能显著提升。在3组Stacking集成算法中,Stacking集成算法二的基模型由Random Forest Classifier,Extra Trees Classifier,Gradient Boosting Classifier和L...  相似文献   

5.
《Planning》2019,(18)
本文运用了随机森林、SUV、Logistic回归、决策树、朴素贝叶斯、KNN、BP神经网络等机器学习算法对交通路况、环境情况进行分类预测,并从中对比得出分类预测的最优算法。综合考虑得到的景区客流量、交通路况以及环境情况等预测数据,提出对某一景点是否推荐假期出行的建议。  相似文献   

6.
为了更精确地对岩爆倾向等级进行预测,根据岩爆的成因和特点选取了围岩切向应力,围岩切向应力和单轴抗压强度的比值,岩石脆性指数和岩石的弹性变形能量指数作为岩爆倾向等级预测指标,然后运用改进的CRITIC算法对指标样本进行加权处理,在此基础上引入新的机器学习算法XGBoost对样本进行计算训练,最终建立岩爆倾向等级预测的CRITIC-XGB模型。运用该模型对收集的岩爆实例进行了岩爆倾向等级预测,并将预测结果与XGBoost、随机森林(RF)和支持向量机(SVM)算法的预测结果进行分析研究。研究结果表明:CRITIC-XGB预测模型较单一的XGBoost模型的收敛性能有较为明显的提高;CRITIC-XGB预测模型较单一的XGBoost算法、RF和SVM算法,有更高的预测准确性,为岩爆倾向等级预测提供了一种新的可靠方法。  相似文献   

7.
在电网的建设中,合理的施工方法不仅能够有效地降低成本、减少工期,并可在很大程度上减少施工过程中的风险,因此,提供一个能够合理预测电力隧道施工工法的系统显得尤为重要。本研究采用决策树、随机森林、XGBoost、KNN和BP神经网络5种机器学习算法对电力隧道开挖工法进行预测。以全国10余个省、市电网所提供的电力隧道工程工法应用情况为基础,整理出855条数据集,包括7个影响开挖工法的参数,并将75%的数据用于训练预测模型,25%用于验证。最后将预测结果和真实值进行比较,发现决策树、XGBoost与BP神经网络在电力隧道开挖工法方面的预测效果要优于随机森林和KNN算法。最终在此基础上设计出可以智能推荐开挖工法的软件。  相似文献   

8.
邬峻 《风景园林》2020,27(5):11-29
本研究系统地调查了"第四次工业革命"背景下大数据爆炸给传统研究范式带来的挑战和机遇。以荷兰智慧城市宜居性预测模型为例,引入数据密集型的"第四范式"新研究方法。首先从传统研究范式和宜居性研究现状出发,收集与人居环境宜居性相关的变量和可用的多源数据集。然后执行必要的数据清理、数据工程、数据特征提取方面的工作流程,使收集到的原始数据能够满足机器学习的基本要求。随后在机器学习的反复实验中,选用监督式机器学习关于多级目标预测的2个通用算法:多类别决策丛林和多类别决策森林,经过比选和优化得到最优算法。然后,将这种最优算法部署到云计算环境中生成智能预测工具箱,以监测和预先干预荷兰人居环境的宜居性。研究表明,与传统研究范式相比,尖端的人工智能技术和基于"第四范式"开发的新兴机器学习算法确实在知识发现、定量分析、知识快速更新和预测研究中具备独特优势。该范式在处理未来智慧城市中更大量、多样、精准、快速的研究数据集时将更加高效并更具创新前景。  相似文献   

9.
含不连续面的岩样断裂行为难以量化表征和有效精准预测。采用机器学习方法建立预测含胶结充填裂隙岩样I型断裂韧度和裂纹扩展模式的数据驱动模型。首先,通过含充填裂隙半圆盘直切口试件的三点弯试验和离散元数值模拟结果,对比验证批量模拟的可行性,再进行批量随机数值模拟,构建数据集并过滤异常算例。对数据集进行归一化、随机打乱、随机欠采样等预处理,建立4个经典机器学习模型,采用网格搜索与五折交叉验证算法搜索最优超参数,并采用多个建立在总体上的评估指标和反映误差分布的数据图对模型性能进行综合评估,得出多层感知机模型为预测精度最高的机器学习模型;对模型进行敏感性分析,并应用于试验数据的预测,结果表明多层感知机模型的稳定性和预测效果较好。此外,该研究还开发了用户界面程序用于含充填裂隙岩样断裂行为的批量预测,避免传统试验和数值模拟高昂的时间成本,为解决传统岩石力学问题提供新的方法和思路。  相似文献   

10.
为准确预测岩爆灾害,将Boosting,Bagging,Stacking,Voting四大集成学习运用到岩爆灾害预测中,比较普通机器学习算法、Boosting与Bagging预测性能,提出一种Stacking与Voting的基模型选取方法。首先,搜集275组国内外岩爆案例构建原始岩爆数据集,通过对原始岩爆数据集中不同岩爆等级的统计参数进行分析,以及使用TSNE(t-distributed Stochastic Neighbor Embedding)算法将原始岩爆数据集进行降维可视化分析,可知原始岩爆数据集中存在大量离群点并且数据不平衡。其次,先后使用Yeo-Johnson变换与K-means SMOTE过采样将数据正态化与平衡化,分别减少离群点以及数据不平衡的影响。正态化并且平衡化后岩爆数据可分性增强。然后,对包含普通机器学习,集成Boosting,集成Bagging的15种机器学习算法进行训练预测,通过宏平均的精确率以及Friedman统计假设检验比较各类模型的预测性能。最后,提出一种多样性与精确率权重融合的Stacking与Voting岩爆烈度分级预测方法。使用穷举法依次剔除精确率...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号