首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对心血管介入患者全周期病理数据普遍存在缺失、不连续、非结构化等问题,建立了心血管介入专病数据库,并采用基于Relief-F算法的预测方法,对心血管介入患者术后死亡风险进行预测。首先参照HL7、CDISC等国际心血管疾病统一标准对各数据源进行标准化处理,建立研究数据集,并对数据进行清洗和预处理;其次采用Relief-F算法对特征进行选择,最终保留30个特征变量;再次选择逻辑回归、支持向量机、随机森林等3种机器学习方法进行建模分析,并采用10折交叉验证方法对分类器进行训练;最后引入准确率等模型评价指标来评估各算法在数据集上的分类预测效果。实验结果表明:随机森林的分类效果在该研究数据集上的表现最佳,准确率达到81.97%,精确率为86.90%,召回率为82.14%,F1值为0.8441。该研究提出的方法能够客观反映患者术后死亡风险,为心血管介入患者术后死亡风险预测提供了一种有效的解决方案。  相似文献   

2.
为适应优化算法的模型,用K近邻方法对数据进行预处理,提出了KNN-RF模型.对数据集用K近邻进行缺失补充,并进行归一化等预处理操作,以随机森林算法为基础,并采用交叉检验和网格搜索寻找最佳参数.在比较流行的UCI心脏病数据集和克利夫兰医学中心公开数据集分别进行实验,建立了心脏病预测模型,用于辅助医生对患者是否患有心脏病进...  相似文献   

3.
针对印第安皮玛族成年女性糖尿病数据集进行分类。将迭代随机森林与机器学习方法如随机森林、K最近邻、基于不同核函数的支持向量机、人工神经网络、Logistic回归、梯度提升机、决策树分类等作比较。分析了分类识别精度、查准率、查全率、度量、ROC曲线和AUC值等6个指标。通过实验发现,与上述其它7种分类算法相比,针对该数据集,迭代随机森林在这些性能指标上的表现是最优的。  相似文献   

4.
传统电力预测模型不能很好地将多种影响因素纳入考虑,也无法对关联因素进行筛选。针对该类问题,该文将信息论中的互信息及人工智能随机森林算法引入中短期用电量预测中。互信息可以根据多种变量与用电量间的平均互信息值大小辨识出关联性高的因素,不同产业可能高关联于不同变量。考虑不同关联因素,采用随机森林算法对不同产业进行针对性预测建模。以江苏省的用电量数据作为实际算例,并将上述方法与未采用互信息的方法以及未针对性分产业建模进行对比。仿真结果表明,上述方法具有科学性和有效性,且有较高的预测精度。  相似文献   

5.
基于随机森林算法的粮堆机械通风温度预测及控制研究   总被引:1,自引:0,他引:1  
为了研究粮堆机械通风温度与其影响因素之间的高维非线性关系,运用随机森林算法建立了预测模型,并用实仓实验数据验证模型的有效性,真实值与预测值的对比表明构建的随机森林模型预测精度较高。为了进一步说明随机森林模型的准确性和可靠性,将预测结果与支持向量机和BP神经网络模型对比。结果显示,随机森林预测模型的误差最小,回归拟合效果最优,可以应用于粮堆机械通风温度的预测。在此基础上,计算出了易调节因素的变化率与粮堆平均温度变化率之间的定量关系,以及粮堆平均温度达到低温条件的临界点集合,为科学地判断粮堆通风时机和温度的控制提供参考。  相似文献   

6.
以2011—2018年期间票房过亿的293部国产电影为样本,利用网络爬虫技术,从电影票房网、时光网、艺恩网、猫眼网以及微博选取电影观众评分人数、首日票房、首周票房、观众想看人数、明星的影响力、导演的影响力、编剧的影响力、制式、电影评分等因素为变量,选择其中的30部电影为测试集,263部电影为训练集,基于随机森林回归的方法,建立电影票房预测模型。研究结果表明,电影票房平均预测精度在85%左右。  相似文献   

7.
通过网络爬虫获取天气数据,并结合金华市用户负荷数据,采用深度随机森林算法对用户负荷进行短期预测。借助4种评价指标,通过对比支持向量回归算法、K近邻算、贝叶斯岭回归算法、随机森林算法以及多个深度神经网络算法,发现深度随机森林算法预测效果最佳,支持向量回归算法次之,而深度神经网络算法在该数据集上表现一般。  相似文献   

8.
《焦作工学院学报》2022,(1):136-142
股票数据具有非线性和复杂性等特点,单一模型预测效果不佳,针对此问题,提出一种RF-LSTM组合模型,用于预测股票的收盘价。首先,利用Tushare财经数据包获取股票数据,构建特征集,并对数据进行归一化处理;其次,考虑到多特征之间存在高度的非线性和信息冗余问题,利用随机森林(RF)选择最优特征集,降低数据维度和训练复杂度;最后,利用深度学习中适合处理时间序列的长短期记忆网络(LSTM)对股票价格进行预测,并对预测模型进行参数调优。结果表明,与单一结构的LSTM神经网络模型预测相比,本文提出的RF-LSTM组合模型预测的平均绝对误差(MAE)、均方误差(MSE)和均方根误差(RMSE)分别减小了13.11%,6.70%和12.54%。该组合模型可提高股票价格预测的准确性。  相似文献   

9.
该文分析了国内外近视检查数据,统计结果显示中国青少年近视发生率远远超过国际水平,其中8~12岁是近视新增的高发时期,平均每年约有20%的非近视学生转为近视学生,而10~14岁是高度近视新增的危险时期。此外,父母近视情况和户外活动时间对近视形成的影响最大,高于电脑使用时间和看电视时间的影响。该文采用5种集成学习方法对未来视力情况进行预测,综合考虑鲁棒性和精确度,随机森林模型预测效果最好,其中近视的预测准确率在70%训练集、30%测试集划分的情况下为92.8%。  相似文献   

10.
高速公路施工区合流冲突风险阈值界定及交通冲突量预测   总被引:1,自引:0,他引:1  
分析了高速公路施工区合流行为特性,以行车速度与合流角度作为合流交通冲突的表征参数,以冲突时间作为合流冲突风险的度量指标,建立了高速公路施工区合流冲突风险计算模型,确定了高速公路施工区不同安全状态的合流冲突风险阈值.运用灰色理论建立了高速公路施工区合流冲突预测的GM (1,1)模型,并通过合流冲突调查样本数据对该模型进行验证.结果表明:不同安全状态下的高速公路施工区合流冲突风险阈值危险、中等、安全分别为(∞,5) km/h、(3.55,5]km/h和(0,3.55]km/h;GM (1,1)高速公路施工区合流交通冲突量预测模型有效、可靠,满足精度要求.  相似文献   

11.
概率分析法是企业进行风险决策的一种主要方法,利用它可以计算出各方案的风险程度,有产地预测、控制财务风险,降低风险损失。本文通过对概率分析法在企业财务风险预测中的应用研究,主要目的在于推动该方法在企业管理实践中的应用,以使企业的经营决策更趋于科学化、合理化、准确性。  相似文献   

12.
为了有效降低传感器网络安全风险等级,提出了基于最小二乘支持向量机的传感器网络安全风险预测方法.收集传感器网络安全风险数据,采用最小二乘支持向量机对数据进行训练,建立风险预测模型,根据预测的网络安全风险等级值对传感器网络实施控制.结果表明,该方法的传感器网络安全风险预测误差较低,控制效果较为理想,可以为传感器网络的安全稳定通信提供保障.  相似文献   

13.
为识别客滚船航行风险因素,有效预测客滚船航行过程中的航行风险。首先通过历史数据库和相关船舶事故报告识别客滚船航行风险因素,基于识别到的航行风险因素构建故障树模型。然后通过构建的故障树模型确定静态贝叶斯网络结构,引入马尔可夫模型将静态贝叶斯网络结构转化为动态贝叶斯网络结构。最后利用构建的动态贝叶斯网络结构结合琼州海峡徐闻港-新海港客滚航线进行实例分析,计算后验概率预测客滚船航行风险,从而实现客滚船航行风险的预测。结果表明,琼州海峡客滚船航行风险6个时间片的后验概率分别为0.464 0、0.512 3、0.545 7、0.568 8、0.584 9、0.596 1。敏感性分析表明,管理因素对客滚船航行安全的影响程度最大。  相似文献   

14.
变电站防汛风险概率的准确预测对提高电网防汛能力、健全汛情预警系统有着重要意义。变电站防汛影响因素不仅有动态气象数据,还有变电站集水井容积、水泵排水量、防汛物资储备及地势、水文特征等静态数据,动静结合给防汛风险预测带来困难。作者提出一种多因素融合的变电站防汛风险概率预测方法。首先对变电站多维防汛数据进行预处理及特征优选;然后利用优选的自回归循环神经网络(Autoregressive recurrent neural network, DeepAR),构建防汛风险概率预测模型,并通过注意力机制加强模型对多维防汛动态气象数据时序特征的挖掘能力,同时采用动态L2正则化策略加强对多维防汛数据的适应性,提高模型泛化能力;最后在实际站点数据上的实验表明,相较于主流机器学习和深度学习预测算法,文中算法预测结果更准确,为变电站防汛风险预警奠定基础。  相似文献   

15.
径流中长期预测是水利水电工程设计、施工和运行管理的重要依据,而预报因子的选取和预报模型的构建一直是径流中长期预测的两大难点。本文以宜昌站1951—2013年汛期流量资料为例,根据国家气候中心74项环流特征量,分别构建了基于相关系数法和随机森林算法的径流预测遥相关模型,并且对比了依据不同的相关系数和因子选择数目对预测精度的影响。结果表明,相较于传统的相关系数法,基于随机森林算法的预测模型的稳健性与预测精度均可大大提高。研究内容可为三峡水库中长期径流预报及中长期调度计划制定提供技术支撑。  相似文献   

16.
为建立隧道施工穿越冲沟段塌方风险的预测模型,统计分析了200例隧道塌方事故,总结出影响隧道塌方的11大风险因素,将各因素归纳为工程地质、水文地质、勘察设计施工等三大指标,并对其进行分解,建立山岭隧道的塌方风险评价体系,利用突变理论对隧道塌方风险进行风险评估.应用该模型对某隧道施工穿越冲沟地段进行塌方风险预测,结果能较好反映该工程实际情况,研究成果能够为类似隧道工程塌方风险管理提供依据.  相似文献   

17.
基于粗糙集理论,提出了加注系统风险预测模型:首先,应用属性约简算法,将加注系统风险源权重的确定问题转化为粗糙集理论中属性重要性的评价问题,通过计算得到加注系统各风险源的权重,从而使加注系统风险源权重的确定更具客观性和合理性;其次,采用BP人工神经网络的自学习功能,建立一个加注系统风险预测模型,将相对约简的风险源作为系统输入,可较好地提高预测模型的效率。实例表明,该模型具有良好的扩展性和较低的运行开销。  相似文献   

18.
风电功率的准确预测是减少风电并网对电网造成冲击的有效手段之一。利用深度学习算法中的长短期记忆网络(LSTM)对中期风电功率出力进行了预测,综合考虑功率数据、气象数据等多维特征,采用LSTM算法和随机森林(RF)算法搭建预测模型,预测风电场1~7日的风电功率出力。基于某风电场2014年1月到2016年12月的实际发电数据,通过实验对比BP神经网络、支持向量机(SVM)和自回归积分滑动平均模型(ARIMA)等算法可知,提出的预测方法在较为突变的天气状况下仍能保持较高的预测精度,能为风电并网和电网调度提供辅助支撑。  相似文献   

19.
基于形态学属性断面 (MAP) 和随机森林 (RF) 分类器, 提出了无监督合成孔径雷达 (SAR) 图像变化检测方法.首先, 利用MAP算法提取差异图像的几何结构特征, 构造深入描述图像结构化信息的特征向量空间;然后, 在结合阈值法和偏移因子自动选取训练样本的基础上, 用RF分类器在多维特征空间中对图像进行变化与否的判别;最后, 利用数学形态学方法对虚警进行滤除.实验结果表明, 与传统的基于阈值的变化检测方法相比, 该方法不仅能很好地检测出变化区域, 而且具有更高的检测精度.  相似文献   

20.
在考虑交通流量为随机过程的情况下,根据实际观测得到的交通流量,运用灰色预测模型、神经网络等方法,预测将要发生的交通流量数据.然后,根据以前相应的交通流量数据计算出预测结果的波动范围.最后,提出了解决交通拥堵的方案.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号