首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
氨基酸变异常常会影响蛋白质的结构和功能,进而导致疾病。当前,研究者们已经提出了一些基于计算的方法来预测氨基酸变异致病性。该文构建了一个新型融合模型,旨在提高预测性能和泛化性。首先,提取影响致病性的各类生物特征并用递归特征消除RFE方法筛选最优特征子集。然后,建立包含卷积神经网络和双向长短期记忆神经网络的深度学习模型提取特征,并以拼接的方式融合这两类特征作为模型输入。最后,构建一个基于XGBoost、CatBoost、LightGBM和随机森林的融合模型,用以预测氨基酸变异致病性。该融合模型的10重交叉验证准确性为92.8%,盲测准确性为93.1%,取得了当前最高的预测准确性和泛化性。该工具可用于辅助临床诊断和药物设计,降低研发成本。  相似文献   

2.
针对采用参数法进行武器系统费用估算时,往往需要从大量的特征中选择最优的特征子集,而人工选择特征的方法费时费力的问题,采用粒子群优化算法对支持向量机进行封装的方法选择特征子集,在建模过程中,将特征变量以及支持向量机模型的参数共同组合成待优化的自变量集,采用一体化的优化方法,同时确定最优的特征子集和支持向量机模型的参数;在选择优化目标时,为有效避免出现"过拟合"的情况,将模型的5折交叉验证的预测精确度作为适应度函数,并对实际问题进行验证.结果表明,该方法可以有效滤除无关特征,提高预测精确度.  相似文献   

3.
研究了一个有效适用的企业信用风险预警模型。针对单一BP神经网络预测模型由于财务指标选择不当导致误判率较高的问题,提出了首先进行特征选择,利用遗传算法搜索出最优特征子集,并采用BP神经网络作为遗传算法的评估函数,构建了一个基于Wrapper方法的神经网络信用风险预测模型。以沪深股市1998—2004年间的制造企业数据为例对模型进行实验,结果表明,新模型提高了预测准确率,评估结果更具科学性,实际应用具有良好的信用风险预测能力。  相似文献   

4.
采用LightGBM预测模型对空气质量预测问题进行研究,提出并设计一种基于预测性特征的空气质量预测方法,有效地预测北京市区内未来24 h核心表征空气质量的PM2.5质量浓度。在构建预测方案过程中,分析训练数据集特性开展数据清洗,利用随机森林与线性插值相结合的方法,解决数据大量缺失以及噪声干扰问题;提出使用预测性数据特征方法,同时设计相关统计特征,提高预测结果的准确性;采用滑窗机制挖掘高维时间特征,增加数据特征数量级;对预测模型的工作性能和结果进行详细分析,并结合基线模型进行对比评价。试验结果表明,基于预测性特征结合采用LightGBM预测模型的方案具有更高的预测精度。  相似文献   

5.
为弥补路面性能预测问题中传统预测方法效率差、预测精度低等缺陷,针对普通公路沥青路面状况指数(pavement condition index,PCI)的预测问题,利用北京市9个县区包括路面性能指标、路面结构、交通参数及气象资料在内的1249组观测值,提出了一种基于随机森林算法的PCI预测模型,并与神经网络、支持向量机模型预测结果进行对比.研究结果表明:通过对比分析不同模型的3个定量评价指标(均方根误差、平均绝对误差和决定系数)以及可视化散点图,证明采用随机森林算法的PCI预测模型的鲁棒性、准确性要优于神经网络和支持向量机模型,验证了该模型的有效性和优越性,可以为后续公路养护预算申请和决策方案制定提供科学依据,对于提高公路养护的经济效益具有重要意义.  相似文献   

6.
针对传统飞蛾扑火优化(Moth-flame optimization,MFO)算法解决实际工程问题时过早收敛,导致陷入局部最优,效率低下的问题,利用支持向量机(SVM)能解决智能算法易于陷入区域最优问题的优点,提出了将SVM和MFO相结合的算法(MFO-SVM).选择山西省太原市和大同市的日常空气质量指数(AQI)对该算法的可行性和有效性进行了验证.实验结果表明,MFO-SVM算法的相对误差接近于零,预测值与实际值更接近,可以有效预测空气质量指数.  相似文献   

7.
大气污染严重危害居民的出行安全和身体健康,空气质量指数(AQI)是一种用于测量空气质量状况的综合指标,对AQI的预测可以提醒公众空气质量信息,使人们做出更明智的出行决策.通过提前预测空气质量的变化,政府和环保部门可以采取应急措施以减轻空气污染.本文提出基于卷积神经网络和门控循环单元的集成深度学习模型(CNN-GRU)对AQI进行预测.其中,卷积神经网络(CNN)提取污染气体浓度和AQI的时空特征并完成特征映射,门控循环单元(GRU)建模时序关系并高效完成计算.选取2014—2022年北京市和广州市的6种主要污染气体(PM2.5、PM10、SO2、CO、NO2、O3)日平均质量浓度和AQI进行实例研究,使用CNN-GRU模型对AQI进行预测,与多元宇宙优化的广义回归神经网络模型(MVO-GRNN)、遗传算法优化的BP神经网络模型(GA-BP)对AQI的预测进行对比分析.实验结果表明,本文提出的CNN-GRU模型对AQI的预测误差最小.  相似文献   

8.
为预测用户的购买行为,本文提出了一种基于LSTM与随机森林相结合的预测模型。该模型不仅对用户的行为数据进行量化提取特征和商品的属性提取特征,同时结合LSTM对序列数据处理的优势,将用户的行为数据作为先后关联的序列进行动态特征提取,再结合随机森林对用户的购买行为进行预测,最后采用某商城真实的商品月销售数据进行实验验证。研究结果表明,该基于动态特征的组合模型精确率达到了98%以上,比单一的随机森林模型采用静态特征预测有较大提高,同时召回率和正确率也有所提高。该模型为用户购买行为的预测提供了有效方法。  相似文献   

9.
空气质量变化是受多元复杂因素耦合作用的结果,为提高空气质量预测精度,提出了一种改进的灰色神经网络组合模型。该模型首先对原始数据进行重构,实现原始数据一维到多维的变换,从而提高数据利用率,再利用灰色模型弱化数据随机性,通过RBF神经网络实现对空气各污染组分的非线性预测。实际应用表明:GM-RBF组模型拟合及预测结果与各指标浓度实际监测结果基本一致,总体变化趋势也高度吻合,对SO2、NO2、PM10、PM2.5、CO等指标的预测精度均在0.05以下,对波动性最大的O3浓度预测精度也达到了0.0631,也印证了O3属宁波市空气质量最主要污染物。由此可见,基于GM-RBF组合模型的空气质量预测体系增强了模型的泛化能力和数据利用率,精度更高,稳定性更好,能够满足空气质量准确预测的要求,为大气污染治理及环境保护方略制定提供参考依据。  相似文献   

10.
以浙江省2016年1—10月的雷达回波强度数据为基础,分别应用随机森林模型、BP神经网络模型、卷积神经网络模型来预测降雨量并进行对比.建模分析结果表明,随机森林模型预测效果精确度较低,容易低估较大的降雨强度,而BP神经网络和卷积神经网络预测的效果都比随机森林好,特别是卷积神经网络,其预测值与真实值更加接近,且对较大的降雨强度拟合较好.  相似文献   

11.
基于随机森林算法的粮堆机械通风温度预测及控制研究   总被引:1,自引:0,他引:1  
为了研究粮堆机械通风温度与其影响因素之间的高维非线性关系,运用随机森林算法建立了预测模型,并用实仓实验数据验证模型的有效性,真实值与预测值的对比表明构建的随机森林模型预测精度较高。为了进一步说明随机森林模型的准确性和可靠性,将预测结果与支持向量机和BP神经网络模型对比。结果显示,随机森林预测模型的误差最小,回归拟合效果最优,可以应用于粮堆机械通风温度的预测。在此基础上,计算出了易调节因素的变化率与粮堆平均温度变化率之间的定量关系,以及粮堆平均温度达到低温条件的临界点集合,为科学地判断粮堆通风时机和温度的控制提供参考。  相似文献   

12.
遗传算法优化神经网络用于大气污染预报   总被引:9,自引:0,他引:9  
大气污染预报可以对大气污染提出警示,保护人体健康和生活环境.为了对北京市PM10的质量浓度进行预报,建立了用于大气污染预报的遗传神经网络模型,该模型运用遗传算法优化神经网络的权值和阈值,有效提高了网络的收敛性和预报准确率.用改进后的神经网络对北京市PM10的质量浓度进行了模拟,并将模型模拟结果与美国第3代空气质量模型Models-3(CMAQ)的数值模拟结果进行了比较.实验结果表明:遗传神经网络模型和数值模型的模拟结果的平均相对误差分别为0.21和0.26,用于空气污染物质量浓度短期预报时,神经网络模型的预测精度与数值模型的预测精度相当.对于没有条件开展空气污染数值预报的城市或地区,神经网络是一种有效的替代方法.  相似文献   

13.
河流水质预测的灰色神经网络联合模型   总被引:4,自引:0,他引:4  
针对灰色预测对波动较强的序列只能预测大致变化的缺陷,运用响应成分模型将水质浓度分解为具有确定性的趋势项和具有不确定性的随机项,建立灰色神经网络联合模型对水质的趋势项和随机项进行预测。将该模型应用于淮河河流水质预测,结果表明,该模型拟合误差小,预测精度高。  相似文献   

14.
基于混沌时间序列的Elman神经网络工业用电预测   总被引:1,自引:0,他引:1  
针对电力负荷数据在多重因素相互影响下呈现非线性特性甚至是混沌性的问题,采用基于相空间重构的Elman神经网络方法进行全社会工业月用电量预测.利用小数据量法计算最大Lyapunov指数,判别负荷时间序列的混沌性,进而确定最优延迟时间及最佳嵌入维数进行相空间重构,以此确定Elman神经网络的拓扑结构,并将实测数据带入模型进行训练.通过对实测数据进行预测仿真,表明该模型达到了较好的预测效果,验证了提出的时间序列相空间重构与Elman神经网络结合的正确性与有效性.  相似文献   

15.
《焦作工学院学报》2022,(1):136-142
股票数据具有非线性和复杂性等特点,单一模型预测效果不佳,针对此问题,提出一种RF-LSTM组合模型,用于预测股票的收盘价。首先,利用Tushare财经数据包获取股票数据,构建特征集,并对数据进行归一化处理;其次,考虑到多特征之间存在高度的非线性和信息冗余问题,利用随机森林(RF)选择最优特征集,降低数据维度和训练复杂度;最后,利用深度学习中适合处理时间序列的长短期记忆网络(LSTM)对股票价格进行预测,并对预测模型进行参数调优。结果表明,与单一结构的LSTM神经网络模型预测相比,本文提出的RF-LSTM组合模型预测的平均绝对误差(MAE)、均方误差(MSE)和均方根误差(RMSE)分别减小了13.11%,6.70%和12.54%。该组合模型可提高股票价格预测的准确性。  相似文献   

16.
为了提高电力系统短期负荷预测的准确性,本文提出了基于改进随机森林算法的电力系统短期负荷预测模型。改进随机森林算法是将随机森林算法中的决策树数量和分裂特征数等参数采用粒子群进行优化,通过比较每组参数对应的随机森林袋外数据误差,获取参数最优值,使随机森林算法的性能得到最优,并采用山东省某城市电网的历史负荷数据进行仿真分析。仿真结果表明,与基于传统随机森林算法的预测模型相比,本文所提出的预测模型的平均绝对误差降低0.81%,最大相对误差降低1.89%,说明本文所提出的基于改进随机森林算法的短期负荷预测模型具有更好的预测性能。该研究具有一定的工程实用性。  相似文献   

17.
为了更好地反映空气质量的变化趋势,加强大气污染的防治,开展城市环境空气质量评价的意义重大。有效的空气质量评价方法可以提高评价体系的科学性,督促各个城市环保工作的稳步推进,从而对大气污染治理做出贡献,而空气质量评价算法是空气质量评价的核心。根据影响空气质量的几个基本要素:二氧化硫年平均浓度、二氧化氮年平均浓度、可吸入颗粒物年平均浓度等,创新性地采用随机森林算法对我国113个重点城市的空气质量进行了评价。通过评价指标将模型的评价结果与其他分类算法进行比较,发现随机森林分类模型,无论是在二分类还是多分类中都能够对各个城市地区的空气质量作出较为准确的评估,并进一步得出空气中PM10、PM2.5和O3的浓度是影响各大城市空气质量好坏的主要因素。  相似文献   

18.
提出一种基于ReliefF算法的时频联合特征及随机森林的配电网电缆故障识别方法. 针对零序电压,从时域和频域构造23个故障敏感特征,采用ReliefF算法进行特征选择,得到最具分类能力的特征子集. 将特征子集作为基于随机森林的输入进行训练,得到最终的分类模型,实现了电缆故障类型识别. 所提方法与基于单一特征的方法相比,能够更加充分地挖据数据潜力,同时由于采用ReliefF算法筛除了无关特征,提高了算法效率. 最后采用Matlab软件进行仿真,并与决策树、KNN、SVM等算法进行比较,仿真结果验证了所提方法的可行性和高准确性.  相似文献   

19.
深度集成森林回归建模方法及应用   总被引:1,自引:0,他引:1  
复杂工业过程因涉及多种物理/化学反应,其质量指标或环保指标等难测参数的精确数学模型难以构建.常用的基于神经网络的数据驱动建模方法存在可解释性差、样本需求量大等缺点.针对上述问题,提出了一种非神经网络模式的深度集成森林回归(deep ensemble forest regression,DEFR)建模方法.首先,基于样本空间和特征空间的随机采样策略获得训练子集后构建T个基于决策树(decision trees,DT)的子森林模型,将采用K最近邻(K-nearest neighbor,KNN)准则选取的层回归向量与原始特征组合获得的增强层回归向量作为输入层森林模型的输出;然后,采用相同方式构建包含若干预设层数的中间层森林模型;最后,基于上层增强层回归向量构建输出层的子森林模型,通过对其T个输出值的加权获得DEFR模型的预测值.采用加州大学欧文分校(University of California Irvine,UCI)平台混凝土抗压强度数据和城市固废焚烧过程的二口恶英排放质量浓度数据仿真验证了所提方法的有效性.  相似文献   

20.
为获得更精确的径流-水位预报结果,利用Dmey小波变换将水位时间序列分解为高频信号和低频信号,再使用均生函数-最优子集回归对其进行预测,最后利用Dmey小波逆变进行重构,以此建立水位预测模型.通过对柳江历年水位进行实例分析,并与均生函数最优子集回归模型、逐步回归模型对比.研究结果表明,该模型能充分反映水位时间序列趋势,预报稳定性好,预报准确率高,为径流-水位时间序列预测提供一个有效建模方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号