首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
梯度提升决策树(GBDT)和支持向量机(SVM)是预测光伏出力的两种常用算法。分析了光伏发电出力的影响因素,介绍了GBDT算法和SVM算法的原理,以及基于两种算法的光伏出力预测模型的流程,并进行对比分析。实验结果表明,基于GBDT算法的光伏出力预测模型的平均绝对相对误差和均方根误差都较小,预测效果更好。  相似文献   

2.
针对目前高速公路检测器铺设密度较低导致预测路段旅行时间准确率不高的问题,利用联网收费数据建立旅行时间预测模型,用于预测路段旅行时间.首先根据收费数据计算出路段旅行时间,对其进行修正后建立真实旅行时间集,然后利用随机森林算法从构建的旅行时间备选变量中筛选出重要变量,以此作为输入建立基于BP神经网络的旅行时间预测模型,最后...  相似文献   

3.
针对现今客户价值的差异对企业服务运营的影响,本文基于对Superstore Sales客户消费数据的分析,提取客户特征构建基于消费行为的客户画像;抽取客户价值评价指标,经主成分分析法(PCA)优化后形成客户价值评价指标体系;利用K-Means聚类算法为客户贴上价值标签,构建基于梯度提升决策树算法(GBDT)的客户价值预测模型。实验结果表明,该方法预测结果具有较高的准确率,可挖掘隐藏的高价值客户,对于企业客户关系管理具有一定的研究借鉴价值与实际意义。  相似文献   

4.
随着移动服务的发展,越来越多的移动端服务基于对象的位置进行推送和推荐,因此位置预测技术显得越来越重要.由于对象位置信息存在采集不连续或对象行为不规律等因素,导致位置预测成为一项非常有挑战的工作.为了提高位置预测的准确性,提出一种基于K-Means算法和时间匹配的位置预测模型.该模型使用K-Means算法对历史位置点进行聚类,划分多个对象运动区域,针对对象运动区域进行预测.按照对象的作息时间将一天时间划分为多个时间段,运用笔者提出的轨迹建模算法和轨迹更新算法形成用户运动轨迹,形成对象运动轨迹,再使用时间匹配原则进行位置预测.笔者最后利用真实的数据实现该模型,实验证明:未使用该模型的位置预测准确率为39.7%;使用该模型后算法和时间匹配的位置预测模型预测准确率达到60.3%,准确率提高了20%左右.  相似文献   

5.
现有风电功率预测模型的主要输入特征包括气象数据和功率数据,高精度气象数据获取困难、数据间潜在关系难以表示、预测模型收敛缓慢,提出基于极端梯度提升回归树算法(XGBoost)扩展金融因子的超短期风电功率预测新方法,以及基于风电时序数据衍生金融因子的预测模型.采用具有较高预测准确率与较快训练速度的XGBoost算法进行预测,使得预测模型快速收敛.在中国内蒙古某风电场的风电功率数据集与德国Tennet公司风电功率数据集上进行实验验证.实验结果表明,以R2score为例,所提方法与基准方法相比提升约14.71%.所提方法中的建模与预测合计时间不超过500 ms.  相似文献   

6.
通过实验筛选研发新药的过程非常缓慢且需耗费大量的人力物力,而利用计算机辅助预测药物的分子性质可极大地节省药物研发时间和成本.因此,为了能够使抗乳腺癌候选药物对抑制ERα具有良好的生物活性和ADMET性质,针对收集到的1 974种化合物,首先利用随机森林分类器筛选出前20个对生物活性最具显著影响的分子描述符,并以此和pIC50值作为特征数据建立QSAR模型.其次,基于PSO优化BP神经网络对50个新化合物的生物活性值进行预测,模型拟合度为0.833 7,根均方误差为0.731 5,比优化前的BP神经网络预测值更贴合实际.随后为提高药物研发的成功率,依据已有的ADMET性质数据利用PSO优化SVM构建ADMET分类预测模型,算法交叉验证CV准确率达到94.076 7%,5个指标模型的预测准确率均在79%以上.结果表明,所建立的模型比基准模型的预测性能更好,采用的预测策略是有效的,可为抗乳腺癌药物的研发提供借鉴.  相似文献   

7.
针对当前基于第三方应用数据的用户属性预测算法较少考虑应用前台实际使用时长问题,提出了“手机应用前台均使用时长”特征,同时采用基于稀疏自编码器和神经网络的Co-training框架,充分利用大量未标注数据,从应用类别和前台均使用时长两个角度进行属性预测。实验进行时,首先使用未标注数据对网络进行初始化,然后采用基于准确率的梯度下降算法对参数进行更新。实验结果表明,本文算法提高了用户属性预测准确率。  相似文献   

8.
针对冠心病监护室(CCU)患者的死亡风险预测集中在重症监护室(ICU)的患者,并且CCU患者的大量多模态数据不能被充分地利用的情况,提出一种动态预测CCU患者死亡风险的多模态融合方法。首先分析了CCU多模态数据的特点,从结构和时间2个维度提出了一种分类模式,使用卷积神经网络(CNN)和文本数据聚类的方法处理心脏超声报告(ECHO),使用信号处理方法处理高频波形数据心电图(ECG),将这2种方法提取的特征与其他结构化数据相结合,通过加入时间维度的决策树模型进行预测,决策树模型根据时间戳区分不同时期生成的数据。在MIMIC-Ⅲ数据集上的实验表明:与基准的机器学习方法支持向量机(SVM)相比,本研究在AUC-ROC/AUC-PR上分别获得11.36%和25.31%的改进,与基于线性分类的机器学习方法相比,在AUC上获得11.42%的改进。  相似文献   

9.
针对目前移动用户地点预测方法对时间的依赖性较强且在小数据集上表现差的问题,提出一种基于皮特曼-尤尔及移动马尔可夫链(PY-MMC)模型的下一步地点预测方法.该方法综合考虑目标用户轨迹的短时效应及幂律分布特征.以用户的时间位置熵为参考,计算可预测性因子.依据该因子对皮特曼-尤尔模型及移动马尔可夫链模型输出的概率线性加权,建立PY-MMC模型.利用新模型计算每个下一步候选地点的概率,并取最大者输出,完成下一步地点的预测.以"Geolife"及"Foursquare"数据集为例,采用一步准确率、一步候选准确率及平均准确率3个评估指标进行实验.结果表明:新方法能够有效克服基于MMC模型的预测方法准确率随时间波动较大的不足.同时,该方法解决了基于PY模型的预测方法对子序列长度过度依赖的问题.  相似文献   

10.
针对结直肠癌患者术后生存期预测,基于模糊C均值(FCM)聚类算法,提出一种结合场景认知和隶属度排序的变量聚类方法,对结直肠癌患者样本进行降维,并筛选出6个特征变量.结合BP神经网络,建立一个结直肠癌患者术后生存期预测模型.为了验证该模型的有效性,利用主成分分析(PCA)对样本进行降维,并训练BP神经网络,对比FCM模型及PCA模型的预测准确率.结果显示,基于FCM变量聚类的BP神经网络模型预测准确率更高,所提出的变量聚类方法能够有效筛选出对于生存期有相关性和解释性的变量,从而提高BP神经网络模型的预测准确率.  相似文献   

11.
针对PM2.5浓度的非线性和不确定性,提出了一种基于集成树-梯度提升决策树(EnsembleTrees-GBDT)的PM2.5预测模型.该模型首先在集成树框架下进行特征选择,即选取PM2.5浓度主要影响因素,使用算术均值聚合法计算出各项特征对PM2.5浓度增加的影响程度,并以影响程度由强到弱的次序排序;其次使用网格搜索对GBDT算法进行参数优化,选取树的深度等参数的最优值;最后构建完整的PM2.5浓度集成预测模型.使用北京市2015-2016年的污染物浓度和气象条件观测值2个数据集,对模型进行了预测仿真实验.对比实验结果表明,所提出的EnsembleTrees-GBDT预测模型相比于决策树、随机森林、支持向量机等模型,具有更低的平均绝对误差和均方根误差,同时具有更好的泛化能力,能够更准确地预测PM2.5浓度,并实现对PM2.5浓度影响因素的有效分析.  相似文献   

12.
车辆在执行换道行为时,由于受到较多环境因素影响,难以准确进行换道识别和预测. 为解决这一问题,提出一种基于梯度提升决策树(GBDT)进行特征变换的融合换道决策模型,以仿真驾驶员在高速公路上自由换道时的决策行为. 采用主体车辆与目标车道后车的碰撞时间 tlag 及车辆周围交通状态变量进行车辆换道行为的建模分析,在NGSIM数据集上对建立的融合换道决策模型进行参数标定和模型测试. 实验结果表明:融合换道决策模型以95.45%的预测准确率超越支持向量机、随机森林和GBDT等单一的换道决策模型,获得了最突出的表现. 变量分析结果表明:新引入的换道决策变量 tlag 对车辆换道行为具有重要影响. 提出的融合换道决策模型能够进一步减少因换道决策误判而导致的交通事故.  相似文献   

13.
为了研究高速公路目标车道领跟车在交织区与汇合车辆的交互作用,基于梯度提升决策树(GBDT)建立交织区汇合交互作用模型. 引入目标车道领跟车与前车、后车和汇合车辆的速度差、时间间隙、冲突评价指标及横向位置,分析汇合车辆与领跟车之间的交互行为. 利用美国NGSIM数据集中目标车道领跟车与汇合车辆的轨迹数据对模型进行训练和测试,比较不同损失函数对模型的拟合效果,对汇合加速度进行偏效应分析. 研究结果表明,基于平方损失函数(LS)的GBDT模型精度高于基于最小绝对偏差(LAD)和胡贝尔 (Huber-M) 损失函数的模型. 在汇合行为的各研究对象中,汇合车辆的预测精度高于领跟车,汇合车辆的横向位置在汇合交互作用中的影响程度最高. GBDT模型用于汇合交互行为不仅可以准确预测目标车道领跟车与汇合车辆之间的交互作用,也能够获取影响变量与加速度之间隐藏的非线性关系.  相似文献   

14.
Slope stability prediction research is a complex non-linear system problem. In carrying out slope stability prediction work, it often encounters low accuracy of prediction models and blind data preprocessing.Based on 77 field cases, 5 quantitative indicators are selected to improve the accuracy of prediction models for slope stability. These indicators include slope angle, slope height, internal friction angle, cohesion and unit weight of rock and soil. Potential data aggregation in the predicti...  相似文献   

15.
针对传统预测模型已不再适用于卫星网络的问题,提出了一种自适应步长和自适应核宽度的核最小均方算法(AKLMS).通过核函数将非线性数据从低维输入空间映射到高维特征空间进行操作,并且在迭代过程中根据瞬时误差自适应地调整步长和核宽度.仿真结果证明,与核最小均方算法(KLMS)和最小均方算法(LMS)相比,AKLMS算法在收敛速度和预测流量精度方面都有大幅提升,为卫星网络的流量规划和路由设计提供了强有力的决策支持.  相似文献   

16.
基于APSO-WLSSVR的水质预测模型   总被引:2,自引:1,他引:1  
为解决传统预测方法和标准最小二乘支持向量回归机(least squares support vector regression, LSSVR)在水质预测中存在预测精度低、鲁棒性差等问题,提出了自适应粒子群优化加权最小二乘支持向量回归机(adaptive particle swarm optimization weighted least squares support vector regression, APSO-WLSSVR)的水质预测模型。根据样本对模型重要性不同为各样本赋予不同权重,建立了加权最小二乘支持向量回归机(weighted least squares support vector regression, WLSSVR),实现对样本数据“重近轻远” 的优化选择,避免标准LSSVR算法因没有考虑样本重要性差异致使预测精度低的问题;采用自适应粒子群优化算法对模型参数组合进行优化选择,克服了标准LSSVR算法因试凑法获取参数的盲目性和人为因素的影响。为验证该模型的性能,对江苏省宜兴市集约化河蟹养殖水质进行预测,并与其他预测方法对比分析,结果表明该模型预测精度明显提高,还具有较好的鲁棒性和泛化能力,能够满足集约化水产养殖水质管理的实际需要。  相似文献   

17.
为了解决变种恶意代码、未知威胁行为恶意分析等问题,研究了基于梯度提升树的恶意代码分类方法,从大量样本中学习程序行为特征和指令序列特征,实现了智能恶意代码分类功能.将GBDT算法引入恶意代码检测领域,使模型结果行为序列具有可解释性,对恶意代码的检测能力大幅提高.GBDT算法能够客观地反映恶意代码的行为和意图本质,能够准确识别恶意代码.  相似文献   

18.
大样本高维度状态监测数据对剩余使用寿命(RUL)精准预测有着技术性挑战,为了提高以航空涡轮风扇发动机为代表的复杂装备的预测精度和收敛效率,提出一种两阶段的选择性深度神经网络集成方法. 第1阶段为多方法联合扰动下的候选集生成方案,通过采用异质神经网络结构、多时间尺度设计和算法参数随机化消除模型内部耦合关系,强化候选深度神经网络集多样性;第2阶段利用遗传算法集成修剪冗余模型,有效剔除性能不佳的冗余学习器,以获取多样化最优候选子集,并按平均集成输出预测结果. 与个体模型的数据实验对比表明,所提方法通过同步增强集成模型准确性和多样性,提升了近20%的RUL预测精度,可为运维决策提供有力支撑.  相似文献   

19.
为了适用于长期心电监护和ICU等实时性、数据密集型应用场合,提出可在8 Hz采样频率的1 min心电图(ECG)片段上提前45 min预测阵发性房颤(PAF)发作的实时预测模型. 采用概率符号化模式识别方法,在降采样后的ECG序列上提取出1 min窗口内的模式转移特征,降低模型的计算量和对存储空间的需求,确保实时预测的效果. 提出卷积神经网络(CNN)和长短-期记忆网络(LSTM)的混合模型(CNN-LSTM),用于提取模式转移特征内隐含的局部空间特征和时间依赖特征. 为了提升模型泛化能力,构建基于CNN-LSTM的集成分类器. 采用Spark Streaming技术完成对ECG流式数据的读、写和计算,实现数据和模型之间的低延迟通信. 所提模型在公开数据集上的准确率、灵敏度和特异度分别为91.26%、82.21%、95.79%. 模型处理总延迟平均为2 s,满足实时PAF预测需求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号