首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对现有单一算法模型在成绩预测时存在泛化能力不强的问题, 提出一种基于多算法融合的Stacking集成学习模型, 用于混合式教学中学生成绩的预测. 模型以多项式朴素贝叶斯、AdaBoost和Gradient boosting为初级学习器, 逻辑斯蒂回归为次级学习器组成两层融合框架. 通过混合式教学过程中所产生的学习行为数据对模型进行验证. 实验表明, Stacking集成学习模型在测试集上分类预测准确率达到76%, 分别高于多项式朴素贝叶斯、AdaBoost、Gradient boosting和逻辑斯蒂回归4个单一算法模型5%、6%、9%和6%. 与单一算法模型相比, Stacking集成学习模型有着较强的泛化能力, 能更好地预测学生成绩, 为混合式教学的学习预警提供参考.  相似文献   

2.
为了提高Stacking集成算法的分类性能,充分利用Stacking学习机制产生的先验信息和贝叶斯网络丰富的概率表达能力,提出一种基于属性值加权朴素贝叶斯算法的Stacking集成分类算法AVWNB-Stacking(Stac-king based Attribute Value Weight Naive Bayes)...  相似文献   

3.
4.
单一机器学习算法进行短期负荷预测存在着泛化能力受限的问题,本文将Stacking 集成学习模型引入到短期负荷预测问题,对于在交叉验证下同一基学习器不同预测模型表现出预测准确度的差异性,根据预测精度对同一基学习器中不同预测结果进行赋权,考虑到不同环境下各影响因子对日负荷值影响程度不同,引入蚁狮算法(ALO)自适应的调整各个影响因子的权值,提高相似日选取方法的准确性,通过相似日选取方法筛选出的相似日集合样本训练改进的Stacking算法预测模型,利用中国北方某地区的负荷数据进行实际算例分析。实验结果表明,在面对负荷影响因素复杂且训练样本较多的情况下。本文所提的方法具有良好的鲁棒性、稳定性和预测精度。  相似文献   

5.
随着网络剧近年来的飞速发展, 对播放量的研究也逐渐受到关注. 网络剧播放量反映了网络剧的口碑和受欢迎程度, 这与制作方和投资方的收益密切相关. 但目前的研究尚未考虑观众评论的情感态度对播放量的影响, 并且预测模型也较为简单, 预测精度有待进一步提高. 本文在对用户评论进行情感分析的基础上, 构建Stacking集成学习模型对我国网络剧的播放量进行预测. 首先基于SO-PMI算法构建网络剧领域情感词典, 并结合基础情感词典以及点赞数权重计算出评论情感得分, 加入预测指标体系中; 接着以随机森林(random forest, RF), GBDT, XGBoost以及LightGBM为基学习器, MLR为元学习器, 构建Stacking网络剧播放量分阶段的预测模型, 使用当前数据对下一周的播放量进行预测; 最后进行模型比较分析, 并得出预测变量的重要性分值. 实验结果显示, 本文所构建的模型判定系数R方值达到了0.89, 高于基学习器单独的模型预测R方值 (最高0.84)以及未加入情感得分变量的Stacking模型预测R方值 (0.81). 可以得出加入情感得分变量后, 本文构建的Stacking集成学习模型在一定程度上可以提高网络剧播放量的预测精度.  相似文献   

6.
《软件工程师》2019,(12):1-4
预测性维护是工业互联网应用的重点,实现预测性维护的关键是对设备系统或核心部件的寿命进行有效预测。随着近年来机器学习的发展,机械设备海量数据已成为工业互联网分析核心部件剩余寿命的关键指标,也成为设备健康管理决策性数据。基于工程机械设备大数据,结合XGBoost、随机森林、LightGBM等多种机器学习模型,多维度探究影响机械核心部件寿命的机器学习模型效果,建立Stacking算法模型融合的部件寿命预测模型,并在核心部件数据上验证模型预测有效性,从而减少设备非计划停机时间,推进智能制造和预测性维护的进步。  相似文献   

7.
8.
文章在Give Me Some Credit数据集上构建Stacking模型,使用SMOTE+Tomek Link综合采样法处理非平衡数据。在实证研究上,选择逻辑回归、K近邻、神经网络、随机森林、LightGBM、XGBoost、Adaboost以及CatBoost模型,并将上述模型分3种情况进行Stacking模型融合。结果显示,对此数据集而言,将随机森林、XGBoost、Adaboost、K近邻以及神经网络5个模型作为基学习器,将逻辑回归作为第二层学习器建立Stacking模型的效果最好。因此,利用Stacking模型构建信用贷款违约风险预测模型具有优异的分类性能和较强的可行性。  相似文献   

9.
针对传统卷积神经网络对多传感器指纹识别泛化能力降低、准确率不高的问题,提出改进的Stacking集成学习算法。首先将AlexNet进行改进,在AlexNet中引入深度可分离卷积减少参数量,加快训练速度;引入空间金字塔池化,提升网络获取全局信息的能力;引入批归一化,加快网络收敛速度,同时提升网络在测试集上的准确率;使用全局平均池化替代全连接层,防止过拟合。然后将DenseNet和改进的AlexNet 2种卷积神经网络作为Stacking的基学习器对指纹进行分类,获得预测结果。最后对相同基学习器训练得到的各个模型,根据预测精度对各预测结果赋权,得到的预测结果再由元分类器分类。改进的Stacking算法在多传感器指纹数据库上进行实验,最终识别准确率达98.43%,相对AlexNet提升了20.05%,相对DenseNet提升了4.25%。  相似文献   

10.
周平  刘进进 《控制与决策》2021,36(2):335-344
高炉炼铁多元铁水质量的实时准确预报是高炉内部状态进行实时监测和有效控制的重要手段,但预报结果存在准确度不高和缺乏可信度表征的问题,特别是在炉况不稳定和高炉数据波动大的情况下,多元铁水质量的预报结果存在较大偏差和较低可信度,不能为高炉日常操作和调节提供指导.针对这一工程难题,提出一种基于Stacking的高炉铁水质量区间...  相似文献   

11.
针对目前主流恶意网页检测技术耗费资源多、检测周期长和分类效果低等问题,提出一种基于Stacking的恶意网页集成检测方法,将异质分类器集成的方法应用在恶意网页检测识别领域。通过对网页特征提取分析相关因素和分类集成学习来得到检测模型,其中初级分类器分别使用K近邻(KNN)算法、逻辑回归算法和决策树算法建立,而次级的元分类器由支持向量机(SVM)算法建立。与传统恶意网页检测手段相比,此方法在资源消耗少、速度快的情况下使识别准确率提高了0.7%,获得了98.12%的高准确率。实验结果表明,所提方法构造的检测模型可高效准确地对恶意网页进行识别。  相似文献   

12.
《软件》2017,(8):18-24
在云计算提供高效,便捷等强大服务的背后,是日益攀升的能耗问题。准确的预测云平台的负载(如CPU,内存的使用)在任务调度,云能效方面具有重要意义。在以往研究中,线性自回归算法在预测请求资源的粒度上存在不足,本文提出一种基于BP神经网络与遗传算法混合的负载预测方法,结合遗传算法良好的全局搜索能力与神经网络强大的非线性拟合能力,建立CPU资源的请求预测模型。实验通过Google的云平台数据作为训练,测试集。实验结果表明该方法有效的预测了CPU资源请求量,进而可以在此基础上调整服务资源,实现绿色调度。  相似文献   

13.
为提升超短期电网负荷预测精度,提出基于Stacking多模型融合的超短期电网负荷预测法。首先,结合5-折交叉验证法分别训练第一层的LSTM、LightGBM、XGBoost三个初级学习器,将训练结果进行Stacking融合;然后将融合结果作为新特征用于训练第二层LightGBM次级学习器,使用次级学习器得到电网负荷预测的最终结果;最后利用山东省公共数据开放平台提供的某市实际超短期电网数据验证所提方法的有效性。实验结果表明,比起单一模型预测,所提的Stacking多模型融合预测法,在预测结果的平均精度与峰谷变化的适应能力方面更具优势。  相似文献   

14.
《软件》2019,(9):176-181
短期负荷预测尤其是非节假日负荷预测对提升电力系统整体调度、支撑电网运营工作起着十分关键的作用。目前针对非节假日负荷预测的理论、方法和应用层出不穷,但是预测精度和使用范围都受到一定限制,并且经济发展对短期负荷预测的精度提出越来越高的要求,传统的机器学习算法已经难以满足人们的需求。为了提高负荷预测的精度,本文提出了利用BP神经网络进行Stacking模型融合算法,它是基于集成学习的思想,首先挑选五种预测精度较高的单模型,然后利用Stacking模型融合方法将其集成为预测精度更高的综合模型。本文采用此算法预测某省2018年非节假日负荷,结果表明该算法可以有效提高预测精度。  相似文献   

15.
车货匹配是提高车主和货主信息流通和促进货运交易的关键途径,然而,在实际应用当中,车货匹配需要考虑司机和货主的行为习惯,并且需要根据不平衡数据进行预测。为解决此问题,本文考虑数据不平衡性,结合RUS重抽样方法,整合Logistic Regression、朴素贝叶斯以及LightGBM模型,最终得到Stacking集成学习的车货匹配模型RLBL-Stacking。以运满满数据为例,对数据进行预处理,筛选合适特征进行模型训练。结果表明,相较于其他单一的分类模型,集成算法能在不平衡数据中取得更好的预测结果。  相似文献   

16.
提出了一种基于云模型的电力负荷预测模型。利用云模型中的云发生器,分别将有限的国民生产总值和工业生产总值的增长率和增长变化率样本数据空间扩充为更具随机性和普遍性的扩展样本数据。以国民生产总值为例,建立国民生产总值与电力负荷之间的规则推理,构造云规则推理器。利用云规则推理器获得电力负荷预测增长率,将国民生产总值和工业生产总值获得的电力负荷预测增长率进行加权平均,并换算得到最终的电力负荷预测值,获得的预测结果精度高。  相似文献   

17.
18.
快速且高效地识别钓鱼网站是非常有必要的,可以帮助人们有效避免钓鱼网站引起的网络安全威胁。提出一种基于Stacking集成模型对钓鱼网站进行识别的模型。首先对数据预处理,再利用XGBoost算法进行最优特征集筛选,建立单一模型和Stacking集成模型,同时使用分层交叉验证和网格搜索对算法参数进行调节。实验结果表明,基于Stacking集成结构对钓鱼网站的识别准确率达到了97.96%,AUC值为0.9801,该方法相比其他单一分类器具有更高的识别能力。  相似文献   

19.
20.
云计算资源的负载预测有助于数据中心灵活智能地配置资源,保障数据中心安全平稳运行。该文提出一种基于经验模态分解和时间卷积网络的云资源组合预测模型,使用历史的资源负载预测未来的资源需求。对负载进行经验模态分解,以降低原云资源负载序列的复杂度,得到反映原负载序列趋势和变化信息的本征模态分量和残余分量;将这些分量构造后输入到时间卷积网络中进行建模预测。以Google集群数据集中的CPU负载序列为例,将该模型与常用的云资源预测模型进行对比验证。实验结果发现,相比于长短时记忆网络和时间卷积网络,该模型在平均绝对百分比误差指标上降低了36.32%和35.37%,预测精度有了明显提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号