共查询到20条相似文献,搜索用时 4 毫秒
1.
配电网的负荷预测在电力运行状态监测中尤为重要。负荷预测的精度提升为电网的安全、稳定运行提供了保障。通过对融合集成算法的研究,提出了一种基于关联特征选择的融合集成算法。在数据集的选择上,使用相关系数和灰色关联算法综合对样本中负荷影响较小的特征进行剔除,使得样本数据集的相关性更高;同时,对传统Stacking集成学习的输入和输出特征进行优化,提高了模型的预测效果。试验结果表明,基于融合集成算法的配电网负荷预测模型与传统的Stacking集成算法、XGBoost、灰狼优化-反向传播算法相比,负荷预测的精度提升了3.07%。该模型总体性能表现较好。该研究结果有效地支撑了配电网的负荷监测和规划,也为电力系统故障诊断提供了参考。 相似文献
2.
基于属性组合的集成学习算法 总被引:2,自引:0,他引:2
针对样本由数字属性构成的分类问题,在AdaBoost算法流程基础上,改传统的基于单属性分类器构造方法为基于组合属性分类器构造方法,提出了一种基于样本属性线性组合的集成学习算法。对属性组合系数的构造,提出了一般性的构造思路,按照该思路,提出了几种具体的组合系数构造方法,并对构造方法的科学合理性进行了分析。利用UCI机器学习数据集中的数据对提出的方法进行了实验与分析,结果表明,基于属性组合的集成学习算法不仅有是有效的,而且比传统AdaBoost算法好 相似文献
3.
针对传统工业管道腐蚀率预测模型存在特征提取依赖人工经验和泛化能力不足的问题, 本文将卷积神经网络(convolutional neural network, CNN)和长短期记忆网络(long short-term memory, LSTM)相结合, 提出了基于布谷鸟优化算法(cuckoo search, CS)的CNN-LSTM-CS网络模型, 实现对工业管道腐蚀率预测. 首先, 对采集的管道腐蚀数据集进行归一化预处理; 然后, 利用CNN网络提取影响管道腐蚀率因素的深层次特征信息, 并通过训练LSTM网络构建CNN-LSTM预测模型; 最后, 采用CS算法对预测模型进行参数优化, 减少预测误差, 实现腐蚀率的精准预测. 实验结果表明, 对比几种典型的腐蚀率预测方法, 本文提出的方法具有更高的预测精度, 为工业管道腐蚀率检测提供新的思路. 相似文献
4.
为了平衡集成学习中差异性和准确性的关系并提高学习系统的泛化性能, 提出一种基于AdaBoost 和匹配追踪的选择性集成算法. 其基本思想是将匹配追踪理论融合于AdaBoost 的训练过程中, 利用匹配追踪贪婪迭代的思想来最小化目标函数与基分类器线性组合之间的冗余误差, 并根据冗余误差更新AdaBoost 已训练基分类器的权重, 进而根据权重大小选择集成分类器成员. 在公共数据集上的实验结果表明, 该算法能够获得较高的分类精度. 相似文献
5.
6.
AdaBoost算法是一种典型的集成学习框架,通过线性组合若干个弱分类器来构造成强学习器,其分类精度远高于单个弱分类器,具有很好的泛化误差和训练误差。然而AdaBoost
算法不能精简输出模型的弱分类器,因而不具备良好的可解释性。本文将遗传算法引入AdaBoost算法模型,提出了一种限制输出模型规模的集成进化分类算法(Ensemble evolve classification algorithm for controlling the size of final model,ECSM)。通过基因操作和评价函数能够在AdaBoost迭代框架下强制保留物种样本的多样性,并留下更好的分类器。实验结果表明,本文提出的算法与经典的AdaBoost算法相比,在基本保持分类精度的前提下,大大减少了分类器数量。 相似文献
7.
付忠良 《计算机研究与发展》2013,50(4):861-872
集成学习算法的构造属于机器学习领域的重要研究内容,尽管弱学习定理指出了弱学习算法与强学习算法是等价的,但如何构造好的集成学习算法仍然是一个未得到很好解决的问题.Freund和Schapire提出的AdaBoost算法和Schapire和Singer提出的连续AdaBoost算法部分解决了该问题.提出了一种学习错误定义,以这种学习错误最小化为目标,提出了一种通用的集成学习算法,算法可以解决目前绝大多数分类需求的学习问题,如多分类、代价敏感分类、不平衡分类、多标签分类、模糊分类等问题,算法还对AdaBoost系列算法进行了统一和推广.从保证组合预测函数的泛化能力出发,提出了算法中的简单预测函数可统一基于样本的单个特征来构造.理论分析和实验结论均表明,提出的系列算法的学习错误可以任意小,同时又不用担心出现过学习现象. 相似文献
8.
文章在Give Me Some Credit数据集上构建Stacking模型,使用SMOTE+Tomek Link综合采样法处理非平衡数据。在实证研究上,选择逻辑回归、K近邻、神经网络、随机森林、LightGBM、XGBoost、Adaboost以及CatBoost模型,并将上述模型分3种情况进行Stacking模型融合。结果显示,对此数据集而言,将随机森林、XGBoost、Adaboost、K近邻以及神经网络5个模型作为基学习器,将逻辑回归作为第二层学习器建立Stacking模型的效果最好。因此,利用Stacking模型构建信用贷款违约风险预测模型具有优异的分类性能和较强的可行性。 相似文献
9.
10.
针对现有单一算法模型在成绩预测时存在泛化能力不强的问题, 提出一种基于多算法融合的Stacking集成学习模型, 用于混合式教学中学生成绩的预测. 模型以多项式朴素贝叶斯、AdaBoost和Gradient boosting为初级学习器, 逻辑斯蒂回归为次级学习器组成两层融合框架. 通过混合式教学过程中所产生的学习行为数据对模型进行验证. 实验表明, Stacking集成学习模型在测试集上分类预测准确率达到76%, 分别高于多项式朴素贝叶斯、AdaBoost、Gradient boosting和逻辑斯蒂回归4个单一算法模型5%、6%、9%和6%. 与单一算法模型相比, Stacking集成学习模型有着较强的泛化能力, 能更好地预测学生成绩, 为混合式教学的学习预警提供参考. 相似文献
11.
针对差分隐私保护下单一聚类算法准确性和安全性不足的问题,提出了一种基于差分隐私保护的Stacking集成聚类算法。使用Stacking集成多种异质聚类算法,将K-means聚类、Birch层次聚类、谱聚类和混合高斯聚类作为初级聚类算法,结合轮廓系数对初级聚类算法产生的聚类结果加权并入原始数据,将K-means算法作为次级聚类算法对扩展后的数据集进行聚类分析。其中,针对原始数据和初级聚类算法的聚类结果分别提出自适应的ε函数确定隐私预算,为不同敏感度的数据分配不同程度的Laplace噪声。理论分析和实验结果均表明,与单一聚类算法相比,该算法满足ε-差分隐私保护的同时有效提高了聚类准确性,实现了隐私保护与数据可用性的高度平衡。 相似文献
12.
车货匹配是提高车主和货主信息流通和促进货运交易的关键途径,然而,在实际应用当中,车货匹配需要考虑司机和货主的行为习惯,并且需要根据不平衡数据进行预测。为解决此问题,本文考虑数据不平衡性,结合RUS重抽样方法,整合Logistic Regression、朴素贝叶斯以及LightGBM模型,最终得到Stacking集成学习的车货匹配模型RLBL-Stacking。以运满满数据为例,对数据进行预处理,筛选合适特征进行模型训练。结果表明,相较于其他单一的分类模型,集成算法能在不平衡数据中取得更好的预测结果。 相似文献
13.
为了准确预测腐蚀管道剩余寿命,提高预测精度,提出基于主成分分析(PCA)和鸽群优化算法(PIO)的快速学习网(FLN)预测模型,用于管道剩余寿命预测。通过PCA提取关键腐蚀因素,降低预测指标维度;采用PIO对FLN的输入权值及隐层阈值进行优化,提升预测精度。为检验模型效能,以某注水管道的50组数据为例进行研究,并与FLN、BP两组模型对比分析,结果表明:PCA-PIO-FLM模型的MAE、MAPE、RMSE分别为0.036、0.553、0.0014,均优于对比模型,证明了所构建模型能够准确预测注释管道剩余寿命。 相似文献
14.
介绍了传统的领域覆盖算法和交叉算法,并分析它们各自存在的缺点以及造成这些缺点的原因.针对传统的领域覆盖算法存在的泛化能力不足以及交叉覆盖算法存在的正确率不高的问题,提出了一种新的改进算法--基于集成学习的覆盖算法(CABE).CABE是利用集成学习来整合交叉覆盖算法和领域覆盖算法,是通过对领域覆盖算法中的拒识样本的处理来提升算法的精度.使用UCI数据集进行实验,实验结果表明,改进的算法提高了算法分类的精度. 相似文献
15.
单一机器学习算法进行短期负荷预测存在着泛化能力受限的问题,本文将Stacking 集成学习模型引入到短期负荷预测问题,对于在交叉验证下同一基学习器不同预测模型表现出预测准确度的差异性,根据预测精度对同一基学习器中不同预测结果进行赋权,考虑到不同环境下各影响因子对日负荷值影响程度不同,引入蚁狮算法(ALO)自适应的调整各个影响因子的权值,提高相似日选取方法的准确性,通过相似日选取方法筛选出的相似日集合样本训练改进的Stacking算法预测模型,利用中国北方某地区的负荷数据进行实际算例分析。实验结果表明,在面对负荷影响因素复杂且训练样本较多的情况下。本文所提的方法具有良好的鲁棒性、稳定性和预测精度。 相似文献
16.
随着经济社会的高速发展和工业化建设程度不断提高,水环境问题已经严重影响甚至威胁了人类的健康。近年来,国家大力推行水环境的预测预警,许多专家学者利用人工神经网络等智能方法在富营养化评价及水华预测中得到了较为广泛的运用,也取得了一定成效。然而,人工神经网络的性能受到样本训练算法等方面的影响,在选取合适的神经网络模型、算法以及设置参数麻烦、耗时。随着问题复杂程度的增加,单个网络的隐层节点数将增加很多,训练时间将大大增加,从而造成训练困难。且由于训练过度或不够,往往导致泛化能力较差。为解决此问题,本文在对湖库水华形成机理深入分析的基础上,建立了BP网络的水华预测模型,并利用Bootstrap采样技术获取不同的数据集,分别训练多个BP网络,最终将多个网络进行集成用于建立太湖流域水华预测模型。通过基于Bagging算法的集成学习,可以对样本包含的信息进行充分挖掘,更全面的刻画因素之间的相互联系和变化规律。实验表明基于Bagging算法的BP网络集成模型预测结果与单个BP网络模型预测结果对比,具有较高的预测能力,从而获得了相对理想的预测效果。 相似文献
17.
容器云的迅速发展使业务量迅速增加,对容器资源利用率的未来趋势进行预测,从而提前分配资源来提高资源的利用率并且降低资源的浪费是一种合理的做法。为了实现对容器云资源的合理预测,提出一种基于改进的Stacking集成方法的云资源负载预测模型。模型的第一阶段是通过设立基学习器对云资源负载数据进行特征选择,降低数据集特征的复杂度。第二阶段是使用GA-BP神经网络模型改进的DBN模型(DBN-GA-BP)对第一阶段的特征选择数据进行集成预测。实验结果表明,与单一模型和未改进的Stacking模型对比,该模型具有更高的预测精度。 相似文献
18.
当标识示例的两个标签分别来源于两个标签集时,这种多标签分类问题称之为标签匹配问题,目前还没有针对标签匹配问题的学习算法。 尽管可以用传统的多标签分类学习算法来解决标签匹配问题,但显然标签匹配问题有其自身特殊性。 通过对标签匹配问题进行深入的研究,在连续AdaBoost(real Adaptive Boosting)算法的基础上,基于整体优化的思想,采用算法适应的方法,提出了基于双标签集的标签匹配集成学习算法,该算法能够较好地学习到标签匹配规律从而完成标签匹配。 实验结果表明,与传统的多标签学习算法用于解决标签匹配问题相比,提出的新算法不仅缩小了搜索的标签空间的范围,而且最小化学习误差可以随着分类器个数的增加而降低,进而使得标签匹配分类更加快速、准确。 相似文献
19.