首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
针对智能电网数据繁多、维度较高、难以识别的技术问题,提出了降低大数据维度的构想,并设计出基于随机森林算法的物联网智能电网大数据管理系统。通过采用Bagging算法对数据样本训练、学习,建立起多个决策树构型,根据少数服从多数的投票法原则确定建立决策树的节点和分支,最终建立起成熟的随机森林算法模型,通过随机森林算法模型将智能电网中的大数据从高纬度降低到低纬度。本设计的方案大大减小了大数据处理难度,优化了数据处理的效率,增加了分析问题、解决问题的有效途径,为智能电网的健康、有序运行提供有力保障。  相似文献   

2.
提出一种改进随机森林算法(SP-RF).通过建立数据抽样索引表和随机特征索引表来实现随机森林算法在Spark上的并行化;通过计算随机森林算法中每个决策树的AUC值来给分类能力不同的决策树分配权重;提高随机森林算法在投票环节的分类精度.实验结果表明改进后的随机森林算法分类精度平均提高5%,运行时间平均减少25%以上.  相似文献   

3.
提出一种改进随机森林算法(SP-RF).通过建立数据抽样索引表和随机特征索引表来实现随机森林算法在Spark上的并行化;通过计算随机森林算法中每个决策树的AUC值来给分类能力不同的决策树分配权重;提高随机森林算法在投票环节的分类精度.实验结果表明改进后的随机森林算法分类精度平均提高5%,运行时间平均减少25%以上.  相似文献   

4.
针对教育培训系统发生故障、阻碍教学任务正常进行的问题,将物联网传感器和随机森林算法相结合,建立基于模糊随机森林的教育培训系统故障预测模型。通过物联网的无线采集设备获取教育培训系统的运行参数,利用模糊控制算法优化随机森林算法降低重要度较低特征的干扰。将优化后的数据作为随机森林算法的输入,风险故障存在的程度为输出,通过实例验证模型的有效性。实现表明,基于模糊随机森林的教育培训系统故障预测模型的预测率较高,相较于其他模型来说,具有较好的实际应用性。  相似文献   

5.
为进一步提高随机森林算法分类准确率,提出一种基于决策边界的倾斜森林(oblique forests based on decision boundary,OFDB)分类算法。将决策边界与自适应权重融入随机森林算法框架,采用决策边界作为分裂准则,使原本垂直于数据空间的分裂准则变为倾斜的超平面,有效提高算法对数据空间结构的适应能力。自适应权重改进叶子结点类标号计算方法,有效提高算法对不平衡数据的分类能力。实验结果表明,该算法与随机森林算法相比具有更高的分类准确率与较好的不平衡数据分类能力。  相似文献   

6.
为了提高网络入侵检测的准确率、精确率,降低误报率,提出一种结合随机森林(Random-Forest,RF)的粒子群算法(Particle Swarm Optimization,PSO)优化卷积神经网络(Convolutional Neural Networks,CNN)结构及初始参数算法.该方法结合随机森林理论、PSO的全局寻优特点和CNN提取特征的局部相关性能力.在数据预处理阶段,通过随机森林进行数据特征提取,并作为模型的输入数据.采用粒子群算法优化CNN网络结构,使CNN在非经验指导下自主选择最佳网络结构和初始参数.实验结果表明,该方法在准确率、精确率、误报率方面均优于经典卷积神经网络、粒子群优化反向传播(BP)算法、粒子群优化支持向量机(SVM)算法及目前流行的集成学习方法.  相似文献   

7.
为了提高网络入侵检测的准确率、精确率,降低误报率,提出一种结合随机森林(Random-Forest,RF)的粒子群算法(Particle Swarm Optimization,PSO)优化卷积神经网络(Convolutional Neural Networks,CNN)结构及初始参数算法.该方法结合随机森林理论、PSO的全局寻优特点和CNN提取特征的局部相关性能力.在数据预处理阶段,通过随机森林进行数据特征提取,并作为模型的输入数据.采用粒子群算法优化CNN网络结构,使CNN在非经验指导下自主选择最佳网络结构和初始参数.实验结果表明,该方法在准确率、精确率、误报率方面均优于经典卷积神经网络、粒子群优化反向传播(BP)算法、粒子群优化支持向量机(SVM)算法及目前流行的集成学习方法.  相似文献   

8.
采用支持向量机(SVM)、随机森林(RF)和逻辑回归(LR)等机器学习方法对脑卒中患者进行分类研究,构建脑卒中疾病预测模型,以期为疾病发生提供早期预警.对kaggle网站下载healthcare-dataset-stroke-data的数据通过SMOTE智能过抽样算法构建均衡数据集,运用支持向量机、随机森林和逻辑回归算法构建脑卒中预测模型.将SMOTE算法优化前后的预测结果进行比较分析,并采用支持向量机、随机森林和逻辑回归算法对优化后的数据集构建疾病预测模型,其结果的准确率、精确度、召回率和ROC值都有明显提高.仿真实验结果可知SMOTE+随机森林算法预测模型的准确率、精确度、ROC值都优于支持向量机和逻辑回归预测模型,可用于脑卒中疾病的早期预测,为医疗手段干预赢得时间,对降低脑卒中的发病具有重要意义.  相似文献   

9.
利用高分二号数据提取香蕉林信息及精度分析   总被引:2,自引:0,他引:2  
针对海南农田地块细碎以及多云多雨气候条件下获取多时相的高质量卫星影像往往存在困难等问题,提出了一种利用单时相高分二号高分辨率卫星影像和随机森林算法的香蕉林信息提取方法。主要通过从高分辨率遥感影像中提取香蕉林的光谱和纹理等特征变量,然后利用综合不同光谱与纹理特征变量的随机森林分类算法进行香蕉林信息提取,并与以往的支持向量机分类算法进行了精度对比。结果表明,综合光谱和纹理信息的随机森林分类算法提取香蕉林空间分布结果最优,提取的香蕉林制图精度(PA)达到93.56%,用户精度(UA)达到87.43%;相比于支持向量机分类算法,PA和UA分别提高了11.99%和7.55%;相比只考虑光谱信息的随机森林分类算法,考虑纹理信息的随机森林分类算法提取的香蕉林PA提高了7.41%,UA提高了16.80%。研究结果可为人工园林的遥感信息提取提供技术参考。  相似文献   

10.
嵌入式大气数据传感(FADS)系统由于其诸多优势成为现在战斗机设计中的关键技术之一。开发了基于BP(反向传播)人工神经网络的FADS算法和基于随机森林算法的故障识别与处理算法。该嵌入式大气数据系统算法以迎角和马赫数为分段依据,分别计算大气数据。故障识别则采用随机森林算法自动识别出故障测压点,在将故障测压点剔除后,采用不含故障点压强的组合预测各大气数据。采用飞行数据测试开发FADS系统算法,结果表明:该算法计算大气参数较为准确,迎角误差小于0.2°,侧滑角误差小于0.3°,马赫数误差小于0.0105,静压误差小于300 Pa。采用单个测压点故障的压强组合测试了故障识别与容错算法的性能,测试结果显示该算法能够准确识别出故障测压点压强,采用的飞行曲线测试中准确度达到100%,且各大气数据计算精度可达上述无故障压强时的精度,有效降低了故障压强对FADS系统算法计算精度的影响。  相似文献   

11.
随着5G通信技术的研究以及新型基础设施的建设, 智能电网得到了快速发展. 同时, 在大数据时代, 万物互联导致海量的设备接入电力网络, 也给智能电网带来了较大的负担, 电力网络的稳定性问题亟待解决. 因此, 本文提出了一种基于CNN的智能电网稳定性预测算法, 通过收集电力网络产生的数据, 经过CNN模型的处理, 最后输出智能电网稳定性的判别结果. 经过仿真验证, 该算法与SVM、AdaBoost, 随机森林相比, 具有较高的准确率; 同时, 本文采用了4种不同的优化算法去改善CNN模型, 带有动量的SGD算法可以达到98.13%预测准确度, 利用该模型可以有效帮助电力系统对未知的问题提前预警, 降低了安全隐患并减少了电力事故的发生.  相似文献   

12.
故障预测和健康管理技术(PHM)在现代工程系统中能够在系统具备较高复杂度的情况下,有效保障其可靠性和安全性。在机械故障诊断中对于采集到的原始数据的高维特征量的处理较为复杂,并且在实际应用中趋势预测的精度要求较高,针对该问题提出一种基于主成分分析(PCA)与随机森林算法的轴承故障趋势预测方法。该方法利用PCA对提取的原始轴承数据特征量进行线性降维,并选取其中主成分特征量,输出非线性时间序列数据。原始数据经过PCA处理得到非线性时间序列,将该序列作为随机森林算法的输入进行故障趋势预测,并把预测结果与BP神经网络模型预测的结果进行对比,结果表明随机森林在故障趋势预测上在精度相较于BP神经网络有显著提高,是一种有效的故障趋势预测方法。  相似文献   

13.
针对无线传感器网络(WSN)节点容易出现故障从而导致网络瘫痪的问题,提出了一种基于改进的深度森林的无线传感器网络故障分类方法;深度森林是基于森林的集成学习方法,其输入是多维特征向量,特征向量将由多粒度扫描和级联森林这两个主要组成部分进行处理,多粒度扫描通过处理数据之间的关系来增强数据表示的能力,级联森林用于分类或预测;针对级联森林部分随着层数的增加可能造成的维数问题进行优化后,将该算法用于故障分类可以提高故障诊断的精确度;在仿真验证阶段,将该算法与深度神经网络(DNN)和支持向量机(SVM)算法进行对比;结果显示,该算法可以准确地识别出不同的故障类型,并且在损坏故障和电源故障的识别达到了最高精度,综合平均精度在98.4%;对偏移故障、漂移故障和通信故障的识别略低于卷积神经网络(CNN)算法,但综合训练时间、参数调节来看,该算法更能满足实际工程的需要。  相似文献   

14.
随机森林在bootstrap的基础上通过对特征进行抽样构建决策树,以牺牲决策树准确性的方式来降低决策树间的相关性,从而提高预测的准确性。但在数据规模较大时,决策树间的相关性仍然较高,导致随机森林的性能表现不佳。为解决该问题,提出一种基于袋外预测的改进算法,通过提高决策树的准确性来提升随机森林的预测性能。将随机森林的袋外预测与原特征相结合并重新训练随机森林,以有效降低决策树的VC-dimension、经验风险、泛化风险并提高其准确性,最终提升随机森林的预测性能。然而,决策树准确性的提高会使决策树间的预测趋于相近,提升了决策树间的相关性从而影响随机森林最终的预测表现,为此,通过扩展空间算法为不同决策树生成不同的特征,从而降低决策树间的相关性而不显著降低决策树的准确性。实验结果表明,该算法在32个数据集上的平均准确率相对原始随机森林提高1.7%,在校正的paired t-test上,该方法在其中19个数据集上的预测性能显著优于原始随机森林。  相似文献   

15.
为深入全面地对不同用电群体用户进行分析,实现停电敏感用户的精准识别,制定针对性的风险防控策略,有效减少客户来电风险,本文提出一种基于随机森林的停电敏感模型,对客户停电的敏感程度进行划分,进而实现差异化地运营管理客户,为营销部、设备部、客服中心等部门提供有效数据支撑,助力电网营销管理。本文将随机森林模型引入停电敏感预测中,并将预测结果与停电工单结合输出停电敏感高风险、中风险、低风险用户。在此基础上,以浙江湖州市2016年1月1日至2018年12月31日的数据为例进行了实例验证。模型结果显示,随机森林的预测结果准确性为88%,模型覆盖率为76.5%,模型的AUC值为0.77,结果优于逻辑回归和神经网络模型,模型的优良性为电网客户服务风险提供有力的数据参考。  相似文献   

16.
Large sized transformers are an important part of global power systems and industrial infrastructures. An unexpected failure of a power transformer can cause severe production damage and significant loss throughput the power grid. In order to prevent power facilities from malfunctions and breakdowns, the development of real-time monitoring and fault prediction tools are of great interests to both researches and practitioners. This research develops an intelligent engineering asset management system for power transformer maintenance. The system performs real-time monitoring of key parameters and uses data mining and fault prediction models to detect transformers’ potential failure under various operating conditions. Principal component analysis (PCA) and a back-propagation artificial neural network (BP-ANN) are the algorithms adopted for the prediction model. Historical industrial power transformer data from Taiwan and Australia are used to train and test the failure prediction models and to verify the proposed general methodology as comparative case studies. The PCA algorithm reduces the number of the primary dissolved gasses as the key factor values for BP-ANN prediction modeling inputs. The system yields effective predictions when verified using various operating condition data from Australia and Taiwan power companies. The accuracy rates are much higher when compared to the fault prediction results without using PCA. The intelligent system combining PCA and BP-ANN algorithms, developed in this research, can be adopted by asset managers in different regions to develop suitable maintenance and repair strategies for transformer failure preventions.  相似文献   

17.
煤与瓦斯突出是煤矿开采过程中主要的动力灾害之一,针对煤与瓦斯突出等级预测问题,提高突出预测的准确率,选取最大主应力、瓦斯压力、瓦斯含量、顶板岩性、距断裂距离、煤层厚度、开采垂深、绝对瓦斯涌出量和相对瓦斯涌出量9个影响因素作为煤与瓦斯突出等级预测的评价指标,同时对相关程度较高的评价指标进行因子分析,提取公共因子,用随机森林算法进行训练预测,建立了基于因子分析的煤与瓦斯突出预测的随机森林模型。通过煤矿实测19组煤与瓦斯突出的数据作为训练样本数据集进行模型的训练,5组数据作为该预测模型的测试数据,进行煤与瓦斯突出预测,同时通过其他预测模型预测结果的对比,验证了随机森林算法在煤与瓦斯突出预测中具有较高的准确度。  相似文献   

18.
为提升光伏、风电等分布式能源大量接入电网后短期电力负荷的预测精度,促进电网消纳能力提升,本文对光伏出力及短期用电负荷采用小波——径向基函数(RBF)神经网络预测方法;对风力发电首先利用总体平均经验模态分解(EEMD)方法对其功率数据分解,再采用BP神经网络、RBF神经网络、小波神经网络、ELMAN神经网络四种神经网络预测方法进行预测,并用粒子群算法(PSO)和灰色关联度(GRA)修正。最后,利用等效负荷的概念,分析光伏、风力发电并网对于短期电力负荷预测的影响,并将三种模型有效结合,得到了考虑光伏及风力发电并网的电力系统短期负荷预测的等效负荷预测模型。实例分析表明,本文所提方法相较于其他方法在该预测项目上具有相对更高的预测精度。  相似文献   

19.
目前,我国电网企业对于识别停电投诉风险,开展用户停电敏感程度分析的研究工作还处在起步阶段.为了有效地分析停电用户的敏感程度,提出了一种基于改进随机森林算法的停电敏感用户分类算法.首先,对原始数据进行清洗、特征选择等预处理;接着,采用SMOTE算法增加少数敏感用户样本数据量,解决数据分布不均匀问题;然后,以Fisher比作为特征的重要性度量,按比例随机采样选取具有代表性的特征构成子特征空间;最后,利用随机森林算法识别停电敏感用户.通过在真实停电数据上的实验,验证了提出的方法不仅具有较好的准确性和时间性能,而且可以有效处理高维、冗余特征的数据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号