首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 103 毫秒
1.
随机森林理论浅析   总被引:5,自引:0,他引:5  
随机森林是一种著名的集成学习方法,被广泛应用于数据分类和非参数回归。本文对随机森林算法的主要理论进行阐述,包括随机森林收敛定理、泛化误差界以和袋外估计三个部分。最后介绍一种属性加权子空间抽样的随机森林改进算法,用于解决超高维数据的分类问题。  相似文献   

2.
3.
《信息与电脑》2019,(18):59-60
笔者围绕机器学习算法在数据挖掘中的应用展开探讨,首先阐述了机器学习及数据挖掘技术,进而分析了朴素贝叶斯算法、K-近邻法等相关原理,最后对机器学习算法在数据挖掘中的应用,如以机器学习算法为基础的GSM网络在定位中的应用、在改进BP神经网络中的应用等进行分析,希望能够为提高数据挖掘的整体性能提供参考。  相似文献   

4.
随机森林是一种组合分类器技术,相较于决策树等单分类器,具有更好的预测和分类性能,但其也存在一些问题:因为随机森林自身的随机性,导致预测结果存在波动性;所使用的原始数据集样本基数大,维数多,增加了随机森林组合分类器的训练时间。针对以上问题,提出优化随机森林模型,对数据集进行数据集预处理和PCA降维操作,引入累计贡献率。结合选择的最佳阈值进行最终的预测结果分类,提高了模型的训练速度、预测准确率和稳定性。实验证明,该方法具有更优越的预测性能。  相似文献   

5.
预防自然灾害并采取有效的措施进行防护,能有效保障人类生命安全并减少经济损失。在应对森林火灾时,如果能准确预测火灾的毁坏面积,政府和消防人员就能够采取有效的救灾措施控制住灾情。基于此,选取加州大学尔湾分校(University of California Irvine,UCI)网站的森林火灾统计数据,采用随机森林和XGBoost两种集成算法对森林火灾毁坏面积进行预测,并比较两种算法的优势和预测效果。经比较发现,随机森林算法不需要对样本特征进行预筛选,而是通过检测各特征值之间的相关性,平衡误差并进行不断优化,寻找出对火灾面积影响较大的因素。因此,随机森林算法更适用于处理特征值较多的森林火灾数据集。  相似文献   

6.
本文结合URL字符串随机率和URL字符特征,通过Wrapper方法筛选出一组新特征。通过对比不同机器学习算法的准确率,回归率等四个不同的指标,确定以随机森林算法构建了基于URL随机率和随机森林的钓鱼网站检测系统。本系统在实验测试集上表现出的准确率为96.49%,在全体实验数据集上表现的准确率为99.19%。实验相关结果表明,方案改进了钓鱼网站检测的准确率。  相似文献   

7.
沈晶磊  虞慧群  范贵生  郭健美 《计算机科学》2017,44(11):164-167, 186
如今随着推荐系统势头的加强,如何对用户行为进行快速而准确的预测变得愈加重要。通过分析网上社区帖子的点赞和点踩数据,实现了基于随机森林的推荐系统。该系统将实际问题转化为分类模型,并实现了数据处理、特征提取和参数调整。同时,该系统还对用户浏览帖子后是否产生交互行为进行了预测。最后,通过实验仿真并利用F1值对实验结果进行评估。实验结果证明了系统的有效性和效率。  相似文献   

8.
罗知林  陈挺  蔡皖东 《计算机科学》2014,41(4):62-64,74
转发(Retweet)是微博中一个重要的信息传播机制,用户可以将其关注者(Follower)的有趣微博转发到自身平台,分享给他的粉丝(Fan),快速地实现微博信息的传播。主要对微博转发预测进行了研究,首先提取了重要特征,比如用户间的微网络结构、权重比率、用户个人信息等,以研究用户微博转发行为,然后基于以上特征提出了一个随机森林微博转发预测算法(RFMR)。实验结果表明,RFMR算法优于其他分类算法,可以有效地用来预测微博转发。  相似文献   

9.
10.
高校毕业生质量直接关系到高校的社会声誉与发展. 为了准确的评价高校的毕业生质量, 本文基于某高校计算机类毕业生的历史数据, 采用一种改进的随机森林算法构建人才培养质量评价模型. 在训练分类器之前, 利用RF Ranking方法来度量特征重要性并选取75%的特征进行降维处理, 以此改善训练样本的非平衡现象; 通过对基分类器的训练, 测试各个分类器的性能, 依据性能的强弱对单个分类器作加权处理, 以此降低性能较差的分类器对结果的影响. 实践结果表明, 该算法提高了人才培养质量评价的准确率和精确度, 可以在高校人才培养方面起到指导作用.  相似文献   

11.
输电断面稳定超限问题日益突出,为此提出基于机器学习的电网关键断面安全运行自动控制系统.根据极限学习机理论使预测误差最小化,引入核函数获得关键断面精度.设计符合电网在线运行要求的电网关键断面安全运行自动控制网络框架,采用潮流法对断面输电极限功率实施运算,依据调度策略确定控制支路并实施约束,保证系统运行的安全性.控制电网负...  相似文献   

12.
为了维护操作系统运行的稳定性及安全性,提升用户服务质量,提出一种基于机器学习的操作系统故障自动诊断方法.将AR模型系数作为故障系统特征,探究不同状态数和不同混合高斯数对隐马尔可夫模型分类影响,利用极大似然估计法逐步更新模型参数,并计算观测值概率密度函数.采用自组织竞争神经网络完成故障模式区分,引入相似性图概念,按照相关...  相似文献   

13.
针对基于单一判据的电网故障诊断系统存在较高误判率的问题,提出了一种基于DS证据理论的多判据融合决策的电网故障诊断系统的设计方案。该方案采用基于量值区分的门限法、基于电流差动的门限法、基于功率方向的门限法三种判据方法对同一段故障录波数据进行判别,应用DS证据理论融合判别结果,从而可准确判断故障类型和故障位置。实例分析表明,该方案可有效提高电网故障诊断的准确率。  相似文献   

14.
针对传统的电机故障诊断方法往往采用单一信号作为诊断依据,以及利用传统的BP神经网络进行故障诊断时存在的训练速度慢、易陷入局部极小值的缺点,提出了一种基于极限学习机和多源信息融合的电机故障诊断方法.首先将定子电流信号做陷波处理,滤除基波分量;然后对电流及振动信号进行小波包分解和重构,以各频带的小波包能量谱作为故障特征向量训练极限学习机模型;最后将训练好的极限学习机模型作为诊断决策分类器来判断电机的运行状态.实验结果表明,此方法能够准确地诊断电机的故障类型,具有运行速度快、故障诊断准确率高的特点,满足了系统在线实时诊断的要求.  相似文献   

15.
为提升电网故障诊断算法的有效性,提出一种基于改进高斯概率神经网络(GPNN)核相似性合并预测的电网子区间故障诊断策略.首先,针对电网故障诊断中存在的数据不确定性现象,引入概率神经网络对其进行数据处理,同时为进一步提高概率神经网络对于数据不确定性的鲁棒处理效果,利用高斯算法对概率神经网络进行改进;其次,针对大型电网故障诊...  相似文献   

16.
机器学习已经成为当前技术发展热点,由于机器学习具有快速处理大量数据、分析提取有效信息等优点,因此在故障检测与诊断技术中受到了越来越多的关注;文章系统介绍了机器学习和故障检测与诊断的概念、分类,深入了解了基于PCA和随机森林的故障检测方法和国内研究现状,以及基于决策树、支持向量机以及神经网络的故障诊断方法和国内外研究现状,其中重点介绍了卷积神经网络和递归神经网络的应用,并对机器学习算法在故障检测与诊断应用前景进行了展望,大数据时代下,机器学习在故障检测和诊断领域有着绝对优势。  相似文献   

17.
Data visualization plays a crucial role in identifying interesting patterns in exploratory data analysis. Its use is, however, made difficult by the large number of possible data projections showing different attribute subsets that must be evaluated by the data analyst. In this paper, we introduce a method called VizRank, which is applied on classified data to automatically select the most useful data projections. VizRank can be used with any visualization method that maps attribute values to points in a two-dimensional visualization space. It assesses possible data projections and ranks them by their ability to visually discriminate between classes. The quality of class separation is estimated by computing the predictive accuracy of k-nearest neighbor classifier on the data set consisting of x and y positions of the projected data points and their class information. The paper introduces the method and presents experimental results which show that VizRank's ranking of projections highly agrees with subjective rankings by data analysts. The practical use of VizRank is also demonstrated by an application in the field of functional genomics.  相似文献   

18.
为解决传统电网故障分类器无法准确获得故障线路的信息及定位故障的问题,本文提出了基于深度学习的电网故障预警系统.网络中增加由BI-GRU提取的故障线路时间序列特征,从而提高分类器的精度.此外,通过注意力机制学习不同的故障线路或不同的故障状态的时间序列特征,从而加快网络学习效率.最后,将本文所提框架与LSTM、GRU、BI...  相似文献   

19.
为了能够准确地进行装甲车辆电源系统的故障诊断,深入地研究了故障树分析法在其中的应用;首先,以某型装甲车辆电源系统为研究对象,根据系统失效模型和故障机理,将故障树分析法运用于装甲车辆电源系统故障诊断中,建立电源系统故障树模型,进行故障分析与诊断;其次利用电源系统故障诊断平台对电源系统4个模块进行故障模拟仿真研究,可看出故障树分析法能够准确地诊断出电源系统各个模块的故障,检测精度可达94%,取得了预期效果。  相似文献   

20.
现有的机器学习算法不能对加密后的数据进行分析计算,而很多领域如医疗、金融等又要求数据保持机密性和安全性,这促进了加密机器学习的产生和发展。同态加密技术是解决这一问题的主要思路,它可以保证在不解密的情况下对密文进行计算,使得解密后的结果与对明文执行相同计算得到的结果相同。文中对同态加密在加密机器学习中的 相关 应用研究进行了综述,主要介绍了目前用同态加密实现加密机器学习的3种算法(加密神经网络、加密k-NN、加密决策树和完全随机森林),并从正确性、安全性、执行效率方面分析了方案设计,总结并对比了不同加密机器学习算法的构造思路,指出了同态加密用于加密机器学习的关键问题和进一步研究需要关注的内容,为同态加密和加密机器学习提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号