首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 259 毫秒
1.
近几年,随着航空市场的快速发展,对于航空公司而言,如何在增加市场占有率的同时,对客户的流失进行有效的控制也刻不容缓.基于随机森林算法,根据航空客户数据,建立流失预测模型,对客户是否已流失进行预测研究,将传统的RFM客户价值模型进行改进,结合随机森林算法对客户流失进行预测.实验结果表明,基于RFM模型的随机森林算法构建的...  相似文献   

2.
大坝潜在风险预测在降低大坝溃坝概率、减少水库大坝失事事件方面发挥着重要的作用。本文基于随机森林方法构建基于数据驱动的大坝潜在风险预测模型,减少在建模过程中的人工干预,实现风险预测高效化、智能化。首先预处理大坝基础数据资料,构建训练数据集和测试数据集,然后构建大坝风险预测模型并利用训练数据训练模型,利用GridSearch和Cross-validation确定模型最优情况的参数,并通模型评价指标和多种算法对比结果全面评估模型性能。实验结果表明:基于随机森林的风险预测模型在测试数据上的准确度率为90.54%,模型准确度相较于ANN、KNN、SVM算法高出4.87%、18.59%、37.93%,满足实际应用的需求。  相似文献   

3.
随着我国金融行业的快速发展,个人信贷业务市场份额也在快速增长,传统的通过人工方式进行风险判定的模式已经越来越无法满足当代金融市场的发展需求。因此,大数据及机器学习技术在欺诈风险识别领域的应用也逐渐深化起来。本文提出一种利用手机通讯录构建的复杂网络,结合XGBoost算法[1]实现欺诈风险的识别模型。  相似文献   

4.
针对教育培训系统发生故障、阻碍教学任务正常进行的问题,将物联网传感器和随机森林算法相结合,建立基于模糊随机森林的教育培训系统故障预测模型。通过物联网的无线采集设备获取教育培训系统的运行参数,利用模糊控制算法优化随机森林算法降低重要度较低特征的干扰。将优化后的数据作为随机森林算法的输入,风险故障存在的程度为输出,通过实例验证模型的有效性。实现表明,基于模糊随机森林的教育培训系统故障预测模型的预测率较高,相较于其他模型来说,具有较好的实际应用性。  相似文献   

5.
为深入全面地对不同用电群体用户进行分析,实现停电敏感用户的精准识别,制定针对性的风险防控策略,有效减少客户来电风险,本文提出一种基于随机森林的停电敏感模型,对客户停电的敏感程度进行划分,进而实现差异化地运营管理客户,为营销部、设备部、客服中心等部门提供有效数据支撑,助力电网营销管理.本文将随机森林模型引入停电敏感预测中...  相似文献   

6.
传统医保信息欺诈检测算法存在运行时间长、效率低的问题,无法保障患者医保信息安全,为了解决该问题,采用基于随机森林算法对失稳网络医保信息欺诈行为进行检测。通过混合抽样可抽取在失稳情况下的数据,并建立非平衡数据分类算法抽样机制;进行迭代随机森林数据计算,采用多数投票法构建基分类器,并以此为基础筛选异常数据;利用模型实现该算法对医保信息欺诈检测。设计对比实验,验证该算法有效性。通过实验结果可知,基于随机森林算法运行时间较短、效率高。  相似文献   

7.
随着大数据时代的到来,数据信息呈几何倍数增长。传统的分类算法将面临着极大的挑战。为了提高分类算法的效率,提出了一种基于弱相关化特征子空间选择的离散化随机森林并行分类算法。该算法在数据预处理阶段对数据集中的连续属性进行离散化。在随机森林抽取特征子空间阶段,利用属性向量空间模型计算属性间的相关性,构造弱相关化特征子空间,使所构建的决策树之间相关性降低,从而提高随机森林的分类效果;并通过研究随机森林的并行化策略,结合MapReduce框架,改进并实现了随机森林模型构建过程的双重并行化,进一步改善了算法的计算效率。  相似文献   

8.
通信网络安全的风险因素具有显著的复杂性与不确定性,且相关数据内存在一定噪声,由此导致通信网络安全风险评估结果存在一定误差。针对这一问题,研究基于随机森林算法的通信网络安全风险评估方法,选取光缆、行政交换机以及录音设备等指标构建通信网络安全风险评估指标体系,并收集指标相关数据生成初始样本集。利用Bootstrapping算法在初始样本集合内重抽样,获取若干个子训练样本集合,同时生成若干棵分类树,汇聚全部分类树,构建基于随机森林算法的评估模型。模型内各分类树均具有一次投票权,经由若干次的投票过程获取最终通信网络安全风险评估结果。实验结果显示该方法对于数据噪声有较高的容忍度,可准确评估测试对象风险等级。  相似文献   

9.
杨佳 《信息与电脑》2022,(22):89-91
传统的电商财务风险评估系统通过建立分序列标准模型,计算电商财务数据的风险权重值,由于缺乏对风险数据的有效挖掘,导致评估效果不佳。因此,提出基于关联规则算法的电商财务风险评估系统。首先,构建数据采集模块和传输控制模块,作为系统的硬件支持。其次,采用关联规则算法,计算风险数据的置信度和支持度,实现对风险数据的挖掘。最后,建立风险评估指标体系,构建风险评估模型。在实验中,对提出的方法进行评估性能的验证。实验结果表明,采用提出的系统评估电商财务的风险,其风险预测的误差概率较小,具备较高的评估精度。  相似文献   

10.
研究森林资源真实形态建模问题.由于森林树数值特征和机体形态千变万化,数学模型很难表达真实性,传统的三维空间数据模型方法难以真实反映森林资源的复杂形态.为解决上述问题,采用了八叉树算法有效解决了森林模型的计算复杂性,同时又提出了多尺度八叉树细分算法,结合地理信息系统(GIS),构建真实三维森林形态模型.根据八叉树细分算法的形态对象,满足了数据多尺度组织和划分的需求,以空间体元建立起了各种树木对象之间的联系,为空间分析和森林资源的可视化提供了数据支持.仿真结果表明提出改进算法算法能准确高效地实现森林图像真实感,并能适合常见复杂条件下三维复杂森林形态模型的构建.  相似文献   

11.
With the rapid development and popularization of new-generation technologies such as cloud computing, big data, and artificial intelligence, the construction of smart grids has become more diversified. Accurate quick reading and classification of the electricity consumption of residential users can provide a more in-depth perception of the actual power consumption of residents, which is essential to ensure the normal operation of the power system, energy management and planning. Based on the distributed architecture of cloud computing, this paper designs an improved random forest residential electricity classification method. It uses the unique out-of-bag error of random forest and combines the Drosophila algorithm to optimize the internal parameters of the random forest, thereby improving the performance of the random forest algorithm. This method uses MapReduce to train an improved random forest model on the cloud computing platform, and then uses the trained model to analyze the residential electricity consumption data set, divides all residents into 5 categories, and verifies the effectiveness of the model through experiments and feasibility.  相似文献   

12.
利率市场化、大数据迅速发展,银行业均表现出明显的"二八定律"现象,20%的优质客户占据了银行的大部分资产.那么,如何防止银行客户流失,尤其是优质客户的流失,已经成为银行越来越关注的问题.因此,建立优质客户流失预警模型就显得尤为重要.以某商业银行为例,重新对客户流失进行定义,重点关注银行优质客户的流失预警,首先使用AP聚...  相似文献   

13.
为解决互联网时代线上贷款业务量庞大带来的困扰,优化快速迭代的数据模型,从线上贷款业务的特点出发,以Spark分布式计算引擎为核心设计并实现了能够并行处理非平衡数据的加权随机森林算法.该算法从特征切分点抽样统计、特征分箱、逐层训练三个角度对加权随机森林算法进行并行化优化.该算法有效提高了随机森林算法的分类准确率,同时有效降低了决策过程中出现的平局现象.对非平衡数据,该文章通过SMOTE算法对数据进行重构,较好的保留了原有数据集信息.实验表明,该算法能够有效提高放贷效率性与及时性,极大的提高了生产力.  相似文献   

14.
王佳  徐蔚鸿 《计算机应用》2011,31(2):501-503
支持向量机(SVM)可以很好地用来解决分类问题,参数优化尤其重要。混合核函数的引入,使得SVM又多了一个可调参数。针对该参数用人工或经验的方法获取具有局限性,采用动量粒子群(MPSO)对SVM基本参数、混合可调核参数进行综合寻优,来寻找最佳参数组合。通过UCI数据仿真,对比结果表明:所提优化方法能够快速有效地提取最佳参数组合,所得SVM性能明显提高,分类效果更好。  相似文献   

15.
随机森林在bootstrap的基础上通过对特征进行抽样构建决策树,以牺牲决策树准确性的方式来降低决策树间的相关性,从而提高预测的准确性。但在数据规模较大时,决策树间的相关性仍然较高,导致随机森林的性能表现不佳。为解决该问题,提出一种基于袋外预测的改进算法,通过提高决策树的准确性来提升随机森林的预测性能。将随机森林的袋外预测与原特征相结合并重新训练随机森林,以有效降低决策树的VC-dimension、经验风险、泛化风险并提高其准确性,最终提升随机森林的预测性能。然而,决策树准确性的提高会使决策树间的预测趋于相近,提升了决策树间的相关性从而影响随机森林最终的预测表现,为此,通过扩展空间算法为不同决策树生成不同的特征,从而降低决策树间的相关性而不显著降低决策树的准确性。实验结果表明,该算法在32个数据集上的平均准确率相对原始随机森林提高1.7%,在校正的paired t-test上,该方法在其中19个数据集上的预测性能显著优于原始随机森林。  相似文献   

16.
随着信息技术和网络的迅猛发展,支付业务、技术及工具不断创新,移动支付的发展在逐渐加快。移动支付给人们生活带来方便和快捷的同时,也存在着较高的潜在风险,容易遭受非法入侵和恶意攻击。就移动支付风险的分析及风险值的计算理论方面开展工作,在贝叶斯网络的基础上,针对移动支付的主要组成主体,提出移动支付风险评估模型,通过使用该模型进行移动支付风险评估不仅可以对目前移动支付的风险进行评估,还可以根据风险评估结果引导风险控制,对比风险控制前后的风险值判断风险控制的效果,通过案例分析,提出的移动支付风险评估模型可以很好地完成移动支付的风险评估要求。  相似文献   

17.
如何准确高效地预测销量是企业一直以来关注的重要问题.传统的时间序列预测方法虽然在研究和实践中占主导地位,但是存在一定的局限性.随着大数据的发展,电商企业能获取前所未有的数据量和数据特征,仅利用过去的行为和趋势很难准确地对销量进行预测.本文提出一种基于随机森林、GBDT、XGBoost算法的成本厌恶偏向性组合预测模型,并...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号