首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
为深入全面地对不同用电群体用户进行分析,实现停电敏感用户的精准识别,制定针对性的风险防控策略,有效减少客户来电风险,本文提出一种基于随机森林的停电敏感模型,对客户停电的敏感程度进行划分,进而实现差异化地运营管理客户,为营销部、设备部、客服中心等部门提供有效数据支撑,助力电网营销管理。本文将随机森林模型引入停电敏感预测中,并将预测结果与停电工单结合输出停电敏感高风险、中风险、低风险用户。在此基础上,以浙江湖州市2016年1月1日至2018年12月31日的数据为例进行了实例验证。模型结果显示,随机森林的预测结果准确性为88%,模型覆盖率为76.5%,模型的AUC值为0.77,结果优于逻辑回归和神经网络模型,模型的优良性为电网客户服务风险提供有力的数据参考。  相似文献   

2.
当重要用户或敏感用户发生停电事件时,电网企业将面临较大压力,所以对用电敏感用户进行准确辨识,降低停电对其带来的损失具有重要意义。提出了采用蚁群算法优化决策树算法,主要从属性离散化,启发信息,信息素更新等方面进行优化。通过UCI数据库的分类数据建立仿真对比实验,与传统的SVM和决策树方法进行实验对比,验证了本文所提方法具有更高的分类准确性。将所提方法与传统的SVM和Logistic算法进行仿真对比,验证所提方法更适用于用户停电敏感度的分析。  相似文献   

3.
在电信运营商领域,外呼推荐是一种重要的推荐产品和服务的途径。实现了一种基于运营商大数据的自动外呼推荐系统,该系统能够挖掘用户的行为特征并且使用机器学习的方法预测用户对于被推荐产品的接受可能性。传统推荐系统使用的模型算法为矩阵分解、大规模稀疏特征分类、神经网络等。采用随机森林算法的主要原因是随机森林具有并行化程度高、训练速度快、生成的决策树可解释等诸多优点,适合于基于电信业数据的推荐系统。该外呼推荐系统基于Hadoop、Impala和Spark等大数据处理平台及工具,使用随机森林分类器作为核心算法,将用户最近的行为特征回归为接受外呼推荐产品的可能性。在线测试表明使用该系统与当前部署的人工随机外呼相比,能够提升约41%的用户接受率;同时,根据模型算法输出特征的重要性,进一步给出了两类用户的特征分析。  相似文献   

4.
本文提出了一种基于MPU9250微处理器的人体运动识别的方法. 用户在佩戴手环的情况下进行各类运动, 手环即可自动采集并存储用户在运动过程中产生的加速度数据. 分析这些数据可以判别人体运动的类别. 通过手环内嵌的加速度传感器采集运动者在X, Y, Z 3个方向上的加速度, 经过滤波算法过滤后, 分别在时域和频域两个方面对数据进行分析, 再经过特征工程提取34个相关特征, 使用特征选择算法选取主要的16个特征, 减小算法复杂度. 实验比较了支持向量机(SVM), 决策树(decision tree)和随机森林(random forest) 3种方法, 对走路、跑步、羽毛球正手挥拍、打乒乓球、划船5种运动模式进行分类, 结果表明随机森林准确率最佳, 可达到97%以上.  相似文献   

5.
针对随机森林算法静态性、容易陷入局部最优等问题,提出了一种蜜蜂交配优化的随机森林算法,并将该算法应用于基于加速度传感器的人体姿态识别。设计了一套以三轴加速度传感器MMA7260与无线通信模块CC2430相结合的数据采集系统,采集了五种日常行为和一种异常行为;从加速度值中提取了近斜率、前后差、均值、均方根和信号幅值面积5类特征矢量;采用改进的随机森林算法训练行为模型和进行分类识别。实验结果表明:该算法能有效地识别六种行为,具有较高的分类预测准确率和行为识别率,且具有较强的稳定性、鲁棒性、全局寻优和抗噪声能力。  相似文献   

6.
师彦文  王宏杰 《计算机科学》2017,44(Z11):98-101
针对不平衡数据集的有效分类问题,提出一种结合代价敏感学习和随机森林算法的分类器。首先提出了一种新型不纯度度量,该度量不仅考虑了决策树的总代价,还考虑了同一节点对于不同样本的代价差异;其次,执行随机森林算法,对数据集作K次抽样,构建K个基础分类器;然后,基于提出的不纯度度量,通过分类回归树(CART)算法来构建决策树,从而形成决策树森林;最后,随机森林通过投票机制做出数据分类决策。在UCI数据库上进行实验,与传统随机森林和现有的代价敏感随机森林分类器相比,该分类器在分类精度、AUC面积和Kappa系数这3种性能度量上都具有良好的表现。  相似文献   

7.
随着设备的迭代,网络流量呈现指数级别的增长,针对各种应用的攻击行为越来越多,从流量层面识别并对这些攻击流量进行分类具有重要意义。同时,随着物联网设备的激增,针对这些设备的攻击行为也逐渐增多,造成的危害也越来越大。物联网入侵检测方法可以从这些海量的流量中识别出攻击流量,从流量层面保护物联网设备,阻断攻击行为。针对现阶段各类攻击流量检测准确率低以及样本不平衡问题,提出了基于重采样随机森林(RF,random forest)的入侵检测模型——Resample-RF,共包含3种具体算法:最优样本选择算法、基于信息熵的特征归并算法、多分类贪心转化算法。在物联网环境中,针对不平衡样本问题,提出最优样本选择算法,增加小样本所占权重,从而提高模型准确率;针对随机森林特征分裂效率不高的问题,提出基于信息熵的特征归并算法,提高模型运行效率;针对随机森林多分类精度不高的问题,提出多分类贪心转化算法,进一步提高准确率。在两个公开数据集上进行模型的检验,在 IoT-23 数据集上 F1 达到0.99,在Kaggle数据集上F1达到1.0,均具有显著效果。从实验结果中可知,提出的模型具有非常好的效果,能从海量流量中有效识别出攻击流量,较好地防范黑客对应用的攻击,保护物联网设备,从而保护用户。  相似文献   

8.
周先亭  黄文明  邓珍荣 《计算机科学》2017,44(7):191-196, 220
针对目前微博转发行为预测具有的特征选择任意性、准确率不高的问题,提出了融合异常检测与随机森林的微博转发行为预测方法。首先,提取用户基本特征、博文基本特征、博文内容主题特征,并基于相对熵计算用户活跃度、博文影响力;其次,通过结合过滤式与封装式特征选择方法筛选出关键特征组;最后,融合异常检测与随机森林算法,依据筛选后的关键特征组进行微博转发行为预测,并利用袋外数据误差估计设置随机森林中的决策树和特征数。在真实新浪微博数据集上与基于逻辑回归、决策树、朴素贝叶斯、随机森林等算法的微博转发行为预测方法进行实验对比,结果表明所提方法的预测准确率(90.5%) 高于基准方法中最优的随机森林方法的预测准确率,同时验证了特征筛选方法的有效性。  相似文献   

9.
虚拟空间中在线同源用户具有相似行为特征,但现有相似性度量算法难以对其进行有效识别。提出一种基于序列对齐的在线同源用户识别算法,根据在线用户行为日志提取点击流数据,采用序列对齐方法计算在线用户的行为相似度,将其用行为相似度矩阵表示并对用户进行层次聚类,以识别虚拟空间中的在线同源用户,同时分析不同维度的用户特征属性对用户行为相似性的影响程度。实验结果表明,该算法能准确识别出在线同源用户,用户行为相似性受性别、户籍和教育程度3种特征属性影响较大,受年龄、社会阶层和收入水平的影响较小。  相似文献   

10.
易树平  李嘉佳  易茜 《控制与决策》2020,35(11):2715-2722
为保障人-网站交互的可靠性和可信性,以探寻交互行为模式的独特性为出发点,采用行为流图描述用户与网站的交互活动,通过分析可信交互行为模式提取与用户生理及心理特性相关的交互行为特征,提出一种以可信行为特征作为度量的可信交互检测方法,并基于某网站真实日志数据验证所提可信行为特征的功效.将用户一次会话作为记录单元,描绘出用户与交互环境、工具、会话行为和所在页面4个维度相结合的行为流图;然后,依据数据分析,提取可信行为特征参数并使用SMOTE算法平衡数据集;最后,利用决策树和随机森林算法完成用于检测交互可信性的模型训练与测试.通过实验对实际数据进行检测,所提出方法在决策树模型中对用户不可信行为的错误接受率为0.44%,随机森林算法中则低至0.31%.研究结果表明,可信行为特征的组合具有用户可辨别性和独特性,证明了人-网站交互行为模式具有个体特性,与他人存在差异性,可用于检测交互行为发起者与账户真实所有者间身份的一致性.  相似文献   

11.
近几年,随着航空市场的快速发展,对于航空公司而言,如何在增加市场占有率的同时,对客户的流失进行有效的控制也刻不容缓。基于随机森林算法,根据航空客户数据,建立流失预测模型,对客户是否已流失进行预测研究,将传统的RFM客户价值模型进行改进,结合随机森林算法对客户流失进行预测。实验结果表明,基于RFM模型的随机森林算法构建的客户流失模型拥有更具有说服力的指标选取,AUC值达到0.92,且准确率较高。利用该模型可对航空公司客户流失进行较为准确的预测,对流失客户进行分类,为民航企业提供营销策略。  相似文献   

12.
彭昂  王如龙  陈泉泉  张锦 《计算机应用》2010,30(7):1930-1932
针对电信客户的有效细分问题,利用属性相似度度量思想,提出了一种面向复杂属性的聚类算法。该算法用复杂属性分布相似度函数衡量对象的相似性,然后根据相似性建立图模型,最后对图进行分割进行聚类。相比于传统基于选维和降维的聚类分析算法,提出的算法能有效处理高维数据和复杂属性。同时,算法在参数调节时,不需遍历原始数据,也减少了人工干预。利用真实电信客户数据进行的模拟实验也表明,提出的算法具有良好性能,可以有效解决电信客户细分问题。  相似文献   

13.
李鲜  王艳  罗勇  周激流 《计算机应用》2019,39(5):1485-1489
针对医学图像中存在的灰度对比度低、器官组织边界模糊等问题,提出一种新的随机森林(RF)特征选择算法用于鼻咽肿瘤MR图像的分割。首先,充分提取图像的灰度、纹理、几何等特征信息用于构建一个初始的随机森林分类器;随后,结合随机森林特征重要性度量,将改进的特征选择方法应用于原始手工特征集;最终,以得到的最优特征子集构建新的随机森林分类器对测试图像进行分割。实验结果表明,该算法对鼻咽肿瘤的分割精度为:Dice系数79.197%,Acc准确率97.702%,Sen敏感度72.191%,Sp特异性99.502%。通过与基于传统随机森林和基于深度卷积神经网络(DCNN)的分割算法对比可知,所提特征选择算法能有效提取鼻咽肿瘤MR图像中的有用信息,并较大程度地提升小样本情况下鼻咽肿瘤的分割精度。  相似文献   

14.
有效预测停电敏感度高的客户,可为电力服务部门开展精准营销和差异化服务提供数据与决策支持。本文提出一种基于ksupport稀疏逻辑回归的客户停电敏感度评价算法。不同于常用的l1范数,ksupport范数是对l0范数更为紧致的凸松弛,并能够同时选择多个关联性强的因子进行预测,有利于提升预测准确性。算法首先从客户基本信息、用电信息、 缴费信息、95598工单、停电事件等多个维度筛选用于敏感性预测的自变量(因素),收集各用户的因素信息形成样本数据集。进一步构建停电敏感性预测的ksupport稀疏逻辑回归模型,建立模型快速求解的前向后向算子分裂迭代优化算法,转化为2个子问题的快速迭代。通过优势分析法确定回归模型中对目标变量具有显著影响的自变量因素。运用某省级电网公司近百万客户数据对建立的预测模型进行校验与评估,达到良好的预测准确率,实验结果验证了本文模型的有效性。  相似文献   

15.
利率市场化、大数据迅速发展,银行业均表现出明显的“二八定律”现象,20%的优质客户占据了银行的大部分资产。那么,如何防止银行客户流失,尤其是优质客户的流失,已经成为银行越来越关注的问题。因此,建立优质客户流失预警模型就显得尤为重要。以某商业银行为例,重新对客户流失进行定义,重点关注银行优质客户的流失预警,首先使用AP聚类算法进行属性选择,然后使用随机森林方法建立客户流失预警模型,预测零售优质客户未来3个月流失的可能性。为了验证该方法的有效性,首先在UCI数据集上进行验证,得到了较好的效果,然后使用该方法构建银行业优质客户流失预测模型,实验结果表明该模型的实际预测效果相较于一般的决策树方法,具有更高的准确性。  相似文献   

16.
基于遗传算法的顾客购买行为特征提取   总被引:2,自引:0,他引:2  
提出一种基于遗传算法的顾客行为特征提取算法。首先,采用Tanimoto 相似度来度量顾客间购买行为,并设计遗传聚类算法对顾客群体进行划分,把具有相似购买行为顾客聚集为一类。然后,针对不同顾客群体的购买行为特征,设计一种基于遗传算法的多种群特征提取方法,从各个子群体中发现顾客的购买行为的知识。为了增强种群内部协同进化能力和规则质量,我们采用最近邻替代遗传策略和局部搜索策略。使用实际零售数据集对整个算法进行验证,并与经典的Apriori算法进行比较。实验结果表明该算法在不需要产生频繁项集的情况下,可较高效生成精简规则集,在规则形式方面也更加灵活。最后,对实验结果进行详细分析。  相似文献   

17.
Most marketers have difficulty in identifying the right customers to engage in successful campaigns. So far, customer segmentation is a popular method that is used for selecting appropriate customers for a launch campaign. Unfortunately, the link between customer segmentation and marketing campaign is missing. Another problem is that database marketers generally use different models to conduct customer segmentation and customer targeting. This study presents a novel approach that combines customer targeting and customer segmentation for campaign strategies. This investigation identifies customer behavior using a recency, frequency and monetary (RFM) model and then uses a customer life time value (LTV) model to evaluate proposed segmented customers. Additionally, this work proposes using generic algorithm (GA) to select more appropriate customers for each campaign strategy. To demonstrate the efficiency of the proposed method, this work performs an empirical study of a Nissan automobile retailer to segment over 4000 customers. The experimental results demonstrate that the proposed method can more effectively target valuable customers than random selection.  相似文献   

18.
随机森林(random forest,RF)算法虽应用广泛且分类准确度很高,但在面对特征维度高且不平衡的数据时,算法分类性能被严重削弱。高维数据通常包含大量的无关和冗余的特征,针对这个问题,结合权重排序和递归特征筛选的思想提出了一种改进的随机森林算法RW_RF(ReliefF&wrapper random forest)。首先引用ReliefF算法对数据集的所有特征按正负类分类能力赋予不同的权值,再递归地删除冗余的低权值特征,得到分类性能最佳的特征子集来构造随机森林;同时改进ReliefF的抽样方式,以减轻不平衡数据对分类模型的影响。实验结果显示,在特征数目很多的数据集中,改进算法的各评价指标均高于原算法,证明提出的RW_RF算法有效精简了特征子集,减轻了冗余特征对模型分类精度的影响,同时也证明了改进算法对处理不平衡数据起到了一定的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号