首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
电信流失客户数据精确预测是挽留客户的有效手段.电信业的管理中对收费、投诉、业务受理等问题,显然是一种典型的非平衡样本,传统用标准的支持向量机没有考虑样本分布不平衡问题,虽然在样本数据平衡前提下具有较好的预测精度,但对于不平衡电信客户数据,预测精度大大下降.为提高预测精度,针对支持向量机处理不平衡样本时的缺陷,提出了基于代价敏感学习的支持向量机模型.模型利用代价敏感学习对不平衡样本集分别采用不同惩罚系数,然后建立电信客户流失预测模型,最后对实际电信客户流失数据进行测试.通过与标准支持向量机、神经网络对比,结果表示模型提高了预测精度,有效地解决了数据集非平衡性问题,是一种有效的电信客户流失预测方法.  相似文献   

2.
基于代价敏感SVM的电信客户流失预测研究*   总被引:3,自引:0,他引:3  
针对客户流失数据集的非平衡性问题和错分代价的差异性问题,将代价敏感学习应用于Veropoulos提出的采用不同惩罚系数的支持向量机,建立客户流失预测模型,对实际的电信客户流失数据进行验证。通过与传统SVM、C4.5和ANN对比研究,结果显示此方法在精确度、命中率、覆盖率和提升度均有所改善,表明此方法有效地解决了数据集的非平衡性和错分代价问题,是进行客户流失预测的有效方法。  相似文献   

3.
基于贝叶斯网络的电信客户流失预测分析   总被引:6,自引:0,他引:6  
电信客户流失分析常用的数据挖掘方法有自动聚类、决策树和人工神经网络,它们是采用数据本身来训练模型的,没有利用先验知识。电信客户流失是由客户心理、服务质量和对手竞争等诸多复杂的因素造成的,利用这些已有的先验知识,可以提高预测的精度。该文根据先验知识选取分析变量,采集样本数据,通过贝叶斯网络的结构学习和参数学习,建立客户流失模型并进行客户流失趋势预测,取得了比标准数据集更准确的结果,该结果和决策树方法的预测结果相比还具有较大的优势,说明贝叶斯网络是分析客户流失等不确定性问题的有效工具。  相似文献   

4.
现实生活中存在大量的非平衡数据,大多数传统的分类算法假定类分布平衡或者样本的错分代价相同,因此在对这些非平衡数据进行分类时会出现少数类样本错分的问题。针对上述问题,在代价敏感的理论基础上,提出了一种新的基于代价敏感集成学习的非平衡数据分类算法--NIBoost(New Imbalanced Boost)。首先,在每次迭代过程中利用过采样算法新增一定数目的少数类样本来对数据集进行平衡,在该新数据集上训练分类器;其次,使用该分类器对数据集进行分类,并得到各样本的预测类标及该分类器的分类错误率;最后,根据分类错误率和预测的类标计算该分类器的权重系数及各样本新的权重。实验采用决策树、朴素贝叶斯作为弱分类器算法,在UCI数据集上的实验结果表明,当以决策树作为基分类器时,与RareBoost算法相比,F-value最高提高了5.91个百分点、G-mean最高提高了7.44个百分点、AUC最高提高了4.38个百分点;故该新算法在处理非平衡数据分类问题上具有一定的优势。  相似文献   

5.
随着互联网的高速发展,电信市场竞争激烈,因此运用数据挖掘技术构建电信客户流失预测模型显得极为重要。基于Stacking集成算法,以梯度提升迭代(GBDT)、决策树、随机森林为基学习器,以逻辑回归模型为次学习器,构建了电信客户流失预测模型。通过与单一预测模型进行对比,Stacking集成模型有更好的预测效果,对电信客户流失预测具有重要意义。  相似文献   

6.
由于电信市场竞争日益激烈,为了保持客户,防止客户流失,提升企业的竞争力,利用DBSCAN算法对流失客户群数据进行划分,分析客户流失原因,结合决策树ID3算法进行客户流失预测,实验结果表明,两种算法的结合,使得客户流失预测准确率得到较大提高.  相似文献   

7.
分析了电信行业客户关系管理系统的数据独有特点,提出基于客户细分的客户流失预测模型.首先,采用模糊核C-均值聚类算法用于客户细分并对细分结果进行分析,发现高价值客户的群体特征.再利用企业历史数据建立基于SAS数据挖掘技术的客户流失预测模型.最后,把高价值客户作为预测目标数据应用于该模型当中预测出有流失倾向的客户.实验结果表明,该方法有效可行,可以为企业提供准确、有流失倾向的客户名单.  相似文献   

8.
针对电信企业客户流失问题,提出采用贝叶斯决策树算法的预测模型,将贝叶斯分类的先验信息方法与决策树分类的信息熵增益方法相结合,应用到电信行业客户流失分析中,分别将移动公司的客户数据以及UCI数据纳入到模型中得出相应的结果。加入贝叶斯节点弥补决策树不能处理缺失值以及二义性数据的缺点。检验结果表明,基于贝叶斯推理的决策树算法在牺牲了较小的训练时间与分类时间的情况下,得到了比仅基于决策树算法更高的覆盖率与命中率。  相似文献   

9.
多标签代价敏感分类集成学习算法   总被引:12,自引:2,他引:10  
付忠良 《自动化学报》2014,40(6):1075-1085
尽管多标签分类问题可以转换成一般多分类问题解决,但多标签代价敏感分类问题却很难转换成多类代价敏感分类问题.通过对多分类代价敏感学习算法扩展为多标签代价敏感学习算法时遇到的一些问题进行分析,提出了一种多标签代价敏感分类集成学习算法.算法的平均错分代价为误检标签代价和漏检标签代价之和,算法的流程类似于自适应提升(Adaptive boosting,AdaBoost)算法,其可以自动学习多个弱分类器来组合成强分类器,强分类器的平均错分代价将随着弱分类器增加而逐渐降低.详细分析了多标签代价敏感分类集成学习算法和多类代价敏感AdaBoost算法的区别,包括输出标签的依据和错分代价的含义.不同于通常的多类代价敏感分类问题,多标签代价敏感分类问题的错分代价要受到一定的限制,详细分析并给出了具体的限制条件.简化该算法得到了一种多标签AdaBoost算法和一种多类代价敏感AdaBoost算法.理论分析和实验结果均表明提出的多标签代价敏感分类集成学习算法是有效的,该算法能实现平均错分代价的最小化.特别地,对于不同类错分代价相差较大的多分类问题,该算法的效果明显好于已有的多类代价敏感AdaBoost算法.  相似文献   

10.
利率市场化、大数据迅速发展,银行业均表现出明显的“二八定律”现象,20%的优质客户占据了银行的大部分资产。那么,如何防止银行客户流失,尤其是优质客户的流失,已经成为银行越来越关注的问题。因此,建立优质客户流失预警模型就显得尤为重要。以某商业银行为例,重新对客户流失进行定义,重点关注银行优质客户的流失预警,首先使用AP聚类算法进行属性选择,然后使用随机森林方法建立客户流失预警模型,预测零售优质客户未来3个月流失的可能性。为了验证该方法的有效性,首先在UCI数据集上进行验证,得到了较好的效果,然后使用该方法构建银行业优质客户流失预测模型,实验结果表明该模型的实际预测效果相较于一般的决策树方法,具有更高的准确性。  相似文献   

11.
Churn prediction in telecom has recently gained substantial interest of stakeholders because of associated revenue losses. Predicting telecom churners, is a challenging problem due to the enormous nature of the telecom datasets. In this regard, we propose an intelligent churn prediction system for telecom by employing efficient feature extraction technique and ensemble method. We have used Random Forest, Rotation Forest, RotBoost and DECORATE ensembles in combination with minimum redundancy and maximum relevance (mRMR), Fisher’s ratio and F-score methods to model the telecom churn prediction problem. We have observed that mRMR method returns most explanatory features compared to Fisher’s ratio and F-score, which significantly reduces the computations and help ensembles in attaining improved performance. In comparison to Random Forest, Rotation Forest and DECORATE, RotBoost in combination with mRMR features attains better prediction performance on the standard telecom datasets. The better performance of RotBoost ensemble is largely attributed to the rotation of feature space, which enables the base classifier to learn different aspects of the churners and non-churners. Moreover, the Adaboosting process in RotBoost also contributes in achieving higher prediction accuracy by handling hard instances. The performance evaluation is conducted on standard telecom datasets using AUC, sensitivity and specificity based measures. Simulation results reveal that the proposed approach based on RotBoost in combination with mRMR features (CP-MRB) is effective in handling high dimensionality of the telecom datasets. CP-MRB offers higher accuracy in predicting churners and thus is quite prospective in modeling the challenging problems of customer churn prediction in telecom.  相似文献   

12.
针对数据挖掘方法在电信客户流失预测中的局限性,提出将信息融合与数据挖掘相结合,分别从数据层、特征层、决策层构建客户流失预测模型。确定客户流失预测指标;根据客户样本在特征空间分布的差异性对客户进行划分,得到不同特征的客户群;不同客户群采用不同算法构建客户流失预测模型,再通过人工蚁群算法求得模型融合权重,将各模型的预测结果加权得到预测最终结果。实验结果表明,基于信息融合的客户流失预测模型确实比传统模型更优。  相似文献   

13.
针对不同级别不同数量的客户离网后给电信企业带来的损失不同造成的离网预测的新问题,提出了一种基于最大价值量的Naive Bayes算法.该算法通过建立价值量的概念,调整价值敏感属性的价值系数因子,使得离网客户名单中的价值量达到最大.实验结果表明,该算法在保持一定的准确率的同时,能成功预测出更多高价值的离网客户.  相似文献   

14.
随着市场竞争的日益加剧,客户流失问题是电信运营商都面临并急需解决的问题。要解决这个问题,首先就要对客户进行分析和预测。本文就是介绍利用挖掘软件SPASS Modeler对电信客户进行数据探测与分析,掌握老客户的流失动向,并对流失客户的特征进行归类,为以后电信运营提供有用的数据。  相似文献   

15.
针对于大样本数据的客户流失预测,从特征有效表达的角度,提出了一种基于谱回归特征约简的预测模型.模型在原始客户特征基础上,利用基于谱回归的流形降维,建立可区分性的低维特征空间,在此之上采用支持向量机实现客户流失的二分类.通过在网络客户和传统电信客户两种不同数据集上的大样本实验,并与不同分类器、不同特征约简或选择方法的对比,证明了该方法的有效性.  相似文献   

16.
为了解决电信运营支撑系统应用上多年来形成的“信息孤岛”问题,为客户提供端到端的良好服务,同时支持对新的电信业务的快速开发和对现有异构系统的互联互通,电信管理论坛(TMF)提出了新一代运营支撑系统软件框架NGOSS。该文在分析了国内目前电信运营支撑系统OSS/BSS的现状和NGOSS的主要技术特点的基础上,遵循NGOSS框架的思想,提出了一个面向电信运营管理的中间件平台,实现了其原型系统,并在平台上完成了用于支持电信网络管理业务流程运行的实例。  相似文献   

17.
Yu  Ruiyun  An  Xuanmiao  Jin  Bo  Shi  Jia  Move  Oguti Ann  Liu  Yonghe 《Neural computing & applications》2018,29(3):707-720

Customer churn prediction is critical for telecommunication companies to retain users and provide customized services. In this paper, a particle classification optimization-based BP network for telecommunication customer churn prediction (PBCCP) algorithm is proposed, which iteratively executes the particle classification optimization (PCO) and the particle fitness calculation (PFC). PCO classifies the particles into three categories according to their fitness values, and updates the velocity of different category particles using distinct equations. PFC calculates the fitness value of a particle in each forward training process of a BP neural network. PBCCP optimizes the initial weights and thresholds of the BP neural network, and brings remarkable improvement on customer churn prediction accuracy.

  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号