首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
在电信运营商领域,离网预测模型是企业决策者用来发现潜在离网用户(即停用运营商服务)的主要手段。目前离网预测模型都是基于逻辑回归、决策树、神经网络及随机森林等浅层机器学习算法,但是在大数据的背景下,这些浅层算法在预测问题上很难取得更高的精度。因此,提出了一种新型的深层结构模型——深度随机森林,通过将传统浅层随机森林堆积成深层结构模型,获得更高的预测精度。在运营商真实数据上进行了大量实验,结果证明深层随机森林模型比传统浅层机器学习算法在离网预测问题上可以得到更好的效果。同时,增大训练数据量可以进一步提升深层随机森林的预测能力,从而证明了在大数据环境下深层模型的潜力。  相似文献   

2.
用户流失问题是电信运营商面临的亟待解决的问题,针对不同的场景,业界研究开发了多个用户离网预测系统。服务号码捆绑指用户在使用运营商服务期间,与银行、电商、便利店等第三方服务提供商通过绑定手机号产生联系。通过研究发现用户在服务存续期间普遍会绑定多种第三方服务提供商,这些商家会不定时给用户推送短信,当用户即将流失时,多数用户会逐渐取消这类服务的绑定。因此,服务号码捆绑特征对于离网用户的甄别起到了重要的作用。采用随机森林算法构建离网预测模型,利用逻辑回归算法对服务号码捆绑特征进行降维,并加入模型,进行离网用户分析,从而辅助决策者制订相应的客户维挽策略,降低客户离网率。实验结果表明,服务号码软捆绑特征能够提高系统的分析预测能力。  相似文献   

3.
时序算法在销售预测中的应用研究   总被引:1,自引:0,他引:1  
在金融市场、信息网络以及电子商务等领域中积累了大量时间序列数据,对这些数据进行深层次的分析,是数据挖掘研究中的重要方向之一.Microsoft时序算法是一个新的预测算法,使用Microsoft时序算法创建的模型是一个自动回归模型.本文用Micmsoft时序算法建立预测模型,预测某食品零售超市未来的销售情况.  相似文献   

4.
孟凡  陈广  王勇  高阳  高德群  贾文龙 《计算机应用》2021,41(8):2453-2459
传统储层含油性勘测方法利用地震波穿过地层时产生的相关地震属性和地质钻井资料结合传统地球物理方法进行综合研判,但该类勘测方法往往存在研判成本高且对专家先验知识依赖性强的问题.针对该问题,以江苏油田苏北盆地的地震资料为基础,并结合含油样本的稀疏性和随机性,提出了一种基于多粒度时序结构表示的异常检测算法,直接利用叠后地震道数...  相似文献   

5.
利用时序 Petri网对实际问题进行建模 ,通过 Petri网反映系统的物理结构 ,并利用时序逻辑公式描述系统需求及其相关约束条件 ,从而通过时序 Petri网的运行 ,得到施加控制后的变迁发生序列 ,即对应问题的实现方案 ,达到智能控制的目的。  相似文献   

6.
在多粒度粗糙集模型中,粒度选择总是与正域有关.由于全体标记确定对象集上的分类过细,落入正域的对象很少或为空集,导致正域约简方法可能丢失大量信息甚至失效.为了克服这一缺陷,文中提出基于局部广义多粒度粗糙集的多标记最优粒度选择方法.首先,引入广义局部多粒度粗糙集的相关概念,通过设置信息水平参数,对单个标记的对象集合进行近似.然后,通过定义多粒度多标记信息系统的粒度质量,给出粒度重要性.最后,设计最优粒度选择的启发式算法,并通过实例验证文中方法的有效性  相似文献   

7.
在芯片的设计过程中,静态时序分析(Static Timing Analysis,STA)无疑是整个设计中最重要的一环。如今纳米级工艺下的芯片设计往往属于多工艺角多模式(MultiCorner-MultiMode,MCMM)物理设计,工艺角和工作模式的特定组合称之为场景,多场景的物理设计会给芯片带来更加稳定的性能,但也会使静态时序分析变得更为复杂。介绍了分布式多场景时序分析(Distribute MultiScenario Analysis,DMSA)技术在多工艺角多模式物理设计中的应用。经过基于Smic 90 nm工艺的多场景数字芯片Cxdp13设计实践分析表明,在一定硬件条件支撑下,分布式多场景时序分析技术在多工艺角多模式的物理设计中可以达到快速时序签核的目的。  相似文献   

8.
时序动态网络在静态网络基础上综合了时间属性的概念,包含了网络结构的复杂性、动态性等内涵,是研究复杂网络链路预测问题的较优思维对象,因在现实世界中具有较高应用价值而备受关注。目前大部分传统方法研究对象仍局限于静态网络,存在对网络时域演化信息利用不充分、时间复杂度较高等问题。结合社会学理论,提出一种基于社团多特征融合嵌入表示的时序链路预测方法,该方法的核心思想是通过分析网络动态演化特性,在社团范围内学习节点的嵌入表示向量,融合多特征以衡量节点间连边的生成概率。利用网络集体影响力的方法对节点和连边的权值进行计算,基于集体影响的连边权值进行社团划分,将网络划分为若干个社团子图,得到基于集体影响的相似性指标。在社团范围内,利用有偏的随机游走,结合梯度优化的Skip-gram方法获取所有节点的嵌入表示向量,得到基于社团范围游走的相似性指标。融合节点的集体影响、社团范围节点的多个中心性特征和学习到的节点表示向量,得到多特征融合的相似性指标,3 种新指标都可以用于衡量节点之间形成连边的概率。对比基于移动平均、嵌入表示、图神经网络等经典时序链路预测方法,在 6 个真实数据集上的实验结果表明,所提基于社团多特征融合的方法在 AUC评价标准下取得更优的预测性能。  相似文献   

9.
时序事件预测是指基于历史事件预测下一个事件,事件包括时间和类型两个属性。当前主要工作集中在单方面(事件时间或事件类型)的预测,但这无法回答“何时发生何事”这类更精细的问题。此类问题的挑战主要是事件类型非常多样,而行为往往高度稀疏,给预测带来极大困难;需要预测的事件时间和事件类型分属两个域,如何把这两个域的信息加以融合并形成互补也是一个挑战。针对上述挑战,从融合多序列隐信息的角度探索了一种解决方法。基于某些事件序列之间具有模式相似性这一观察,提出建模事件序列的隐关系图,利用邻居序列的信息解决行为稀疏性的问题;通过合理设计神经网络模块,将事件的时间域和类型域的信息映射到共同的抽象空间,解决事件时间和事件类型信息的融合建模问题。通过在多个真实数据集上进行了大量实验,实验结果印证了多序列深度时序模型优于现有的一系列基准模型。  相似文献   

10.
校园公共区域人流量预测对于维护校园安全,提升校园管理水平有重大意义.尤其在疫情防控下,高校复学对公共区域的人流量预测和控制提出了更高的要求.以高校食堂为例,通过预测就餐人数,有助于食堂防疫人员合理调度和安排,既降低了人群聚集的潜藏风险,也可以针对食堂人流量分布情况提供分时分批服务.然而,由于校园管理需求,如节假日和教学安排等因素,使得校园公共区域人流量预测问题颇具挑战性.为此提出一种基于深度学习的多尺度时序卷积网络MSCNN (multi-scale temporal patterns convolution neural networks),实现人流量时序数据中短时依赖、长时周期模式的获取和多尺度时序模式特征的重标定,以对任一时段人流量进行预测.通过在真实校园环境数据集以及公开数据集上的实验,验证了MSCNN模型的有效性和执行效率.  相似文献   

11.
目前客户流失预测面临的主要问题之一就是类不平衡性(class imbalance)。针对这个问题,首先应用欠抽样法(undersampling)处理客户流失数据降低不平衡性,再应用C4.5D、C4.5N、RIPPER、NaiveBayes和RandomForest机器学习方法对客户流失进行预测。实验结果表明,欠抽样法是在牺牲负类样本预测精度的前提下,提高正类预测精度,于是采用重复抽样法(resampling)来弥补欠抽样法的缺陷,减少负类样本中含有大量有用信息的丢失,实验结果证明了这种方法的正确性和有效性  相似文献   

12.
应用简易支持向量机(SSVM)进行客户流失预测,以提高机器学习方法的预测能力。以国外电信公司客户流失预测为实例,与最近邻算法(NPA)进行了对比,发现该方法在获得与NPA近似准确率的条件下,所花费的时间和时间增加值远小于NPA,是研究客户流失预测问题的有效方法。  相似文献   

13.
客户流失预测的现状与发展研究   总被引:5,自引:1,他引:5  
根据客户流失预测研究的发展历程和智能化程度的高低,将客户流失预测研究划分为三个阶段,包括基于传统统计学的预测方法、基于人工智能的预测方法和基于统计学习理论的预测方法,并通过分析每个阶段存在的问题提出了未来可研究的方向。  相似文献   

14.
准确的用户流失预测能力有助于企业提高用户保持率、增加用户数量和增加盈利。现有的流失用户预测模型大多为单一模型或是多个模型的简单融合,没有充分发挥多模型集成的优势。借鉴了随机森林的Bootstrap Sampling的思想,提出了一种改进的Stacking集成方法,并将该方法应用到了真实数据集上进行流失用户的预测。通过验证集上的实验比较可知,提出的方法在流失用户F1值、召回率和预测准确率3项指标上均好于所有相同结构的经典Stacking集成方法;当采用恰当的集成结构时,其表现可超越基分类器上的最优表现。  相似文献   

15.
针对目前客户流失预测方法的不足,在利用训练样本中不同类个数比值来确定各类惩罚参数的基础上,改进标准的C支持向量分类机(SVC)。通过以美国某电信公司客户流失预测为实例,与标准CSVC、人工神经网络、决策树、贝叶斯分类器等方法进行了对比,发现该方法能获得较好的正确率、命中率、覆盖率和提升系数,是研究客户流失预测问题的有效方法。  相似文献   

16.
针对数据挖掘方法在电信客户流失预测中的局限性,提出将信息融合与数据挖掘相结合,分别从数据层、特征层、决策层构建客户流失预测模型。确定客户流失预测指标;根据客户样本在特征空间分布的差异性对客户进行划分,得到不同特征的客户群;不同客户群采用不同算法构建客户流失预测模型,再通过人工蚁群算法求得模型融合权重,将各模型的预测结果加权得到预测最终结果。实验结果表明,基于信息融合的客户流失预测模型确实比传统模型更优。  相似文献   

17.
As churn management is a major task for companies to retain valuable customers, the ability to predict customer churn is necessary. In literature, neural networks have shown their applicability to churn prediction. On the other hand, hybrid data mining techniques by combining two or more techniques have been proved to provide better performances than many single techniques over a number of different domain problems. This paper considers two hybrid models by combining two different neural network techniques for churn prediction, which are back-propagation artificial neural networks (ANN) and self-organizing maps (SOM). The hybrid models are ANN combined with ANN (ANN + ANN) and SOM combined with ANN (SOM + ANN). In particular, the first technique of the two hybrid models performs the data reduction task by filtering out unrepresentative training data. Then, the outputs as representative data are used to create the prediction model based on the second technique. To evaluate the performance of these models, three different kinds of testing sets are considered. They are the general testing set and two fuzzy testing sets based on the filtered out data by the first technique of the two hybrid models, i.e. ANN and SOM, respectively. The experimental results show that the two hybrid models outperform the single neural network baseline model in terms of prediction accuracy and Types I and II errors over the three kinds of testing sets. In addition, the ANN + ANN hybrid model significantly performs better than the SOM + ANN hybrid model and the ANN baseline model.  相似文献   

18.
夏国恩 《计算机应用》2008,28(1):149-151
将核主成分分析(KPCA)引入到客户流失预测中,提出了相应的特征提取算法。将KPCA与Logistic回归结合,设计了预测模型。通过对某电信公司客户流失预测的试验结果表明:该方法获得的命中率、覆盖率、准确率和提升系数高于原始属性集和主成分分析(PCA)特征提取法。这表明KPCA能提取客户数据的非线性特征,是研究客户流失预测问题的有效方法。  相似文献   

19.
A business incurs much higher charges when attempting to win new customers than to retain existing ones. As a result, much research has been invested into new ways of identifying those customers who have a high risk of churning. However, customer retention efforts have also been costing organisations large amounts of resource. In response to these issues, the next generation of churn management should focus on accuracy. A variety of churn management techniques have been developed as a response to the above requirements. The focus of this paper is to review some of the most popular technologies that have been identified in the literature for the development of a customer churn management platform. The advantages and disadvantages of the identified technologies are discussed, and a discussion on the future research directions is offered.  相似文献   

20.
针对电信企业客户流失问题,提出采用贝叶斯决策树算法的预测模型,将贝叶斯分类的先验信息方法与决策树分类的信息熵增益方法相结合,应用到电信行业客户流失分析中,分别将移动公司的客户数据以及UCI数据纳入到模型中得出相应的结果。加入贝叶斯节点弥补决策树不能处理缺失值以及二义性数据的缺点。检验结果表明,基于贝叶斯推理的决策树算法在牺牲了较小的训练时间与分类时间的情况下,得到了比仅基于决策树算法更高的覆盖率与命中率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号