首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
针对数据挖掘算法在预测电信客户离网时存在的过拟合问题,提出一种基于特征选择和支持向量机的电信客户离网预测算法。将原始的电信数据分别进行数据缺失值填充、数据冗余识别、数据结构化和数据归一化等预处理,得到利于分析处理的规范性数据;利用信息增益完成特征选择,提取影响客户离网的主要因素,降低数据维度,防止出现过拟合现象。将经过特征选择后的数据作为支持向量机算法的输入数据对客户是否离网进行分类,预测客户是否存在离网行为。测试结果表明,该算法预测离网客户的正确率为86%,提升了离网客户预测准确率。  相似文献   

2.
针对客户恶意欠费对电信运营商造成的经济损失问题,提出一种基于BP人工神经网络的客户欠费模型,为新客户的欠费情况做出预测。以某电信运营商客户服务部数据为研究对象,CRISP-DM(跨行业数据挖掘过程标准)方法论为建模流程,采集2 500个样本进行网络训练测试,在允许误差为0.001时,预测率达到92.33%。实验结果表明,该模型能够较准确的预测客户欠费情况,提高了预测的有效性和实用性。  相似文献   

3.
主要研究了在基于深度学习的人脸识别算法中,对于由深度卷积神经网络提取得到的人脸特征进行降维处理是否有助于提高人脸识别的准确率.利用VGG网络模型提取人脸图像的深度特征,然后利用主成分分析(PCA)对提取到的深度特征进行降维,最后利用余弦分类器进行分类识别,并在LFW人脸库上进行实验.实验结果表明通过PCA降维后的深度特征具有较高识别率.  相似文献   

4.
数据降维是从高维数据中挖掘有效信息的必要步骤。传统的主成分分析(PCA)算法应用于超高维稀疏数据降维时,存在着无法将所有数据特征一次性读入内存以进行分析计算的问题,而之后提出的分块处理PCA算法由于耗时太长,并不能满足实际需求。本文引入信息熵的思想对PCA算法进行改进,提出E-PCA算法,先利用信息熵对数据进行特征筛选,剔除大部分无用特征,再使用PCA算法对处理后的超高维稀疏数据进行降维。通过实验结果表明,在保留相同比例原数据信息的情况下,本文提出的基于信息熵的E-PCA算法在内存占用、运行时间以及降维结果都优于分块处理PCA算法。  相似文献   

5.
对于日益严重的电信欠费问题,采集了某个地区电信的呼叫详单记录、客户信息、欠费和交费信息等数据,使用支持向量机建立了欠费预测模型.然后可以利用所建立的模型来预测潜在的欠费客户,决策者可以得到充分的支持,做出正确的决策.为了提高模型的预测准确率,使用了双变量统计和主成份对数据进行预处理和分析.最后,为了得到最好的模型,主要做了三种实验.实验结果表明使用SVM建立的模型具有很好的预测准确率.  相似文献   

6.
作为一种新型高维数据,函数型数据重在研究数据的内在本质而不是外在结构,通过非参数方法将数据拟合为函数型数据以捕捉更多信息.针对响应变量为二分类情形,建立贝叶斯框架下的函数型Logistic回归模型,引入适当的先验信息并利用MCMC算法获得参数的条件后验分布.具体解决流程为:选取由数据驱动的主成分基函数对回归系数函数和回归函数型自变量进行展开,对展开项数进行截断,利用主成分基函数的正交性,将高维数据进行低维表示;再利用Polya-Gamma变换,建立易于获得参数后验的Gibbs抽样算法,从而得到回归函数展开项系数的后验分布.蒙特卡洛模拟结果显示,该方法具有较好的分类性能.将该方法应用于Tecator实际数据,发现其分类效果优于别的方法.  相似文献   

7.
利用支持向量机方法对中职学校财务风险进行预测,设置22个评价指标,运用主成分分析降维处理数据,然后通过Libsvm进行实验。通过对评价指标的主成分分析,发现前8个主分量的累计贡献率为89.18%,占有绝对重要的比重。选取前8个主分量为支持向量机的输入,最后得到5组实验数据,平均预测分类精度为93.75%,表明支持向量机方法在财务风险预测中的可行性和实用性。  相似文献   

8.
电主轴是数控机床中重要的部件之一,其性能的优劣直接影响机床工况和加工零件质量。对电主轴进行故障诊断能很大程度上提高数控机床的加工精度,并且能够有效地增加其可靠性和安全性。在一般诊断过程中,原始数据的高维特征量处理较为困难。为顺应实际应用中对电主轴故障诊断的精度要求,提出一种基于主成分分析(PCA)与K最近邻(KNN)的电主轴故障诊断方法。此方法利用PCA对原始非线性时间序列数据的特征向量进行降维,并选取其中主成分特征向量。将得到的主成分特征向量作为KNN的输入进行故障分类。最后将该方法的预测结果与决策树和随机森林的分类结果进行对比,结果表明, PCA-KNN算法在故障分类精度上相较于其他两种算法有显著提高,是一种有效的电主轴故障分类方法。  相似文献   

9.
阐述了行为识别的基本过程。将前景序列进行归一化后,采用二维主成分分析方法(2DPCA)降维进行特征提取,利用连续隐马尔科夫模型(CHMM)建模,对行为有效分类和识别。实验结果表明,该设计方案的识别率可以达到95%。  相似文献   

10.
主成分分析(PCA)在图像识别及高维数据降维中有着普遍的应用.为提升基于主成分分析的图像重建性能,在经典PCA算法的基础上提出了广义主成分分析(TPCA),并利用该算法进行图像重建.该算法利用图像像素的空间邻域构成固定尺寸的数组并将其作为广义标量进行代数运算,可以方便有效地描述各像素的空间约束,从而提升图像的重建效果,...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号