首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 562 毫秒
1.
针对电信数据维度增加导致的客户欠费预测算法复杂度过高的问题,提出基于主成分分析和分类回归树的电信客户欠费预测算法。该算法将原始电信数据进行数据缺失值处理、数据冗余识别和数据结构化后,进行数据规范化建模,利用主成分分析算法对建模后的电信数据进行降维处理,将降维后的数据作为分类回归树算法的输入数据对客户是否欠费进行分类,预测客户是否将存在欠费行为。利用实际电信数据进行验证,结果表明该算法的预测错误率为4.49%,预测耗时为17.05s,与分类回归树算法相比,在能够预测客户欠费的同时,还能提高预测效率。  相似文献   

2.
以最大似然原理为基础的统计回归方法在常压汽液相平衡数据回归中的应用已有一些报告,且回归结果非常令人满意.但此法在高压根平衡中的应用由于存在一定的困难.本文采用最大似然原理进行了国内外尚无完整研究报告的高压汽液平衡的统计回归,分别采用新的DDLC-SRK模型和SRK方程,用3种不同的目标函数对52套高压汽液平衡数据进行了统计回归,同时也进行了经典回归.得出结论,统计回归优于经典回归,且以双应答回归结果最好.  相似文献   

3.
以最大似然原理为基础的统计回归方法在常压汽液相平衡数据回归中的应用已有一些报告,且回归结果非常令人满意。但此法在高压相平衡中的应用由于存在一定的困难。本文采用最大似然原理进行了国内外尚无完整研究报告的高压汽液平衡的统计回归,分别采用新的DDLC-SRK模型和SRK方程,用3种不同的目标函数对352套高压汽液平衡数据进行了统计回归,同时也进行了经典回归。得出结论,统计回归优于经典回归,且以双应答回归  相似文献   

4.
为了建立科研评估科学合理的评价指标体系,并能最大程度地反映评价对象的真实水平,对相应评价支术进行了研究.讨论了分类回归树方法,并介绍了它在开发高校科研决策支持系统中的应用.利用分类回归树方法对教师科研工作进行评估,开辟了评估方法的一条新途径.  相似文献   

5.
为了有效地评估客户的可信度,提高信贷机构经济效益。文中通过统计学中的参数方法Logistic回归和非参数方法分类树这两种方法,建立两种模型对数据进行预测,应用SPSS软件的Binary Logistic Regression方法,利用ROC曲线的性质来对模型的性能进行评价,根据输出结果比较两种模型在应用中都是可行有效的,在实际操作中应因地制宜,把握两种方法的优势,得到更有价值的结果.  相似文献   

6.
考虑因子数据的数据特征,采用连续属性服从正态分布的朴素贝叶斯分类方法,对因子分析降维前后数据集的分类性能变化进行了研究.实验结果表明:因子分析中的KMO(Kaiser—Meyer—Olkin)统计值和变量共同度与分类性能紧密相关,当KMO统计值大于0.8,并且只有很少属性的变量共同度值小于80%时,采用因子分析作为分类之前的降维是适宜的.  相似文献   

7.
对前文(Ⅰ)[10]中的二元统计回归结果中的两组回归结果进行了残差分析,进一进证实了新的DDLC-SRK模型优于SRK方程,同时还对DDLC-SRK模型证实了统计回归方法求得的参数更为可靠.另外进行了三元高压汽液平衡的推算,结果表明,应用DDLC-SRK模型的统计回归推算精度优于其经典方法,而应用SRK方程的统计回归推算精度与其经典方法相近。  相似文献   

8.
顶煤冒放性分类与预测   总被引:4,自引:0,他引:4  
以模糊聚类分析为基础,根据确定的分类指标以及现场条件数据,对顶煤冒放性进行了分类,采用回归分析方法对冒放性类别进行了预测。  相似文献   

9.
一种基于信息熵建立决策树的算法   总被引:2,自引:0,他引:2  
信息论给出了信息的数学本质,提出了用热力学中的熵来度量信息量的大小。分类是一个重要的数据挖掘问题,在训练数据集上建立分类树的关键是如何选择决策树每一个内部结点的测试属性。传统的决策树建立算法利用信息论中熵的概念选择属性,具有偏向于取值较多属性的缺点。本文分析了信息论中有关熵的一些基本概念和含义,讨论了它们在挖掘分类树中的应用,利用互信息设计了一个建立分类树的算法,克服了传统算法的缺点。  相似文献   

10.
本分类是指在给定的分类体系下,根据本的内容自动地确定本所属的类别。与当前的本分类技术相比,统计语义方法描述了语义元的相互关系,定义了语义元间的亲和力、语义元集的松散度等。基于上述定义,给出了一种选取关键词集的方法,并用所获得的关键词集构造了关键词集树,完成了映射类别未知的本的词集到关键词集树的分类过程。  相似文献   

11.
主要阐述了决策树学习算法在交通方式选择模型中的应用.在基本决策树的基础上,使用随机森林组合学习算法来建立交通方式选择模型,以Bagging预测方法和CART算法为主,以随机特征选择和"投票"方法为辅,并相互融合,结合具体实例详细介绍该模型的建立,从数据的选择到整个森林中树的数目和每个结点处抽取的候选属性的个数调整,并对模型进行了相应的评估.实验结果表明,随机森林预测精度高,且对噪声数据具有较强的稳健性,采用决策树学习算法得出的规则在交通方式选择的分析中具有较好的实用价值.  相似文献   

12.
提出一种基于S变换和数据挖掘中决策树算法的电能质量扰动识别的方法.该方法首先用S变换对电能质量扰动波形进行时频分析,并使用统计方法提取相关特征量,然后用决策树算法对提取的特征量样本进行分类,并获得明确的分支规则.仿真结果表明,该方案正确率高,抗噪声能力强,训练样本少,响应速度快.  相似文献   

13.
一种基于CART的决策树改进算法   总被引:4,自引:0,他引:4  
针对分析CART算法的要求被选择的属性是连续且有序的,并且只能产生两个子节点的问题,依据CART算法理论,采用A—CART算法,弥补了CART方法的不足.是一种选用离散无序的属性作为决策树的分裂节点,分裂后可以产生多个子节点的方法,并为此方法设计了分裂函数,通过一个实例给出了具体的使用方法.  相似文献   

14.
基于Landsat时间序列数据的祁连山区域 土地利用变化   总被引:1,自引:0,他引:1  
为了研究祁连山地区土地利用变化情况,基于祁连山区域1986—2015年的Landsat时间序列数据,通过相对辐射校正获取时序地表反射率数据.采用光谱扩展与基于回归树的决策树分类(CART)获取规则的决策树分类方法,应用于长时间序列卫星影像,对各类土地利用类型近30 a的变化情况进行分析.结果表明:相对辐射归一化能有效减少时间序列数据之间光谱值差异,基于CART获取规则的决策树分类方法具有较高的分类精度.以2012年分类结果为例,总体分类精度为88.72%,Kappa系数为0.86,并分析了可能存在的误差.研究区耕地、林地和草地面积总体呈下降趋势发展,并且草地破碎化程度加剧,戈壁面积增多,植被退化导致土地荒漠化问题更加严重.最后,根据研究区土地利用变化情况进行讨论,并针对该情况提出建议.  相似文献   

15.
用单片机实现无线通信中数据的编解码   总被引:1,自引:0,他引:1  
在利用单片机和无线数传模块进行无线数据通信时 ,通常的办法是通过单片机的串行I/O口来完成数据的串行通信。然而此方法存在许多不足之处 ,如差错检测能力差、帧格式不灵活等。针对低速通信的场合 ,提出了一种通过单片机和无线数传模块以软件方式实现对传输数据编码、解码的原理和方法。数据的编码采用了曼彻斯特编码格式 ,每帧数据包括同步头、有效数据位和冗余校验位三部分。解码包括同步头和数据位的判定及循环冗余校验。在数据位的判定中提出了用软件实现“测三取二”的判定方法。该判定方法不但可以提高采样的准确度 ,而且还具有一定的滤波功能。实验结果表明 ,与单片机的串口通信相比 ,该编解码方法具有抗干扰能力强、传输数据灵活等优点  相似文献   

16.
针对ZD—QMJ—D27L45型球磨机故障诊断困难的问题,提出了一种改进的可调阈值谐波小波分析方法。采用非接触式方法采集球磨机运行过程的声音数据,利用可调阈值方法去除噪声,对所得结果用谐波小波方法进行处理,提取特征并诊断出故障。研究实例表明,可调阈值谐波小波方法在有效去除噪声的同时能较好地保留有用的突变特征,适用于这类问题的处理。  相似文献   

17.
为了克服多阶段间歇过程监控只针对时间尺度从而导致误报率过高的缺陷,建立了捕捉实际测量数据的持续性和聚集性的隐马尔科夫树模型。该方法减少了信号扭曲从而更好地提取影响过程的系统变量,解决离散小波变换不具有平移不变性的问题。对展开结构进行简单的修改,把时域扩展到时间-频率域中,提取了历史数据的主要特征,对多阶段间歇过程进行了有效监控。利用提出的方法对青霉素发酵过程进行监控,验证了该方法比传统方法更为切实可行。  相似文献   

18.
According to the sequential maximum a posteriori probability (SMAP) rule, this paper proposes a novel multi-scale Bayesian texture segmentation algorithm based on the wavelet domain Hidden Markov Tree (HMT) model. In the proposed scheme, interscale label transition probability is directly defined and resoled by an EM algorithm. In order to smooth out the variations in the homogeneous regions, intrascale context information is considered. A Gaussian mixture model (GMM) in the redundant wavelet domain is also exploited to formulate the pixel-level statistical features of texture pattern so as to avoid the influence of the variance of pixel brightness. The performance of the proposed method is compared with the state-of-the-art HMTSeg method and evaluated by the experiment results.  相似文献   

19.
随机变量取值的统计规律性往往通过大量的重复观测来体现,对大量重复观测作数学处理的常用方法是极限理论.独立同分布随机变量的极限理论已经很完善,近年来混合序列的极限理论发展较快,有的结果已接近独立同分布情形.讨论了一类较广泛的 φ混合序列加权和的收敛性质,获得了它的完全收敛性和强收敛性等性质.  相似文献   

20.
针对单一图像匹配算法抗噪声能力和抗几何形变能力差、以及计算量较大等问题,提出一种基于小波变换后图像统计特征的图像匹配识别算法.利用小波对图像进行多个尺度的二维小波变换,分析反映图像在不同尺度和不同方向上能量分布情况,通过计算统计特征量和标准图库中图像统计特征量之间的夹角,确定待识别目标,利用该方法对图书条形码进行识别.研究结果表明:采用小波变时频特性对图像进行去噪处理以及边缘检测,能够剔除图像噪声干扰并充分保留原始图像信息;将小波变换后的近似系数、水平、垂直和对角部分的细节系数作为统计特征量,提取的特征量跟模板图像的统计特征量进行相似度匹配,将两个特征向量的夹角余弦作为相似度的衡量指标,根据夹角余弦的大小确定该区域是否目标区域.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号