共查询到19条相似文献,搜索用时 55 毫秒
1.
Logistic回归模型及其应用 总被引:1,自引:0,他引:1
为了利用Logistic模型提高多分类定性因变量的预测准确率,在二分类Logistic回归模型的基础上,对实际统计数据建立三类别的Logistic模型.采用似然比检验法对自变量的显著性进行检验,剔除了不显著的变量;对每个类别的因变量都确定了1个线性回归函数,并进行了模型检验.分析结果表明,在处理因变量为定性变量的回归分析中,Logistic模型具有很好的预测准确度和实用推广性. 相似文献
2.
为了建立科研评估科学合理的评价指标体系,并能最大程度地反映评价对象的真实水平,对相应评价支术进行了研究.讨论了分类回归树方法,并介绍了它在开发高校科研决策支持系统中的应用.利用分类回归树方法对教师科研工作进行评估,开辟了评估方法的一条新途径. 相似文献
3.
通过数值模拟分别在类内均值间距离、解释变量个数、协方差矩阵、样本容量、类间样本容量之差不同的情况下,比较了Logistic回归和线性判别分析的拟合效果。拟合效果由回判错误率以及指标B、C、Q进行量化,给出了两种方法的适用情况。 相似文献
4.
作为一种新型高维数据,函数型数据重在研究数据的内在本质而不是外在结构,通过非参数方法将数据拟合为函数型数据以捕捉更多信息.针对响应变量为二分类情形,建立贝叶斯框架下的函数型Logistic回归模型,引入适当的先验信息并利用MCMC算法获得参数的条件后验分布.具体解决流程为:选取由数据驱动的主成分基函数对回归系数函数和回归函数型自变量进行展开,对展开项数进行截断,利用主成分基函数的正交性,将高维数据进行低维表示;再利用Polya-Gamma变换,建立易于获得参数后验的Gibbs抽样算法,从而得到回归函数展开项系数的后验分布.蒙特卡洛模拟结果显示,该方法具有较好的分类性能.将该方法应用于Tecator实际数据,发现其分类效果优于别的方法. 相似文献
5.
基于分类回归树(CART)方法的统计解析模型的应用与研究 总被引:11,自引:0,他引:11
分类回归树是基于统计理论的非参数的识别技术,它具有非常强大的统计解析功能,对输入数据和预测数据的要求可以是不完整的,或者是复杂的浮点数运算。而且,数据处理后的结果所包含的规则明白易懂。因此,分类回归树已成为对特征数据进行建立统计解析模型的一个很好的方法。本文首先介绍了一种构建分类回归树的算法,并对其剪枝策略进行了简单的探讨,最后用统计解析软件S-PLUS对一个应用实例进行了分析,给出结果。 相似文献
6.
通过一定的财务指标,采用我国上市公司的财务数据,基于Logistic回归方法构建上市公司财务危机预警的模型,经过检验,具有一定的实际应用价值。 相似文献
7.
在解决线性回归问题时,回归正交试验具有较大的优越性,却无法解决非线性回归问题。本文依据广义线性模型的基本原理,针时非线性回归问题,引入Logistic变换,给出了基于Logistic变换的回归正交试验模型,实现了回归正交试验在非线性回归问题中的运用。将此方法运用到车险续保问题中,实例分析说明了该模型的可行性和有效性。 相似文献
8.
《西安邮电学院学报》2017,(3):29-33
针对电信数据维度增加导致的客户欠费预测算法复杂度过高的问题,提出基于主成分分析和分类回归树的电信客户欠费预测算法。该算法将原始电信数据进行数据缺失值处理、数据冗余识别和数据结构化后,进行数据规范化建模,利用主成分分析算法对建模后的电信数据进行降维处理,将降维后的数据作为分类回归树算法的输入数据对客户是否欠费进行分类,预测客户是否将存在欠费行为。利用实际电信数据进行验证,结果表明该算法的预测错误率为4.49%,预测耗时为17.05s,与分类回归树算法相比,在能够预测客户欠费的同时,还能提高预测效率。 相似文献
9.
基于Logistic回归模型的房地产上市公司财务危机预警研究 总被引:1,自引:0,他引:1
近年来房价不断上涨,我国政府采取了一系列紧缩政策来控制房价,对房地产上市公司产生了巨大影响,有部分公司因为资金链断裂而陷入困境。因此,对房地产上市公司的财务预警十分重要。文章采用非参数检验的方法,从反映企业各方面能力的20个财务指标中筛选出能显著区别ST和非ST上市公司的指标,建立Logistic回归模型,利用SPSS软件,对房地产上市公司的财务危机预警进行了研究。研究结果表明,基于Logistic回归模型的财务危机预警模型效果较好,具有良好的预测准确度。 相似文献
10.
通过改进CART(分类和回归树)分类法选择训练样本,可以降低与预测日不一致负荷模式的影响,提高预测精度,并运用人工神经元网络预测下一天的96点负荷.主要包括3个部分.首先,运用CART分类法将输入空间分成若干矩形互斥区域,每一个区域对应一种负荷模式;其次,根据分类结果选取神经元网络的训练样本.最后,合理映射天气因素和日期、星期类型并进行预测.实际应用表明本方法对于大波动负荷地区能够改善预测精度,提高预测速度. 相似文献
11.
针对logistic回归中最大似然估计法的迭代算法求解困难的问题,从理论和实例运用的两个角度寻找到一种简便估计法,即经验logistic回归。分析结果表明,在样本容量很大的情况下经验logistic回归方法比最大似然估计方法更具备良好的科学性和实用性,并且两种方法对同一组资料的分析结果一致,而经验logistic回归更简单,此结果对于实际工作者来说非常重要。 相似文献
12.
旨在运用二元罗吉斯回归模型(binary logistic regression model)及顺序罗吉斯回归模型(cumulative logistic regression model)分析孤立内波(internal solitary wave)于海脊地形的振幅反射率,并且藉由精确的回归模式,进而预测影响孤立内波传递的物理因子。根据顺序罗吉斯回归模型,以强、中、弱3种振幅反射率的分类形式,检验障碍物高度对振幅反射率的显著特性,具显著解释能力(P值皆小于0.001)。研究成果显示多元顺序罗吉斯回归模型较二元罗吉斯回归模型适合分析该实验数据之回归关系。 相似文献
13.
针对密码算法识别工作中因密码算法数量增多、密文数据复杂化以及数据间干扰增加,导致单层识别方案的识别准确率和稳定性变差等问题,提出一种基于混合梯度提升决策树和逻辑回归模型,并基于该模型构造分组密码算法识别方案。在该方案中,首先用原始十组特征训练梯度提升决策树模型,然后利用其学习而生成的树来构造新特征,再将新特征做one-hot编码,最后把这些新特征加入到原有特征中,训练逻辑回归模型进行预测。在唯密文情况下,针对AES、3DES、Blowfish、CAST和RC2五种典型的分组密码开展密码算法识别研究。当密文大小及其它实验条件都相同时,其二分类的识别准确率最高可达70%,五分类准确率最高达32%;高于基于单一梯度提升决策树分类方案的52.5%和27.2%分类准确率,以及单一逻辑回归模型分类方案的45%和25.6%分类准确率;显著优于二分类50%以及五分类20%的随机猜测正确率。实验结果表明,在分组密码算法上开展二分类和五分类识别,相较于其它识别方案,当密文长度相同时,该方案具有更高的分类准确率。同时随着密文长度的变化,识别准确率呈波动性变化,该方案波动幅度最小,受影响程度最小,稳定性最高。 相似文献
14.
传统的Logistic回归参数估计(如极大似然估计)是在随机抽样的假设下做出的.但是,在基于选择(Choice-based)抽样条件下,传统的回归系数估计是有偏的.本文利用随机模拟的方法,比较了Logistic回归参数估计的3种方法,即先验概率法、加权法和传统的极大似然估计法,并列举了两种修改Logistic回归参数估计的方法. 相似文献
15.
在Spark集群环境下,通过Sparklyr调用MLib中的并行逻辑回归算法对大规模抵押贷款数据的训练集进行监督学习,使用R语言建立一个预测客户是否会如期归还贷款的逻辑回归分类模型。为了研究该模型的可信性以及获取效率,本文补充了伪判定系数、分类评价指标、测试集性能几个指标对模型可信性进行评价,并判定了模型的可信性。在获得了可信模型的基础上,实验结果表明:当数据量增加到一定阈值后,在集群环境下使用并行的算法获得逻辑回归分类模型的速度要优于对应的串行算法。 相似文献
16.
在与安全相关的流量管理中,对每类应用的关注度不同.针对带优先级约束的流量分类问题,设计了基于分支信息熵的决策树分类算法.实验结果表明,该算法整体准确率较高,并且各个分类的召回率与优先级约束一致. 相似文献
17.
运用Logistic回归方法分析了银行保险消费行为的影响因素,并构建了预测模型,然后利用保留样本进行了实证检验.通过对样本数据过离散、空单元、多元共线性、特异值、特殊影响案例的诊断,以及对模型的拟合程度和预测效果的检验,验证了所构建的模型具有较好的拟合程度和预测效果. 相似文献
18.
利用连续植被辐射传输模型(SAIL模型)模拟生成小麦冠层反射率数据,比较了数据挖掘中的新方法模型树、支持向量回归与传统的逐步回归用于高光谱数据定量预测的效果.结果表明:支持向量回归和模型树的预测精度都要远远高于逐步回归,在训练样本数量减少时,它们的优势更加明显;支持向量回归在高维空间中有很好的泛化能力,其预测精度随维数的增加呈持续上升的趋势;模型树的预测精度在低维条件下和支持向量回归相仿,但在高维条件下则比支持向量回归差很多,通过逐步回归的特征选择预处理,可以提高模型树的预测精度,缩小其与支持向量回归之间的差距. 相似文献
19.
提出了一种新的包分类算法SRC(sensitive recursive classification).它建立在决策树基础之上,在以防火墙, 访问控制列表为种子的规则库中进行实验.实验结果表明:SRC内存使用比Hicuts (hierarchical intelligent cuttings)减少3~10倍,最坏查找速度比Hicuts提高5倍以上;SRC的内存使用比EGT-PC(extended grid-of-tries and path compression)减少2~8倍,最坏查找速度比EGT-PC提高4倍以上. 相似文献