首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 175 毫秒
1.
基于递阶偏最小二乘回归的数据分析   总被引:1,自引:0,他引:1  
针对最小二乘法难以克服因子多重共线性对回归模型精度影响的不足和大坝观测数据分析中因变量较多的特征,引进递阶偏最小二乘法,对大坝安全监测变量及其影响因子进行递阶偏最小二乘回归分析,将建模预测分析方法通过递阶分层处理,可同时实现回归建模和数据结构简化,所建立的大坝安全监控模型精度可通过交叉有效性检验来控制.工程应用实例和模型对比分析研究表明,递阶偏最小二乘回归模型能有效克服由于各类因子变量间的多重共线性和因子变量数目较多而对模型拟合精度及其预测能力的影响,相对于传统回归模型有更好的解释能力,因而具有一定的实用价值.  相似文献   

2.
介绍了偏最小二乘回归的基本原理,建模思路和方法,将偏最小二乘回归模型应用于泾河流域非点源污染年负荷量预算,对计算结果的代表性和有效性进行了分析,并将其与最小二乘的多元回归模型预测结果进行了对比.实例计算分析结果表明,偏最小二乘回归分析对于反映因变量与多个相关性自变量之间的关系有较高的精度.  相似文献   

3.
大坝安全监控模型因子相关性及不确定性研究   总被引:24,自引:3,他引:21  
杨杰  胡德秀  吴中如 《水利学报》2004,35(12):0099-0105
针对最小二乘法难以克服因子多重共线性对回归模型精度影响的不足,本文对大坝安全监控模型因子间的相关性及其不确定性进行了研究。引进偏最小二乘法,对大坝安全监测变量及其影响因子进行偏最小二乘回归分析,将建模预测分析方法与非模型式的数据内涵分析有机结合,可同时实现回归建模、数据结构简化以及因子相关的不确定性分析,所建立的大坝安全监控模型,其精度可通过交叉有效性检验来控制。工程应用实例和模型对比分析研究表明,偏最小二乘回归模型能有效克服各类因子变量间的多重共线性对模型拟合精度及其预测能力的影响,因而比目前常用的最小二乘回归模型更具广泛适用性。  相似文献   

4.
城市水资源承载能力研究是保证城市水资源供需平衡、合理配置及城市可持续发展的重要理论依据.影响城市水资源承载能力的因素众多,且某些因素之间存在多重相关性,因而给水资源承载能力评价研究带来困难.应用偏最小二乘回归(PLS),以甘肃省金昌市为例,选取主控自变量因子建立了单因变量的PLS回归分析模型.结果表明:PLS能够有效地解决自变量之间的多重相关性问题;据此建立的回归模型阐明了自变量与因变量之间的依据关系,分析结果符合金昌市的实际情况.  相似文献   

5.
周鑫  印凡成 《人民长江》2010,41(9):95-97
在实际问题中,经常会碰到海量数据或者样本点较少,自变量较多的数据。对此可以利用递阶偏最小二乘回归来建立线性模型。但是一个直接的问题是如何对自变量进行分组。由此提出了基于聚类分析的递阶偏最小二乘回归方法,在对解释变量分组时引入聚类分析。通过对长江宜昌段水沙观测数据作实证分析后发现,基于聚类分析的递阶偏最小二乘回归方法是有效可行的,而且用该方法建立的回归模型比一般的偏最小二乘回归模型拟合能力更强。  相似文献   

6.
针对普通偏最小二乘回归(PLSR)分析模型不能较好地解决大量非线性问题的缺陷,可采用拟线性化方法,通过核函数变换,将原变量集合间的非线性关系转化为拟线性化关系,在此基础上建立非线性PLSR分析模型,并采用单因变量偏最小二乘回归简化算法进行回归分析,可有效地解决实测样本少、自变量集合存在多重相关的非线性多元回归分析和预测问题。结果表明:基于核函数变换的非线性偏最小二乘回归(PLSR)分析模型所用回归要素少、预测效果好、预测精度高,而且其计算简捷、计算效率高,但回归指标取舍及其数据的获取是制约该模型应用的关键.  相似文献   

7.
偏最小二乘回归模型中包含所有原始选择的变量,当自变量较多时,因得到的模型结果十分庞杂而难以分析和解释。本文采用递阶偏最小二乘(Hierarchical PLS,Hi-PLS)回归方法,通过分层建立模型的方法有效解决了这一问题。工程实践表明,本模型精度较高,特别适用于大规模变量集合的回归分析。  相似文献   

8.
递阶偏最小二乘回归在大坝安全监测中的应用   总被引:1,自引:0,他引:1  
偏最小二乘回归能有效地消除因子间的多重相关性,但从其算法特点和实际应用来看,也存在不足.例如,在算法方面,偏最小二乘提取的主成分不一定能同时保证方差和相关程度最大;在应用方面,含有较多自变量的偏最小二乘回归模型的可解释性不高.递阶偏最小二乘回归是偏最小二乘回归后续研究的成果之一,在一定程度上克服了上述不足.算例表明,递阶偏最小二乘回归模型较其他回归模型的可解释性强,较为合理.  相似文献   

9.
常规最小二乘法回归的不足之处是:难以有效识别和消除自变量因子间的多重相关性影响;然而偏最小二乘法回归模型却能够有效消除因子相关性对模型回归系数估计和回归分析效果的影响。文章介绍了偏最小二乘法回归基本原理和建模思路,并结合水库大坝监测实例分析了偏最小二乘法回归,实例表明,偏最小二乘法分离效果更好,反演结果精度更高,能满足对大坝安全监控的要求,在水利工程安全监测及有关数据的统计分析方面具有广阔的应用前景。  相似文献   

10.
在已建立的混凝土坝小样本安全监控模型基础上,采用正交偏最小二乘回归分析方法对自变量共线性问题进行研究:通过正交信号修正,去除水压、温度和时效等因素中与监测效应量正交的信息,以增强混凝土坝小样本安全监控模型的分析和解释能力。工程实例分析表明,相比于普通的偏最小二乘监控模型,所建模型在拟合和预测监测效应量变化规律和趋势、以及模型的总体解释能力等方面均有所改善,证实了正交偏最小二乘回归分析方法在混凝土坝小样本安全监控模型应用上的合理性,从而为完善混凝土坝安全监控模型理论提供参考。  相似文献   

11.
针对特高拱坝运行初期温度场的非稳定性和时效的非单调增长性,发展变形监测和预报模型,并提出构建方法。通过主成分上的分层聚类法选取代表性温度测点,将其实测值作为温度变量,引入包含徐变及其恢复项的时效变量表达式,论证其表达谷幅变形的能力。进而考虑库水位、实测温度、组合时效等变量,应用增强回归树方法提出特高拱坝运行初期变形监测和预报模型,并通过后向消减变量建立优化模型。分析各变量对变形的边际效应,得出相对影响,借助部分依赖图,辨识变量间相关关系及其对坝体变形的影响规律,揭示变形机制。将该模型应用于某特高拱坝,验证该模型的可行性和有效性;并将结果与支持向量机、多元回归模型进行对比分析,得出该模型具有显著的优越性。  相似文献   

12.
Habitat models serve three main purposes: First, to predict species occurrences on the basis of abiotic and biotic variables, second to improve the understanding of species‐habitat relationships and third, to quantify habitat requirements. The use of statistical models to predict the likely occurrence or distribution of species based on relevant variables is becoming an increasingly important tool in conservation planning and wildlife management. This article aims to provide an overview of the current status of development and application of statistical methodologies for analysing the species‐environment association, with a clear emphasis on aquatic habitat. It describes the main types of univariate and multivariate techniques available for analysis of species‐environment association, and specifically focuses on the assessment of the strengths and weaknesses of the available statistical methods to estimate habitat suitability. A second objective of this article is to propose new approaches using existing statistical methods. A wide array of habitat statistical models has been developed to analyse habitat‐species relationship. Generally, physical habitat is dependent on more than one variable (e.g. depth, velocity, substrate, cover) and several suitability indices must be combined to define a composite index. Multivariate approaches are more appropriate for the analysis of aquatic habitat as they inherently consider the interrelation and correlation structure of the environmental variables. Ordinary multiple linear regression and logistic regression are popular methods often used for modelling of species and their relationships with environment. Ridge regression and Principal component regression are particularly useful when the independent variables are highly correlated. More recent regression modelling paradigms like generalized linear models (GLMs) present advantages in dealing with non‐normal environmental variables. Generalized additive models (GAMs) and artificial neural networks are better suited for analysis of non‐linear relationships between species distribution and environmental variables. The fuzzy logic approach presents advantages in dealing with uncertainties that often exist in habitat modelling. Appropriate methods for analysis of multi‐species data are also presented. Finally, the few existing comparative studies for predictive modelling are reviewed, and advantages and disadvantages of different methods are discussed. Copyright © 2006 John Wiley & Sons, Ltd.  相似文献   

13.
党建  贾嵘  罗兴锜  武桦 《水利学报》2017,48(2):226-233
贯流式机组水导轴承性能对机组振动特性和稳定运行有很大影响,对此本文提出了一种基于H-K聚类逻辑回归模型用于实现贯流式机组水导轴承磨损性能评估。以黄河河口水电站3#机组振动、摆度幅值和工况参数等作为自变量,水导轴承运行状态作为因变量,同时为了增强模型泛化能力,引入H-K聚类方法对自变量进行离散化处理,通过建立变量之间的逻辑回归模型实现对机组水导轴承磨损性能评估。研究结果表明:机组轴系摆度信号和机组轴系振动信号可以更好地解释水导轴承性能变化,同时通过模型对水导轴承性能显著影响的特征信号频谱分析推断,机组水导轴承磨损的主要原因是机组轴线偏移和不平衡电磁拉力影响所致。  相似文献   

14.
 影响城市用水量的各个因素,存在多重相关性,采用传统最小二乘回归法建模,其估计参数存在较大误差,预测精度降低。运用偏最小二乘回归法建立城市用水量的预测模型可以克服变量间的多重相关性影响,并可以很好地解释因变量;采用GM(1,1)建立的城市用水量预测模型,能够克服参数的非线性干扰,进行中长期预测。结果和实际符合,将两者进行耦合,充分利用了两种模型的优点,预测结果更为合理可靠。  相似文献   

15.
回归分析是一种非常有用且灵活的分析方法,它是在一组试验或观测数据的基础上,寻找被随机性掩盖了的变量之间的依存关系。通过正交试验和回归分析在混凝土配合比试验、优选中的应用,可以看到:①回归分析可以准确的判断自变量的显著性,②建立简单的回归方程来解释自变量和因变量之间的关系,③利用所建立的回归方程比较准确的得到想要的试验结果。  相似文献   

16.
提出了一种分析直线供水边界含水层抽水试验数据的新方法。本文将井函数中的2个级数表达式分别采取不同的简化方式,建立了一个二元线性回归方程。将试验数据分别转换为对应回归方程中因变量和自变量的数据后,利用线性最小二乘法计算回归方程中的常数,然后利用这些常数计算含水层参数和映射井至观测井间的距离。与传统方法相比较,本文方法不需预先绘制专门图解曲线;不存在人为的随意性对计算结果精度的影响,计算过程易于程序化。  相似文献   

17.
在简要介绍回归模型的建立、求解及检验的基础上,以1990年~2007年宝鸡市区年降水量、年开采量和天然河道渗漏量作为自变量,宝鸡市地下水水位埋深为因变量,建立了宝鸡市区地下水位动态预报模型。通过对2008年的地下水位埋深进行预测,精度较为理想;并应用F检验法、相关系数r的评价和p值检验法对模型进行检验,结果表明所建立的模型能够反映因变量与自变量的线性关系,因而,可以应用于宝鸡市区地下水位动态预报。  相似文献   

18.
Twenty‐one stream reaches in northwestern Vermont were surveyed to assess the relative influence of local‐ and watershed‐scale variables on stream biotic assemblages including fish, aquatic macroinvertebrates and birds. Data were collected during the summers of 2003 and 2004 and included quantitative and qualitative geomorphic and habitat assessments (local‐scale) and land‐use characterization and modelled annual flow and sediment loading (watershed‐scale). Biotic assemblages were surveyed to capture characteristics related to abundance, diversity and composition. Principal components analysis (PCA) was used to generate sets of factors representing unique scenarios of geophysical data derived from various spatial extents within the watershed. These factors were then used as the independent variables in multiple regression models using the biotic data as the dependent variables. Forty significant models were built from the combination of the eight scenarios and 11 dependent variables. Fish assemblage diversity and composition were influenced by a combination of local‐scale and watershed‐scale variables; however, the qualitative local data were more predictive than the quantitative data. Local‐scale data and sediment (model‐derived) were important factors in building significant macroinvertebrate models. Bird abundance and species richness were best predicted using local geomorphic characteristics and the qualitative local data. Our results reinforce the concept that whereas both local‐ and watershed‐scale variables affect stream biota, their relative influence depends upon the individual ecology of each taxon. In order to address these issues, comprehensive watershed management, restoration and conservation plans would benefit from assessments at multiple scales and from geomorphological, watershed and multitaxonomic perspectives. Copyright © 2010 John Wiley & Sons, Ltd.  相似文献   

19.
为了提高PLS大坝监控模型的可解释性,引入一种数据预处理方法——正交信号修正(OSC)法,对原始自变量进行预处理,去除和因变量无关的信号,再建立PLS监控模型。实例分析表明,OSC-PLS法只需要1个主成分就可以建立监控模型,与PLS模型相比,该模型的回归系数具有明确的物理意义,因子的重要性指标更合理。因此,OSC-PLS大坝安全监控模型结构更简单,解释性更好,具有一定的推广价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号