共查询到19条相似文献,搜索用时 62 毫秒
1.
基于PLS的信息特征压缩算法 总被引:4,自引:0,他引:4
提出了基于偏最小二乘(PLS)方法的信息特征压缩算法.较主成分分析(PCA)方法,该算法具有简单、稳健、易于定性解释等优点,对于多重共线性资料,尤其当解释变量多,而样本量少时很有效.由于在考虑压缩数据矩阵X的信息的同时,顾及了与目标矩阵Y的最大相关性等优点,使之更符合实际.数值实例研究表明,文中算法是可行的、有效的,为模式识别的信息特征压缩提供了一种新的研究方法. 相似文献
2.
《计算机应用与软件》2017,(11)
针对高维少样本问题,利用偏最小二乘PLS模型,构造适合于小样本问题的挖掘算法。即在PLS的统一框架下,实现维数约简与分类学习,并在基因表达谱(Colon)癌数据分类问题中,实现PLS对小样本数据的挖掘与可视化。与经典算法SVMs进行比较分析,结果验证了PLS算法对高维少样本数据挖掘问题的有效性和可靠性。 相似文献
3.
糖尿病是一种可防可控的慢性疾病,会产生很多并发症,对人体危害很大,因此早期诊断糖尿病并干预生活方式对预防糖尿病慢性并发症十分必要。利用健康档案中数据来预测空腹血糖水平,因为空腹血糖水平的高低是早期诊断和干预的一个重要依据,但是健康档案中数据存在维度广、噪声多、强耦合、非线性等特点,为此提出了基于KPCA和LSSVM结合的方法进行建模,并将LSSVM、PCA-LSSVM、KPCA-LSSVM这3种模型进行比较,结果表明KPCA-LSSVM准确性比LSSVM、PCA-LSSVM大幅提高,ROC曲线的积分面积也接近于1,说明KPCA-LSSVM能够运用于空腹血糖的预测,也为医疗数据挖掘提供一种新的参考办法。 相似文献
4.
为了克服主成分分析(PCA)对共空间模式(CSP)提取脑电信号特征进行降维时,仅考虑主成分对输入变量的表征能力,而忽略了对输出变量进行解释的这一个缺点,提出偏最小二乘回归(PLS)进行降维,通过CSP对数据增强后的信号进行特征提取,采用PLS进行降维,将提取的主成分信息包含对因变量解释程度高的特征作为特征向量,使用PSO-SVM进行分类,用2005 BCI竞赛的数据集IIIa进行分类测试,结果得到3位被试的想象运动平均分类正确率91.71%,通过与CSP-LDS、WL-CSP和CSP等算法的比较,3位被试的平均分类正确率最高,验证了该算法的有效性。 相似文献
5.
带钢热连轧过程控制是钢铁制造过程极其复杂的过程,近年来随着市场对带钢产品质量要求的日益提高,提高热连轧带钢质量具有广泛的经济和社会效益。为了确保热连轧过程安全运行,同时提高产品质量,有必要对热连轧过程的异常状况或故障进行检测、诊断和消除。以多元统计过程监控技术(MSPM)为理论指导,以主元分析(PCA)和偏最小二乘方法(PLS)为依托,研究和分析了PCA和PLS以及二者与核函数结合构成的核主元分析方法(KP-CA)和核偏最小二乘方法(KPLS)在热连轧机质量相关的故障分析与检测,通过现场数据及实验验证,在厚度质量相关的故障检测与诊断中取得较好的效果。 相似文献
6.
PLS和SVM应用于基因表达数据分类 总被引:4,自引:3,他引:4
基因表达数据的一个重要应用是给疾病样本分类,如鉴别肿瘤的类型。基因芯片的蓬勃发展使得同时测定成千上万个基因的表达成为可能。这种测定能力使得我们在很短的时间内可以得到变量数p(基因数)远远大于样本数N的数据矩阵。标准的分类统计方法在N
相似文献
7.
提出一种基于偏最小二乘回归的鲁棒性特征选择与分类算法(RFSC-PLSR)用于解决特征选择中特征之间的冗余和多重共线性问题。首先,定义一个基于邻域估计的样本类一致性系数;然后,根据不同k近邻(kNN)操作筛选出局部类分布结构稳定的保守样本,用其建立偏最小二乘回归模型,进行鲁棒性特征选择;最后,在全局结构角度上,用类一致性系数和所有样本的优选特征子集建立偏最小二乘分类模型。从UCI数据库中选择了5个不同维度的数据集进行数值实验,实验结果表明,与支持向量机(SVM)、朴素贝叶斯(NB)、BP神经网络(BPNN)和Logistic回归(LR)四种典型的分类器相比,RFSC-PLSR在低维、中维、高维等不同情况下,分类准确率、鲁棒性和计算效率三种性能上均表现出较强的竞争力。 相似文献
8.
针对复杂工业过程的非线性、变量间的强相关性以及工况时变的特点,提出了一种基于局部KPLS特征提取的LSSVM建模方法。该方法通过属性加权的欧式距离指标选取局部训练样本子集,利用KPLS算法对该子集进行特征提取,使用LSSVM算法在线建立局部软测量模型。实验结果表明,该方法可以有效实现特征提取,具有更好的推广能力和预测精度,比基于全局KPLS特征提取的LSSVM模型和未经特征提取的全局LSSVM模型具有更好的泛化能力。 相似文献
9.
针对人脸图像中不同部位所含的信息熵不同,对识别的影响程度不同等因素,提出了一种信息熵加权的HOG特征提取方法。该算法将待识别的人脸图像进行分块,对分块后的图像进行HOG特征提取,计算每块图像所含的信息熵作为权重系数加到各个分块中形成新的HOG特征,通过PCA算法对特征进行降维,得到信息熵加权的HOG特征。通过在ORL和YALE实验结果表明,该算法相较于其他传统识别方法具有更高的识别精度和准确度,并且对于人脸在光照、姿态表情等干扰因素下均具有良好的有效性和鲁棒性。 相似文献
10.
提出了一种基于偏最小二乘判别分析和F-score的特征筛选方法,并将其用于蛋白质组学质谱数据分析。该方法主要包含3个步骤:(1)用LIMPIC算法对原始数据进行预处理;(2)计算每个变量的F-score值并将所有变量按F-score值降底的顺序排列;(3)采用偏最小二乘判别分析交互检验按前向选择法选择最佳变量子集。用本方法对一组结肠癌数据进行分析,最终从原始的16331个质荷比变量中选择了8个特征质荷比作为潜在的生物标记物。用所选择的特征对独立测试集的样本进行判别,其灵敏度和特异性分别达到了95.24%和100%。结果表明,所提出的方法可用于蛋白质组学质谱数据的特征筛选及样本分类。 相似文献
11.
12.
13.
人脸识别中PCA方法的推广 总被引:4,自引:0,他引:4
主成分分析(PrincipalComponentAnalysis,PCA)是公认的特征抽取的最为重要的工具之一,目前仍然被广泛地应用在人脸等图像识别领域。基于PCA,该文提出了分块PCA的人脸识别方法。分块PCA方法先对图像矩阵进行分块,对分块得到的子图像矩阵利用PCA进行鉴别分析。其特点是能有效地抽取图像的局部特征,对人脸表情和光照条件变化较大的图像表现尤为突出。与PCA方法相比,由于使用子图像矩阵,分块PCA可以避免使用奇异值分解理论,过程简便。此外,PCA是分块PCA的特殊情况。在Yale和NUST603人脸库上的试验结果表明,所提出的方法在识别性能上明显优于经典的PCA方法,识别率可以分别提高6.7和4个百分点。 相似文献
14.
基于改进的F-score与支持向量机的特征选择方法 总被引:1,自引:0,他引:1
将传统F-score度量样本特征在两类之间的辨别能力进行推广,提出了改进的F-score,使其不但能够评价样本特征在两类之间的辨别能力,而且能够度量样本特征在多类之间的辨别能力大小。以改进的F-score作为特征选择准则,用支持向量机(SVM)评估所选特征子集的有效性,实现有效的特征选择。通过UCI机器学习数据库中六组数据集的实验测试,并与SVM、PCA+SVM方法进行比较,证明基于改进F-score与SVM的特征选择方法不仅提高了分类精度,并具有很好的泛化能力,且在训练时间上优于PCA+SVM方法。 相似文献
15.
16.
应用主分量分析与粗糙集处理的特征提取 总被引:7,自引:1,他引:6
近年来,随着软计算理论的不断发展,粗糙集理论已经成为了目前研究的重点领域。论文讨论了主分量分析(PCA)与粗糙集的理论,并应用于图像特征提取中。采用PCA对输入向量进行甄别,应用粗糙集理论约简与分类无关或关系不大的向量。研究结果表明:在主成分分析中结合粗糙集理论可以排除无关向量的影响,并有效地进行特征提取。试验结果表明了结合两者能够提高模式分类的特征提取的效果。 相似文献
17.
对偏最小二乘(PLS)回归的基本方法进行了分析研究,提出了基于非线性迭代偏最小二乘(NIPLS)的信息模式识别算法。该算法实现了模式识别中特征提取与分类器设计的有机结合。NIPLS较Fisher判别分析、Bayes判别分析等经典的模式识别算法,具有更强的信息识别能力,且对数据本身的分布要求不高,尤其对于多重共线性资料或解释变量多而样本数量少时更为有效。将该算法应用于土地质量的分类识别,结果表明,该文所建立的算法是有效的、可靠的。 相似文献
18.
19.
为了更好地研究股指预测问题,提出了基于特征选取与LSTM模型的股指预测方法,该方法从优化特征参数选取角度对模型预测能力进行提升,包含全面选取特征参数、应用系统聚类法进行特征分类、应用主成分分析对分类特征进行降维三个步骤。在实证论证中,应用LSTM模型对纳斯达克股票指数数据和标普500指数数据进行预测,实验结果表明所提出的方法计算量小,预测结果在速度和准确度两方面分析均得到显著提升。 相似文献