首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 899 毫秒
1.
高维少样本数据的特征压缩   总被引:1,自引:0,他引:1       下载免费PDF全文
针对一类高维少样本数据的特点,给出了广义小样本概念,对广义小样本进行信息特征压缩:特征提取(降维)和特征选择(选维)。首先介绍基于主成分分析(PCA)的无监督与基于偏最小二乘(PLS)的有监督的特征提取方法;其次通过分析第一成分结构,提出基于PCA与PLS的新的全局特征选择方法,并进一步提出基于PLS的递归特征排除法(PLS-RFE);最后针对MIT AML/ALL的分类问题,实现基于PCA与PLS的特征选择和特征提取,以及PLS-RFE特征选择与比较,达到广义小样本信息特征压缩的目的。  相似文献   

2.
为确保高维数据的神经网络分类精度,提出了先降维后分类的方法。采用主成分分析(PCA)法实现高维数据的降维。通过分析传统BP算法,提出分两步来更新网络权值的扰动BP学习方法。采用MATLAB对降维分类算法的分类精度和误差收敛速度进行分析。仿真结果显示:先降维再采用扰动BP网络进行高维数据分类可大大提高数据的分类精度和训练速度。  相似文献   

3.
计算信息特征(属性)的权重问题在信息分类及模式匹配中是一个研究热点。该文提出一种基于改进ReliefF算法的主成分特征提取方法,利用此算法删除原始特征中与分类不相关的特征,并对数据进行归一化处理和主成分提取。实验将34个特征变量降维成10个主成分,大大减轻后续的分类器工作量,提高分类器的分类精度。  相似文献   

4.
稀疏主成分分析是一种用于降维和特征选择的无监督方法。由于计算多个主成分时主载荷向量间不具有相同的稀疏模式,导致难以从原始特征空间中确定出对主成分贡献最大的小部分变量,为解决此问题,提出一种自适应稀疏主成分分析(Adaptive sparse principal component analysis, ASPCA)算法。首先使用组套索模型,通过在载荷向量上施加块稀疏约束得出自适应稀疏主成分分析公式,随后对稀疏矩阵的不同列使用不同的调整参数获得自适应惩罚,最后运用块坐标下降法对自适应稀疏主成分分析公式进行两阶段优化,从而找到稀疏载荷矩阵和正交矩阵,实现降维的最优化。对稀疏主成分分析(Sparse principal component analysis, SPCA)算法、结构化且稀疏的主成分分析(Structured and sparse principal component analysis, SSPCA)算法和ASPCA算法进行仿真比较,结果表明ASPCA算法的降维性能更优,能提取更有价值的特征,从而显著提高了分类模型的平均分类准确率。  相似文献   

5.
针对间歇过程的高度复杂性、强非线性、强时段性等特点,提出一种基于核熵成分分析(KECA)特征变量降维,利用烟花算法(FWA)优化支持向量机(SVM)参数的间歇过程分时段故障诊断方法。首先,通过多向核主元分析(MKPCA)进行在线故障监测,输出故障数据;其次,利用K-means分类方法将间歇过程划分为若干个子时段,对故障数据进行KECA特征变量处理,按熵值贡献率来确定选取主元的个数,深层提取特征信息;最后,在各子时段内分别构建FWA优化SVM参数故障诊断模型,将降维处理后的故障数据代入各自所属子时段FWA-SVM诊断模型内进行故障诊断。通过对青霉素仿真实验数据进行各种对比实验研究,验证了该方法的可行性与有效性。  相似文献   

6.
提出一种基于分割的主成分分析(Segmented Principal Component Analysis,SPCA)和域变换递归滤波(Domain Transform Recursive Filtering,DTRF)的高光谱图像分类算法。利用SPCA方法降低高光谱图像的维数和提取各波段子集的第一主成分。使用不同参数的域变换递归滤波器对各波段子集第一主成分进行滤波,形成堆叠的边缘保持滤波图。采用主成分分析(Principal Component Analysis,PCA)将堆叠的边缘保持滤波图进行特征融合。利用基本阈值分类器(Basic Thresholding Classifier,BTC)对融合后的主成分进行分类。仿真实验表明,所提方法能够提高分类精度,且在总体分类精度、平均分类精度、Kappa系数等方面优于已有方法。  相似文献   

7.
主成分分析(Principal Component Analysis,PCA)可以处理大量过程参数间的关系与变化,排除次要因素,提取主要因素。文章将主成分分析和决策树C4.5算法相结合,提出一种心脏病诊断预测的新方法,该方法采用PCA方法对影响心脏病诊断的众多变量进行降维处理,减少了预测模型的输入量,消除输入数据间的相关性,用C4.5算法建立心脏病诊断的预测模型。经实验证明有效的提高了C4.5算法的分类正确率,提高了心脏病诊断的正确率。  相似文献   

8.
提出一种基于局部差分二值模型(Local Difference Binary Pattern,LDBP)和局部二值模型(Local Binary Pattern,LBP)的特征融合方法,以解决行人检测中检测精确度和鲁棒性不足的问题。对输入图像进行二维离散Haar小波变换,得到不同频率的四个子图像(LL,LH,HL和HH);对低频部分子图像提取LDBP特征,以及对其他三个高频部分子图像提取LBP特征;采用主成分分析法(PCA)分别对得到的LDBP特征和LBP特征进行降维;融合降维后的LDBP特征和LBP特征进行行人检测。在INRIA数据集上采用支持向量机(SVM)进行测试,实验结果表明,该方法能有效地提高检测精确度,且具有较好的鲁棒性。  相似文献   

9.
为了获得更好的文本分类准确率和更快的执行效率, 研究了多种Web文本的特征提取方法, 通过对互信息(MI)、文档频率(DF)、信息增益(IG)和χ2统计(CHI)算法的研究, 利用其各自的优势互补, 提出一种基于主成分分析(PCA)的多重组合特征提取算法(PCA-CFEA)。通过PCA算法的正交变换快速地将文本特征空间降维, 再通过多重组合特征提取算法在降维后的特征空间中快速提取出更具代表性的特征项, 过滤掉一些代表性较弱的特征项, 最后使用SVM分类器对文本进行分类。实验结果表明, PCA-CFEA能有效地提高文本分类的正确率和执行效率。  相似文献   

10.
穿戴式跌倒检测中老年人特征属性过多会造成维数灾难,影响后续跌倒检测精度。针对此问题,首先采用时域分析法提取初始特征向量集,然后用提出的改进核主成分分析算法(IKPCA)对特征向量进行降维,从而获得优质的特征向量集,使得后续的分类具有更好的效果。IKPCA算法首先利用I-RELIEF算法对初始特征向量集进行特征选择,然后计算跌倒特征向量的信息度量和相似度度量,最后根据跌倒特征向量的相似度度量剔除无效的跌倒特征向量。IKPCA算法不但保持核主成分分析算法(KPCA)较好的降维能力,而且扩充了较好的分类能力。利用真实的数据集进行实验,对比分析表明,相比其他算法,IKPCA算法能够得到更优质的特征向量数据集。  相似文献   

11.
基于经验模式分解和共空间模式,结合最优波长空间滤波,提出了三者相结合的特征提取方法。该方法首先利用经验模式分解进行分解,得到固有模态函数,选择合适的固有模态函数进行信号的重构,然后将重构的信号进行最优波长空间滤波变换,得到最优的波长选择信号,再经共空间模式投影映射,提取相应的特征向量,最后利用支持向量机进行分类。运用该方法对9位受试者进行分类结果分析,平均分类准确率在95%以上,实验表明,提出的算法具有较好的分类识别性。  相似文献   

12.
常规的公共空间模式分解方法需要大量的输入通道、缺乏频域信息,发展受到限制。为了克服以上缺点,将经验模式分解(Empirical Mode Decomposition,EMD)和公共空间模式算法结合,改变CSP滤波器成分选择方式,提出EMD-CSP算法来获取特征向量。该算法对预处理后的信号进行经验模式(EMD)分解,得到固有模态函数(Intrinsic Mode Functions,IMFs),观察并计算每个IMF分量的能量谱,筛选有效的IMF频段(5~28 Hz),使用改进的CSP滤波器进行滤波获取特征,最后使用支持向量机(Support Vector Machine,SVM)进行分类。分类结果得到9位受试的想象运动平均分类正确率为92%,证实了该算法的可行性与有效性。  相似文献   

13.
为了有效缓解不同受试者跨天试验间脑电信号差异对分类性能的影响,结合共空间模式和小波包分解算法,对12个受试者连续5天的脑电波数据进行空间滤波处理和时频域上小波包能量特征提取。采用Bagging tree、SVM、LDA和BLDA模型进行情感分类实验。实验结果表明,使用SVM和BLDA分类器对该算法提取的脑电特征进行两类情感分类的精度比目前最优的结果分别提高了4.4%和3.5%,有效地提高了跨天脑电情感分类的准确率和稳定性,对于开发鲁棒的情感脑-机接口应用具有一定价值。  相似文献   

14.
基于核熵成分分析的数据降维?   总被引:1,自引:0,他引:1       下载免费PDF全文
黄丽瑾  施俊  钟瑾 《计算机工程》2012,38(2):175-177
针对高维数据的维灾问题,采用核熵成分分析方法降维数据,并与主成分分析及核主成分分析方法进行对比。降维后的数据利用支持向量机算法进行分类,以验证算法有效性。实验结果表明,KECA在较低的维数时仍然能获得较好的分类精度,可以减少后续的处理复杂度和运行时间,适用于机器学习、模式识别等领域。  相似文献   

15.
考虑到单个特征对标签的有效性及多特征之间的信息冗余问题,提出一种联合互信息和改进PCA的双重降维方法。利用互信息对众多的特征进行初步筛选,舍弃一部分对标签信息贡献较低的特征,使用累积方差贡献率和复相关系数共同确定主元个数的主成分分析法进行二次降维,不仅保证了主元模型的信息容量,同时也避免了过多噪声的参与,从而保证了预测过程的准确性。通过神经网络对实际股票数据进行预测,表明了提出的降维算法的有效性。  相似文献   

16.
现有植物叶片识别方法都是基于扁平状叶片,而干旱区植物叶片多呈针叶,因此不适合干旱区植物叶片的识别,使得对于干旱区植物研究主要依靠专家识别,不利于对干旱区植物叶片的进一步研究。提出使用差异性值监督局部线性嵌入算法D-LLE,充分挖掘样本之间的类别信息,提高干旱区植物叶片的识别效率。首先利用金字塔梯度方向直方图(PHOG)的方法提取叶片图像特征,再使用PCA、LLE、WLLE、D-LLE等主流的降维算法,对提取的PHOG特征进行降维,最后建立支持向量机(SVM)的分类模型对植物叶片图像分类。经过这四种降维算法后的平均识别率分别为76.3%、85.3%、89.1%、95.5% ;骆驼刺、苦豆子和沙枣的叶片正确识别率,相对其他植物叶片较低。通过实验证明了PHOG特征在植物叶片特征提取的可行性,使用D-LLE算法相比传统特征降维的算法具有更高的效率,且较适合于干旱区植物叶片的自动识别分类。  相似文献   

17.
从相关向量机(RVM)和支持向量机(SVM)的相似性以及RVM的稀疏特性出发,将RVM应用于脑电信号(EEG)的情感识别中。针对一对一(OAO)和一对多(OAA)两种多分类方法各自的特点和不足,提出了一种全新的两层多分类模型(OAA-OAO),改进现有OAO算法中无效投票影响最终决策的现象。设计情感EEG信号识别对比实验,验证基于RVM的改进多分类算法在脑电信号情感识别中的应用。对于实验室采集的情感脑电信号,提取其非线性特征(功率谱熵、样本熵和Hurst指数)并采用主成分分析法进行降维。将OAA-OAO-RVM算法分别和OAO-SVM、OAO-RVM两种识别网络进行对比,分析RVM的识别性能以及OAA-OAO多分类算法的分类性能。结果表明,采用降维后的最优特征集合作为识别网络的输入向量得到的识别性能更高,且RVM表现出的性能优于SVM。同时,改进后的OAA-OAO算法较传统OAO模型的平均识别率提高了7.89%,证明OAA-OAO算法可有效去除一部分无效投票从而使分类精度得到显著提高,验证了此模型是一种有效的多分类模型。  相似文献   

18.
在原型空间特征提取方法的基础上提出一种基于加权原型空间特征提取的方法用于高光谱图像数据分类。通过加权模糊[C]均值算法对每个特征施加不同的权重,从而保证提取后的特征含有较高的信息量。实验结果表明,与PSFE相比,w-PSFE对数据集大小的稳定性更高,同时在提取少量的特征用于高光谱图像数据分类时分类精度更高。  相似文献   

19.
通过对运动想象脑电信号的分类,对受试者进行身份识别。采用一种盲源分离算法——二阶盲辨识对运动想象脑电信号进行处理,提高运动想象脑电信号的信噪比,进而采用Fisher距离对处理后的信号进行特征提取,最后采用BP神经网络对特征集进行分类,从而实现对受试者的身份识别。对3位受试者的4类运动想象脑电信号分别进行了分类识别,结果显示,4类运动想象脑电信号的识别率均达到80%左右,其中最高的是想象舌动脑电信号,其识别率达到88.1%,这在类似研究中属于较高的水平。  相似文献   

20.
综合考虑识别率、时间复杂度以及鲁棒性,提出一种边缘、纹理、颜色多特征融合和支持向量机(SVM)的交通标志识别算法。通过提取能够描述交通标志图像边缘信息的方向梯度直方图(HOG)特征并进行统计平均,与能够表示标志图像内部纹理信息的局部二值模式(LBP)特征融合得到降维后的HOG-maxLBP特征,再级联交通标志的颜色特征作为最终的特征向量,最后利用SVM进行交通标志训练和分类。实验结果表明,该算法不仅提高了交通标志的识别率,而且降低了时间复杂度,增强了系统鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号