首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
为了更好地识别具有影响因素多、样本量小等特点的疾病诊断的关键特征,辅助临床诊断决策的正确制定,提出了结合弹性网和支持向量机算法的疾病诊断关键特征识别方法。利用弹性网特征选择能力对原始数据集进行降维,得到影响疾病诊断的特征序列;根据特征序列选取关键特征子集,运用支持向量机和10折交叉验证方法获取相应特征子集的分类精度;以 UCI 中 Arrhythmia 数据集为例进行测试。结果表明,该方法能够得到较高的分类精度,并可以更有效地对原始样本数据集进行降维,去除影响因素中的冗余和不相关特征,适用于高维低样本量数据集的疾病诊断关键特征识别。  相似文献   

2.
针对F-score特征选择算法不能揭示特征间互信息而不能有效降维这一问题,应用去相关的方法对F-score进行改进,利用德语情感语音库EMO-DB,在提取语音情感特征的基础上,根据支持向量机(SVM)的分类精度选择出分类效果最佳的特征子集。与F-score特征选择算法对比,改进后的算法实现了候选特征集较大幅度的降维,选择出了有效的特征子集,同时得到了较理想的语音情感识别效果。  相似文献   

3.
运动想象脑电是一种多通道高维信号,特征选择可以降低特征维数,选择更具判别性的特征,从而有效提高脑电解码的性能。现有的特征选择方法主要包括过滤式、包裹式和嵌入式方法,这3类方法各有优缺点。为了综合利用各类方法的优势,提出2种混合特征选择方法。第1种方法,使用最小绝对值收缩和选择算子(LASSO)进行特征选择,得到LASSO模型的权重之后,再设定一系列权重阈值进行二次特征筛选。第2种方法,使用Fisher分数对特征进行评分,然后设定一系列权重阈值进行二次特征筛选。使用Fisher线性判别分析(FLDA)对2种方法选择的特征子集进行分类。在2组脑机接口(BCI)竞赛数据集和1组实验室自采集数据集上进行实验,最高平均分类准确率分别为77.47%、76.11%、71.30%。实验结果表明,所提出的方法其分类性能优于现有的特征选择方法,而且特征选择时间也具有较大优势。  相似文献   

4.
特征选择是处理高维大数据常用的降维手段,但其中牵涉到的多个彼此冲突的特征子集评价目标难以平衡。为综合考虑特征选择中多种子集评价方式间的折中,优化子集性能,提出一种基于子集评价多目标优化的特征选择框架,并重点对多目标粒子群优化(MOPSO)在特征子集评价中的应用进行了研究。该框架分别根据子集的稀疏度、分类能力和信息损失度设计多目标优化函数,继而基于多目标优化算法进行特征权值向量寻优,并通过权值向量Pareto解集膝点选取确定最优向量,最终实现基于权值向量排序的特征选择。设计实验对比了基于多目标粒子群优化算法的特征选择(FS_MOPSO)与四种经典方法的性能,多个数据集上的结果表明,FS_MOPSO在低维空间表现出更高的分类精度,并保证了更少的信息损失。  相似文献   

5.
当特征集合存在强相关的特征子集且共同对分类问题有重要贡献时,传统方法通常从该子集中随机选择一个特征,导致数据可读性和分类性能下降.为此,面向多分类问题,提出一种基于支持向量机的特征选择算法,并设计一种快速迭代算法.该算法能够自动选择或剔除强相关的特征子集,在得到有效特征的同时实现特征降维.利用人工数据集和标准数据集进行试验,结果表明文中算法在特征选择可行性和有效性方面都有良好表现.  相似文献   

6.
针对特征选择中降维效果与分类精度间的矛盾,通过分析传统的特征选择方法中的优点和不足,结合佳点集遗传算法的思想和K最近邻简单有效的分类特性,提出了基于佳点集遗传算法的特征选择方法.该算法对特征子集采用佳点集遗传算法进行随机搜索,并采用K近邻的分类错误率作为评价指标,淘汰不好的特征子集,保存较优的特征子集.通过实验比较看出,该算法可以有效地找出具有较高分类精度的特征子集,降维效果良好,具有较好的特征子集选择能力.  相似文献   

7.
基于拉普拉斯特征映射高光谱遥感影像降维及其分类   总被引:1,自引:0,他引:1  
在进行高光谱遥感影像监督分类过程中,结合高光谱数据非线性的特点和流形学习强大的非线性处理能力,提出一种基于拉普拉斯特征映射(LE)降维和最佳指数法(OIF)波段组合选择训练样本进行SVM分类的策略,首先对高光谱遥感影像波段进行优化,利用拉普拉斯特征映射法(LE)对波段优选后的影像进行降维,利用OIF选择波段组合叠加进行训练样本选择。在此基础上采用支持向量机(SVM)进行分类处理,取得了优于PCA的效果。实验证明了流形学习是一种行之有效的高光谱遥感数据特征提取方法。  相似文献   

8.
针对传统机器学习分类算法处理高维个人信用数据时分类准确率较低的问题,提出一种基于皮尔森相关系数(PCC)和互信息法结合梯度提升决策树(MI-GBDT)的最优特征子集的选择方法,并应用在决策树、朴素贝叶斯分类器、支持向量机上。利用皮尔森相关系数去除强相关特征,利用互信息法和GBDT计算剩余特征的综合重要度,结合改进的基于特征排序的搜索策略,分别生成3种分类器模型所需的最优特征子集。实验结果表明,该方法在3种分类模型上筛选出的特征子集对应的分类精度分别提高了4.33%、13.29%和20.27%。  相似文献   

9.
黄晓娟  张莉 《计算机应用》2015,35(10):2798-2802
为处理癌症多分类问题,已经提出了多类支持向量机递归特征消除(MSVM-RFE)方法,但该方法考虑的是所有子分类器的权重融合,忽略了各子分类器自身挑选特征的能力。为提高多分类问题的识别率,提出了一种改进的多类支持向量机递归特征消除(MMSVM-RFE)方法。所提方法利用一对多策略把多类问题化解为多个两类问题,每个两类问题均采用支持向量机递归特征消除来逐渐剔除掉冗余特征,得到一个特征子集;然后将得到的多个特征子集合并得到最终的特征子集;最后用SVM分类器对获得的特征子集进行建模。在3个基因数据集上的实验结果表明,改进的算法整体识别率提高了大约2%,单个类别的精度有大幅度提升甚至100%。与随机森林、k近邻分类器以及主成分分析(PCA)降维方法的比较均验证了所提算法的优势。  相似文献   

10.
基于类别选择的改进KNN文本分类   总被引:3,自引:0,他引:3  
特征高维性以及算法的泛化能力影响了KNN分类器的分类性能.提出了一种降维条件下基于类别的KNN改进模型,解决了k近邻选择时大类别、高密度样本占优问题.首先使用一种改进的优势率方法进行特征选择,随后使用类别向量对文本类别进行初步判定,最后在压缩后的样本集上使用KNN分类器进行分类.试验结果表明,提出的改进分类模型提高了分类效率.  相似文献   

11.
在对高维少样本的遗传数据进行单核苷酸多态性(SNP)选择时,为能使所选SNP子集高度代表所有SNP信息,实现数据降维,在模糊C均值(FCM)算法的基础上提出一种改进方法GN-FCM。通过引入SNP权重因子量化SNP位点重要程度的差异性,同时将重点SNP邻域正则项引入模糊聚类的损失函数中,挖掘高度重要SNP与同邻域内其他SNP的关联性。实验结果表明,GN-FCM具有较好的收敛性,与DW-FCM算法相比,其构造的SNP子集在支持向量机、决策树和朴素贝叶斯分类中准确率分别提升5.73%、3.40%和3.79%,F1值分别提升4.01%、3.20%和2.22%。  相似文献   

12.
本文提出了一种协同降维策略来优化特征维度进而提升电子鼻分类精度。该协同降维策略结合了无监督和有监督降维的优点实现原始特征的有效降维,并利用该策略实现不同品牌白酒的智能辨识。 首先,提取电子鼻检测数据的最大值、 稳态均值、积分值以及小波能量值作为特征值。其次,将无监督降维方式的核熵成分分析(KECA)引入对融合特征进行初步降维。再利用有监督降维方式的线性判别分析(LDA)进行再次降维得到最终的综合特征。最后,基于支持向量机(SVM)、概率神经网络(PNN)、随机森林(RF)对综合特征进行分类识别。结果表明,KCEA-LDA-SVM获得了最高的分类性能达96%,说明该协同降维策略可以有效提升电子鼻的检测性能。  相似文献   

13.
数据降维是提高入侵检测分类器的学习效率和检测速度的重要手段。针对目前入侵检测数据特征降维力度不够,提出了一种基于主成分分析的分类特征降维方法。该方法把样本集按数据类型分割成多个子集,分别对每个子集进行主成分分析来消除各子集间在降维时的相互影响,使得每个子集的降维达到最佳。实验结果表明采用分类主成分分析方法能够更有效地降低数据维数,提高了入侵检测分类器的学习速度和检测速度。  相似文献   

14.
针对软件可靠性早期预测中软件复杂性度量属性维数灾难问题,提出了一种基于最小绝对值压缩与选择方法(The Least Absolute Shrinkage and Select Operator,LASSO)和最小角回归(Least Angle Regression,LARS)算法的软件复杂性度量属性特征选择方法。该方法筛选掉一些对早期预测结果影响较小的软件复杂性度量属性,得到与早期预测关系最为密切的关键属性子集。首先分析了LASSO回归方法的特点及其在特征选择中的应用,然后对LARS算法进行了修正,使其可以解决LASSO方法所涉及的问题,得到相关的复杂性度量属性子集。最后结合学习向量量化(Learning Vector Quantization,LVQ)神经网络进行软件可靠性早期预测,并基于十折交叉方法进行实验。通过与传统特征选择方法相比较,证明所提方法可以显著提高软件可靠性早期预测精度。  相似文献   

15.
结合像元形状特征分割的高分辨率影像面向对象分类   总被引:3,自引:0,他引:3  
针对高分辨率遥感影像空间分辨率高,结构形状、纹理、细节信息丰富等特点,提出一种新的融合特征的面向对象影像分类方法来提取城市空间信息。基本过程包含以下4个方面:①提取影像的几何纹理等结构;②融合几何与纹理特征的面向对象影像分割;③提取对象的形状、纹理和光谱特征,并优选最佳特征子集;④最后基于支持向量机(SVM)完成面向对象的影像分类。通过对福州IKONOS影像数据实验,结果表明融入影像特征后的分割效果明显优于原始影像的分割结果,而信息最大化(mRMR)的特征选择能够快速地获得较好的特征子集。通过与eCognition最邻近分类方法比较,表明本文方法的分类总体精度大约提高了6%,效果显著。  相似文献   

16.
以福建省莆田市东圳水库库区为例,采用QuickBird卫星影像,利用主成分分析方法对灰度共生矩阵方法提取的地物纹理特征进行筛选,选择最佳的影像纹理特征,组成新的波段组合,并应用支持向量机方法(Support Vector Machine,SVM)进行枇杷树的提取分类,最后与只依靠光谱信息来分类的SVM法分类结果进行比较,其分类总精度由原来的71.33%提高到了86.67%,Kappa系数也由原来的0.6410提高到了0.8293,分类精度明显提高,表明光谱信息加入纹理特征信息能辅助并提升高分辨率遥感枇杷树信息提取的精度。  相似文献   

17.
淋巴结病变的诊断对于患者的治疗具有重要意义。在淋巴结病变的临床超声诊断中,通常只使用单一模态的B型超声图像。有时会采集B型超声和弹性超声或者采集B型超声和超声造影(CEUS)的双模态图像,很少情况下会采集全部三个模态图像。为了提高B型单模态的诊断性能,提出一种基于特权信息学习的淋巴结病变计算机辅助诊断(CAD)方法,在训练阶段使用三个模态图像,在测试阶段只使用B型。分别提取B型、弹性超声和CEUS图像的量化特征;在CAD模型中,训练样本为B型、弹性超声和CEUS多模态数据,测试样本只有B型;通过训练样本学习,得到结合特权信息的支持向量机(SVM+)模型,使用该模型对测试样本进行分类。试验结果表明,该方法的分类准确率、精度、敏感性、特异性和约登指数达到0.85、0.93、0.88、0.77和0.65,相较单模态B型超声训练的CAD模型,其分类结果分别提升了0.08、0.02、0.08、0.08和0.16。基于特权信息学习,提高了诊断精度,提升了计算机辅助诊断的性能。  相似文献   

18.
一种基于PCA和ReliefF的特征选择方法   总被引:4,自引:0,他引:4       下载免费PDF全文
如何减少样本的训练测试时间、提高分类精度是有效特征选择方法研究的重要方面。提出了一种结合PCA和ReliefF的特征选择算法。该算法选择出了最具有代表性的特征,构成有效特征子集,实现了特征降维。同时,较PCA-GA方法,该算法具有简单、快速等优点。利用标准数据集进行的实验结果表明,文中算法是可行的、有效的,为模式识别的信息特征压缩提供了一种新的研究方法。  相似文献   

19.
提出了一种基于支持向量机的改进的降维方法.在输入和特征空间中,特征子集的选取分别根据原始特征每一维对分类的贡献来获得.最后,通过将输入和特征空间中的特征选取联合起来,得到了一种改进的降维方法.实验表明:使用这种方法,在保持对分类准确率不受明显的影响的同时,能大大地提高训练和预测的速度.  相似文献   

20.
针对高维大样本空间中支持向量机( SVM)存在计算复杂度高、分类精度低等问题,在随机子空间方法与主成分分析方法的基础上,提出一种特征加权支持向量机的高维隐写盲检测方法。通过随机子空间对原始高维样本的特征空间进行随机采样,产生多个低维的特征子集,在特征子集中采用主成分分析法进行特征提取,并利用卡方统计计算特征权重,运用特征加权核函数训练各基SVM分类器,并用多数投票法融合各基分类器结果得到最终分类结果。对HUGO隐写算法的实验结果表明,该方法能有效降低SVM计算复杂度,与传统方法相比,具有较高的隐写检测率和更快的分类速度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号