首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
为了解决ReliefF算法随机抽样会抽取到不具代表性的样本且未考虑特征间相关性的问题,提出基于冗余性分析的ReliefF特征选择算法。首先改进ReliefF的抽样策略,其次将特征权重序列划分为几个子集,分别利用最大信息系数及Pearson系数共同衡量特征相关性,设置相应采样比例剔除冗余特征。将改进算法与其他特征选择算法进行对比,结果表明相较于传统ReliefF,在LightGBM(Light Gradient Boosting Machine,轻量级梯度提升机器学习)上的分类准确率可提升0.63%~12.10%,在SVM(Support Vector Machine,支持向量机)上的分类准确率可提升0.92%~9.06%,改进算法的分类准确率明显优于其他几种特征选择算法,在考虑特征与标签相关性的同时,能有效剔除冗余信息。  相似文献   

2.
针对心电(ECG)信号智能分析模型中,复杂波形的特征提取困难,人工设计特征造成源信号特征丢失,标签样本不足等问题,提出了一种基于深度稀疏自编码器(Deep Sparse Auto-Encoders,DSAEs)的ECG特征提取方法。该方法在DSAEs进行贪婪逐层训练时,采用适应性矩阵估计(Adaptive moment estimation,Adam)对网络权重进行寻优,以此获得最优参数组合,同时提取出高层隐含层的输出,并作为ECG高度抽象的低维特征。最后利用支持向量机(Support Vector Machines,SVM)构建分类模型,完成对ECG的特征分类。使用MIT-BIH心律失常数据库的ECG数据进行仿真实验,结果表明,提出的ECG特征提取方法能有效地分层抽取特征,提高分类识别准确率。  相似文献   

3.
提出了一种基于多类SVM和小波变换的ECG检测、分类算法,利用小波变换的时频特性,最大限度地避免了原始ECG信号的各种噪声干扰,有效提取ECG的特征量作为多类SVM的输入训练样本。实验结果表明,将小波变换和SVM相结合,可以有效地将不同病患的ECG信号识别出来。  相似文献   

4.
葛倩  张光斌  张小凤 《计算机应用》2022,42(10):3046-3053
为解决特征选择ReliefF算法在利用欧氏距离选取近邻样本过程中,算法稳定性差以及选取的特征子集分类准确率低的问题,提出了一种利用最大信息系数(MIC)作为近邻样本选择标准的MICReliefF算法;同时,以支持向量机(SVM)模型的分类准确率作为评价指标,并多次寻优,以自动确定其最优特征子集,从而实现MICReliefF算法与分类模型的交互优化,即MICReliefF-SVM自动特征选择算法。在多个UCI公开数据集上对MICReliefF-SVM算法的性能进行了验证。实验结果表明,MICReliefF-SVM自动特征选择算法不仅可以筛除更多的冗余特征,而且可以选择出具有良好稳定性和泛化能力的特征子集。与随机森林(RF)、最大相关最小冗余(mRMR)、相关性特征选择(CFS)等经典的特征选择算法相比,MICReliefF-SVM算法具有更高的分类准确率。  相似文献   

5.
针对人脸识别中因特征个数较多对识别的实时性和准确性影响较大的问题,提出了ReliefF-SVM RFE组合式特征选择的人脸识别方法。利用离散余弦变换提取特征和ReliefF对人脸图像特征集做特征初选,降低特征维数空间,再用改进的SVM RFE(Support Vector Machine Recursive Feature Elimination)选择最优特征,解决了利用SVM RFE特征选择时因特征数多而算法需多次训练耗时长的问题。对训练得到的特征排序表采用交叉留一验证方法选取最优子集,再由SVM分类识别。在UMIST人脸库上实验证明,可以在特征数为52时,达到98.84%的识别率,识别时间仅需0.037 s。  相似文献   

6.
为了提高国画检索效率,应用SVM算法对鞍马画、花鸟画、人物画、竹子画和山水画等国画进行分类。首先通过对收集的国画样本进行预处理;其次,利用人眼对颜色的划分特点,把RGB模式图像转化为HSV模式,对其H、S、V分量进行非等间隔量化,组成一维特征向量,同时结合惯性比形成图像颜色特征信息,使用灰度共生矩阵算法获取纹理特征信息;最后,通过对比网格搜索、遗传算法(GA)、粒子群算法(PSO)的参数寻优方法,应用网格搜索法对国画图像进行分类,并对比了BP神经网络和判别分析算法的分类效果,SVM的正确率高达97%以上,试验结果表明SVM在国画分类应用是有效和可行的。  相似文献   

7.
基于遗传算法和支持向量机的特征选择研究   总被引:3,自引:0,他引:3  
为了让特征子集获得较高的分类准确率,提出了基于遗传算法和支持向量机的特征选择方法.该方法在ReliefF算法提供先验信息的基础上,将SVM参数混编入特征选择基因编码中,然后利用遗传算法寻求最优的特征子集和支持向量机参数组合.实验结果表明,通过该方法选择的特征子集和支持向量机参数组合能以较小的特征子集获得较高的分类准确率.  相似文献   

8.
针对高维度小样本数据在特征选择时出现的维数灾难和过拟合的问题,提出一种混合Filter模式与Wrapper模式的特征选择方法(ReFS-AGA)。该方法结合ReliefF算法和归一化互信息,评估特征的相关性并快速筛选重要特征;采用改进的自适应遗传算法,引入最优策略平衡特征多样性,同时以最小化特征数和最大化分类精度为目标,选择特征数作为调节项设计新的评价函数,在迭代进化过程中高效获得最优特征子集。在基因表达数据上利用不同分类算法对简化后的特征子集分类识别,实验结果表明,该方法有效消除了不相关特征,提高了特征选择的效率,与ReliefF算法和二阶段特征选择算法mRMR-GA相比,在取得最小特征子集维度的同时平均分类准确率分别提高了11.18个百分点和4.04个百分点。  相似文献   

9.
针对直升机系统与传递路径复杂,采集信号中成分多样,传统方式提取的特征难以有效反映信号健康状态,影响滚动轴承诊断精度等问题,在传统时域指标的基础上,结合多尺度空间对特征空间重叠和信号跨尺度复杂性问题上的优势,构建多尺度指标作为故障分类的依据。根据ReliefF算法对原始高维多尺度特征迭代计算得到权重,利用权重值进行特征选择,同时减轻计算成本。权重最大的一部分特征将作为随机森林模型的输入,利用其多分类器集成学习的优势,进行滚动轴承故障分类诊断。通过滚动轴承公开数据集来说明所提方法的优势和可行性。数据处理结果表明,多尺度特征较原始时域特征具有更好的分类性能,并且随机森林在该算法中较其他分类模型分类效果更好。  相似文献   

10.
针对高维小样本的DNA微阵列数据多分类问题,提出一种基于ReliefF和蚁群算法的特征基因选择方法(ReliefF and Ant Colony Optimization, ReFACO)。该方法首先采用ReliefF算法评估特征权重,根据阈值筛选出无关基因;然后引入改进的蚁群算法,在迭代改进的过程中寻找最优基因子集;最后利用经典分类算法对维数约简后的数据分类识别。经实验证明,该方法可以有效地剔除无关和冗余基因,并利用较少特征基因达到较高多分类效果。  相似文献   

11.
A new approach to time-frequency transform and pattern recognition of non-stationary power signals is presented in this paper. In the proposed work visual localization, detection and classification of non-stationary power signals are achieved using hyperbolic S-transform known as HS-transform and automatic pattern recognition is carried out using GA based Fuzzy C-means algorithm. Time-frequency analysis and feature extraction from the non-stationary power signals are done by HS-transform. Various non-stationary power signal waveforms are processed through HS-transform with hyperbolic window to generate time-frequency contours for extracting relevant features for pattern classification. The extracted features are clustered using Fuzzy C-means algorithm and finally the algorithm is optimized using genetic algorithm to refine the cluster centers. The average classification accuracy of the disturbances is 93.25% and 95.75% using Fuzzy C-means and genetic based Fuzzy C-means algorithm, respectively.  相似文献   

12.
We propose a systematic ECG quality classification method based on a kernel support vector machine(KSVM) and genetic algorithm(GA) to determine whether ECGs collected via mobile phone are acceptable or not. This method includes mainly three modules, i.e., lead-fall detection, feature extraction, and intelligent classification. First, lead-fall detection is executed to make the initial classification. Then the power spectrum, baseline drifts, amplitude difference, and other time-domain features for ECGs are analyzed and quantified to form the feature matrix. Finally, the feature matrix is assessed using KSVM and GA to determine the ECG quality classification results. A Gaussian radial basis function(GRBF) is employed as the kernel function of KSVM and its performance is compared with that of the Mexican hat wavelet function(MHWF). GA is used to determine the optimal parameters of the KSVM classifier and its performance is compared with that of the grid search(GS) method. The performance of the proposed method was tested on a database from PhysioNet/Computing in Cardiology Challenge 2011, which includes 1500 12-lead ECG recordings. True positive(TP), false positive(FP), and classification accuracy were used as the assessment indices. For training database set A(1000 recordings), the optimal results were obtained using the combination of lead-fall, GA, and GRBF methods, and the corresponding results were: TP 92.89%, FP 5.68%, and classification accuracy 94.00%. For test database set B(500 recordings), the optimal results were also obtained using the combination of lead-fall, GA, and GRBF methods, and the classification accuracy was 91.80%.  相似文献   

13.
免疫多域特征融合的多核学习SVM运动想象脑电信号分类   总被引:2,自引:1,他引:1  
张宪法  郝矿荣  陈磊 《自动化学报》2020,46(11):2417-2426
针对多通道四类运动想象(Motor imagery, MI)脑电信号(Electroencephalography, EEG)的分类问题, 提出免疫多域特征融合的多核学习SVM (Support vector machine)运动想象脑电信号分类算法.首先, 通过离散小波变换(Discrete wavelet transform, DWT)提取脑电信号的时频域特征, 并利用一对多公共空间模式(One versus the rest common spatial patterns, OVR-CSP)提取脑电信号的空域特征, 融合时频空域特征形成特征向量.其次, 利用多核学习支持向量机(Multiple kernel learning support vector machine, MKL-SVM)对提取的特征向量进行分类.最后, 利用免疫遗传算法(Immune genetic algorithm, IGA)对模型的相关参数进行优化, 得到识别率更高的脑电信号分类模型.采用BCI2005desc-Ⅲa数据集进行实验验证, 对比结果表明, 本文所提出的分类模型有效地解决了传统单域特征提取算法特征单一、信息描述不足的问题, 更准确地表达了不同受试者个性化的多域特征, 取得了94.21%的识别率, 优于使用相同数据集的其他方法.  相似文献   

14.
Support vector machines (SVM) are an emerging data classification technique with many diverse applications. The feature subset selection, along with the parameter setting in the SVM training procedure significantly influences the classification accuracy. In this paper, the asymptotic behaviors of support vector machines are fused with genetic algorithm (GA) and the feature chromosomes are generated, which thereby directs the search of genetic algorithm to the straight line of optimal generalization error in the superparameter space. On this basis, a new approach based on genetic algorithm with feature chromosomes, termed GA with feature chromosomes, is proposed to simultaneously optimize the feature subset and the parameters for SVM.To evaluate the proposed approach, the experiment adopts several real world datasets from the UCI database and from the Benchmark database. Compared with the GA without feature chromosomes, the grid search, and other approaches, the proposed approach not only has higher classification accuracy and smaller feature subsets, but also has fewer processing time.  相似文献   

15.
提出了一种基于遗传算法的大数据特征选择算法。该算法首先对各维度的特征进行评估,根据每个特征在同类最近邻和异类最近邻上的差异度调整其权重,基于特征权重引导遗传算法的搜索,以提升算法的搜索能力和获取特征的准确性;然后结合特征权重计算特征的适应度,以适应度作为评价指标,启动遗传算法获取最优的特征子集,并最终实现高效准确的大数据特征选择。通过实验分析发现,该算法能够有效减小分类特征数,并提升特征分类准确率。  相似文献   

16.
M.E. ElAlami 《Knowledge》2009,22(5):356-362
This paper describes a novel feature subset selection algorithm, which utilizes a genetic algorithm (GA) to optimize the output nodes of trained artificial neural network (ANN). The new algorithm does not depend on the ANN training algorithms or modify the training results. The two groups of weights between input-hidden and hidden-output layers are extracted after training the ANN on a given database. The general formula for each output node (class) of ANN is then generated. This formula depends only on input features because the two groups of weights are constant. This dependency is represented by a non-linear exponential function. The GA is involved to find the optimal relevant features, which maximize the output function for each class. The dominant features in all classes are the features subset to be selected from the input feature group.  相似文献   

17.
在分析遥感红外图像特点的基础上,提取了灰度共生矩阵的能量、惯性、熵等14个特征量用于红外图像纹理分析.以最小判别熵可分性判据作为准则,利用遗传算法搜索最优特征子集,实现了遥感红外图像的特征选择.为了验证此算法特征选择的有效性,设计了RBF网络分类器,对遥感红外图像进行分类识别,其结果证明,基于最小熵和遗传算法所得到的特征子集可以简化网络结构,减少训练时间,提高样本的识别概率.  相似文献   

18.
19.
赵军 《计算机工程》2009,35(23):166-167
针对传统遗传算法在网络入侵检测中存在分类复杂的问题,提出结合条件熵遗传算法(CEGA)和支持向量机(SVM)的网络入侵检测算法。将入侵特征的抽取和分类模型的建立进行联合优化,同时利用训练数据的统计特性指导入侵特征的抽取,并对特征空间进行线性变换,得到优化的特征子集和分类模型,在提高分类检测率的同时降低检测时延。  相似文献   

20.
提出了一种基于遗传算法优化支持向量机的故障诊断模型.它利用遗传算法对支持向量机同时对传统的时域特征参量子集和核参数同时优化,以达到选择最优的设备故障主导特征参数组合的目的,实现对机器不同类型故障的识别.对齿轮故障诊断的结果表明它有效提高了多分类支持向量机的故障分类准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号