首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
针对特征选择中降维效果与分类精度间的矛盾,通过分析传统的特征选择方法中的优点和不足,结合佳点集遗传算法的思想和K最近邻简单有效的分类特性,提出了基于佳点集遗传算法的特征选择方法.该算法对特征子集采用佳点集遗传算法进行随机搜索,并采用K近邻的分类错误率作为评价指标,淘汰不好的特征子集,保存较优的特征子集.通过实验比较看出,该算法可以有效地找出具有较高分类精度的特征子集,降维效果良好,具有较好的特征子集选择能力.  相似文献   

2.
为解决支持向量机(SVM)分类器的样本特征选择和参数优化问题,提出一种将特征选择和参数选择进行联合优化的方法。基于变尺度的混沌遗传算法,联合优化染色体编、译码,利用混沌的遍历性产生初始种群,改进遗传算法中的交叉算子,动态缩减寻优区间。将该方法应用于短波通信控制器的诊断分类器中,以实现分类器特征子集选取和参数的联合优化,结果表明该方法具有较强的寻优能力。  相似文献   

3.
针对网络流量特征属性选择的寻优和效率问题,提出了一种PCA结合禁忌搜索的网络流量特征选择方法。该方法通过PCA对高维特征属性空间进行特征约减,并利用禁忌搜索得到全局最优特征子集。实验证明,相比流行的遗传算法(GA)和粒子群寻优算法(PSO-SVM),PCA和禁忌搜索方法具有更好的处理效率和特征选择精度。  相似文献   

4.
基于遗传算法和支持向量机的特征选择研究   总被引:3,自引:0,他引:3  
为了让特征子集获得较高的分类准确率,提出了基于遗传算法和支持向量机的特征选择方法.该方法在ReliefF算法提供先验信息的基础上,将SVM参数混编入特征选择基因编码中,然后利用遗传算法寻求最优的特征子集和支持向量机参数组合.实验结果表明,通过该方法选择的特征子集和支持向量机参数组合能以较小的特征子集获得较高的分类准确率.  相似文献   

5.
基于遗传算法的结肠癌基因选择与样本分类   总被引:2,自引:1,他引:1       下载免费PDF全文
提出了一种基于两轮遗传算法的用于结肠癌微阵列数据基因选择与样本分类的新方法。该方法先根据基因的Bhattacharyya距离指标过滤大部分与分类不相关的基因,而后使用结合了遗传算法和CFS(Correlation-based Feature Selection)的GA/CFS方法选择优秀基因子集,并存档记录这些子集。根据存档子集中基因被选择的频率选择进一步搜索的候选子集,最后以结合了遗传算法和SVM的GA/SVM从候选基因子集中选择分类特征子集。把这种GA/CFS-GA/SVM方法应用到结肠癌微阵列数据,实验结果及与文献的比较表明了该方法效果良好。  相似文献   

6.
为进一步提升网络入侵检测效果,提出一种融合FAST特征选择与自适应二进制量子引力搜索支持向量机的(FAST-ABQGSA-SVM)网络入侵检测算法。利用FAST算法过滤掉原始特征集中冗余无关的特征形成候选特征子集,基于组合优化策略采用自适应二进制量子引力搜索算法对候选特征子集与SVM分类器参数进行组合优化。在ABQGSA反复学习寻优过程中,采取动态自适应波动式调整策略更新量子旋转角以平衡算法全局搜索能力和局部搜索能力,同时为提升算法的自适应变异能力,设计与进化程度及个体适应度值相关的自适应变异概率,当种群进化出现停滞时及时引入量子位离散交叉操作帮助种群摆脱局部极值。最后使用KDD CUP 99入侵检测数据进行仿真实验。结果表明,所提出的ABQGSA-SVM算法较其他同类型检测算法具有更好的鲁棒性、学习精度以及检测效果。  相似文献   

7.
由于高光谱数据具有波段多,数据量大等特点,对其进行降维处理成为高光谱遥感研究的一个重要问题。提出一种基于多分类器组合的高光谱波段选择方法,该方法通过遗传算法良好的寻优能力获得若干组较优初始波段子集,在此基础上使用这些波段子集训练若干个基分类器,进而利用改进的基于相同错误差异性度量的分类器选择方法选出部分较优分类器,实现波段选择的目的;最终通过局部精度分析的动态分类器选择实现多分类器组合决策。在公共测试数据集上的实验结果表明:与以往直接选择最优波段子集方法相比,提出的算法能够选择更多具有鉴别能力的波段,明显提高了分类正确率。  相似文献   

8.
在网络入侵检测中,不相关或冗余的特征使得检测变得越来越困难,为了提高检测的精度和效率,提出了一种新的网络入侵检测的特征选择方法.该方法首先利用粗糙集理论的特性对特征进行筛选;然后利用遗传算法在解决NP问题上的并行性、鲁棒性和全局优化搜索等特点,在剩余的特征子集中寻找最优子集.考虑到早熟问题会使遗传算法陷入局部最优,采用对种群聚类的方式建立自适应的交叉、变异率,种群个体交叉时在不同的类内随机选择从而保证群体多样性,每次迭代均保留父代的最优个体.在入侵检测的经典数据集KDD CUP 99上检验了算法的有效性,使用SVM分类器对选出的特征子集进行性能评估.实验结果表明,该方法与相关研究对比提高了入侵检测系统的精度和效率.  相似文献   

9.
基于量子遗传算法的特征选择算法   总被引:7,自引:1,他引:6  
特征选择是模式识别和机器学习等领域中重要而困难的研究课题.提出一种最优特征子集评价准则和实现特征选择的一种新量子遗传算法(NQGA).NQGA采用量子门旋转角更新新方法和增强算法寻优能力及防止早熟收敛的移民和灾变策略.定性分析了NQGA的高效性.典型复杂函数测试和雷达辐射源信号特征选择的应用表明,NQGA寻优能力强、收敛速度快和能有效防止早熟现象.采用提出的准则函数和搜索策略实现特征选择,大大降低了特征维数,获得了更高的正确识别率.  相似文献   

10.
RSM(Random Subspace Method)是一种新型的组合方法,利用随机挑选的特征子集生成每个基模型(Base Model),因此对于高维数据,RSM具有很大的应用潜力.本文将RSM方法应用于高光谱数据分类中,验证了RSM方法的有效性,并采用遗传算法(Genetic Algorithm)选择部分基模型构成组合来进一步提高分类精度.本文的工作为进一步在高光谱领域开展组合算法研究起到了很好的示范作用.  相似文献   

11.
特征选择应尽可能考虑特征的预测能力、特征间的相关性以及算法的计算效率等因素.由于目前Filter和Wrapper两类特征选择方法均存在着缺陷,提出了一种适用于回归的基于层次聚类算法和偏最小二乘的特征选择方法,它不但能选取出预测能力较强的特征,而且使选出的特征间的相关性低.仿真实验表明,将该方法用于盾构隧道施工地面沉降的回归预测中,所选取的最优特征子集使回归模型的精度得到提高,训练时间明显下降.  相似文献   

12.
针对传统支持向量机(SVM)在封装式特征选择中分类精度低、特征子集选择冗余以及计算效率差的不足,利用元启发式优化算法同步优化SVM与特征选择。为改善SVM分类效果以及选择特征子集的能力,首先,利用自适应差分进化(DE)算法、混沌初始化与锦标赛选择策略对斑点鬣狗优化(SHO)算法改进,以增强其局部搜索能力并提高其寻优效率与求解精度;其次,将改进后的算法用于特征选择与SVM参数调整的同步优化中;最后,在UCI数据集进行特征选择仿真实验,采取分类准确率、选择特征数、适应度值及运行时间来综合评估所提算法的优化性能。实验结果证明,改进算法的同步优化机制能够在高分类准确率下降低特征选择的数目,该算法比传统算法更适合解决封装式特征选择问题,具有良好的应用价值。  相似文献   

13.
针对目前大部分钓鱼网站检测方法存在检测准确率低、误判率高等问题,提出了一种基于特征选择与集成学习的钓鱼网站检测方法。该检测方法首先使用FSIGR算法进行特征选择,FSIGR算法结合过滤和封装模式的优点,从信息相关性和分类能力两个方面对特征进行综合度量,并采用前向递增后向递归剔除策略对特征进行选择,以分类精度作为评价指标对特征子集进行评价,从而获取最优特征子集;然后使用最优特征子集数据对随机森林分类算法模型进行训练。在UCI数据集上的实验表明,所提方法能够有效提高钓鱼网站检测的正确率,降低误判率,具有实际应用意义。  相似文献   

14.
This work presents a global geometric similarity scheme (GGSS) for feature selection in fault diagnosis, which is composed of global geometric model and similarity metric. The global geometric model is formed to construct connections between disjoint clusters in fault diagnosis. The similarity metric of the global geometric model is applied to filter feature subsets. To evaluate the performance of GGSS, fault data from wind turbine test rig is collected, and condition classification is carried out with classifiers established by Support Vector Machine (SVM) and General Regression Neural Network (GRNN). The classification results are compared with feature ranking methods and feature wrapper approaches. GGSS achieves higher classification accuracy than the feature ranking methods, and better time efficiency than the feature wrapper approaches. The hybrid scheme, GGSS with wrapper, obtains optimal classification accuracy and time efficiency. The proposed scheme can be applied in feature selection to get better accuracy and efficiency in condition classification of fault diagnosis.  相似文献   

15.
一种基于信息增益及遗传算法的特征选择算法   总被引:8,自引:0,他引:8  
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象,特征选择一方面可以提高分类精度和效率,另一方面可以找出富含信息的特征子集。针对此问题,本文提出一种综合了filter模型及wrapper模型的特征选择方法,首先基于特征之间的信息增益进行特征分组及筛选,然后针对经过筛选而精简的特征子集采用遗传算法进行随机搜索,并采用感知器模型的分类错误率作为评价指标。实验结果表明,该算法可有效地找出具有较好的线性可分离性的特征子集,从而实现降维并提高分类精度。  相似文献   

16.
网络故障诊断中大量无关或冗余的特征会降低诊断的精度,需要对初始特征进行选择。Wrapper模式特征选择方法分类算法计算量大,为了降低计算量,本文提出了基于支持向量的二进制粒子群(SVB-BPSO)的故障特征选择方法。该算法以SVM为分类器,首先通过对所有样本的SVM训练选出SV集,在封装的分类训练中仅使用SV集,然后采用异类支持向量之间的平均距离作为SVM的参数进行训练,最后根据分类结果,利用BPSO在特征空间中进行全局搜索选出最优特征集。在DARPA数据集上的实验表明本文提出的方法能够降低封装模式特征选择的计算量且获得了较高的分类精度以及较明显的降维效果。  相似文献   

17.
针对传统支持向量机在封装式特征选择中分类效果差、子集选取冗余、计算性能易受核函数参数影响的不足,利用元启发式优化算法对其进行同步优化.首先利用莱维飞行策略和模拟退火机制对秃鹰搜索算法的局部搜索能力与勘探利用解空间能力进行改进,通过标准函数的测试结果验证其改进的有效性;其次将支持向量机核函数参数作为待优化目标,利用改进后...  相似文献   

18.
随着各类生物智能演化算法的日益成熟,基于演化技术及其混合算法的特征选择方法不断涌现。针对高维小样本安全数据的特征选择问题,将文化基因算法(Memetic Algorithm,MA)与最小二乘支持向量机(Least Squares Support Vector Machine,LS-SVM)进行结合,设计了一种封装式(Wrapper)特征选择方法(MA-LSSVM)。该方法利用最小二乘支持向量机易于求解的特点来构造分类器,以分类的准确率作为文化基因算法寻优过程中适应度函数的主要成分。实验表明,MA-LSSVM可以较高效地、稳定地获取对分类贡献较大的特征,降低了数据维度,提高了分类效率。  相似文献   

19.
Cropland classification using optical and full polarimetric synthetic aperture radar (PolSAR) images is a topic of considerable interest in the remote-sensing community. These two data sources can provide a diverse set of temporal, spectral, textural and polarimetric features which can be invaluable for cropland classification. However, some optical features or some radar features may have a relatively high correlation with other features. Hence, it seems to be necessary to choose the optimum features in order to reduce the dimensions of the data and to improve cropland classification accuracy. This article proposes a strategic feature selection method from a feature set of bitemporal RapidEye and Uninhabited Aerial Vehicle synthetic aperture radar (UAVSAR) images. The proposed method is designed to select the most relevant features and to remove redundant features based on the two concepts of separability and dependency. The proposed method is therefore referred to as maximum separability and minimum dependency (MSMD). For evaluating efficiency, MSMD and some well-known filter and wrapper feature selection methods are compared using a random forest classifier. Experimental tests confirmed that the classification results obtained from the MSMD feature selection method were more accurate than those achieved by filter methods. Moreover, they had an accuracy comparable to that of the results from the wrapper method. Furthermore, with regard to running time, MSMD operated as fast as the filter methods. It had a straightforward structure compared to the wrapper method, and as a result was faster than this method.  相似文献   

20.
Feature subset selection is a substantial problem in the field of data classification tasks. The purpose of feature subset selection is a mechanism to find efficient subset retrieved from original datasets to increase both efficiency and accuracy rate and reduce the costs of data classification. Working on high-dimensional datasets with a very large number of predictive attributes while the number of instances is presented in a low volume needs to be employed techniques to select an optimal feature subset. In this paper, a hybrid method is proposed for efficient subset selection in high-dimensional datasets. The proposed algorithm runs filter-wrapper algorithms in two phases. The symmetrical uncertainty (SU) criterion is exploited to weight features in filter phase for discriminating the classes. In wrapper phase, both FICA (fuzzy imperialist competitive algorithm) and IWSSr (Incremental Wrapper Subset Selection with replacement) in weighted feature space are executed to find relevant attributes. The new scheme is successfully applied on 10 standard high-dimensional datasets, especially within the field of biosciences and medicine, where the number of features compared to the number of samples is large, inducing a severe curse of dimensionality problem. The comparison between the results of our method and other algorithms confirms that our method has the most accuracy rate and it is also able to achieve to the efficient compact subset.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号