首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
针对尿沉渣红白细胞的特征选择问题,提出结合双向法的改进遗传算法,利用特征位逐步锁定法,结合小生境技术和自适应交叉变异算子共同缩小遗传算法的搜索空间。为了提高特征集的优选效果和稳定性,引入“多票投选”机制进行综合判断输出所求的最佳特征子集。实验结果表明,该算法优选的特征集与未进行特征选择和经过简单遗传算法(SGA)特征选择得到的特征集相比,识别率较高、特征数较少,反向传播神经网络(BPNN)分类器的维数复杂度明显减少。  相似文献   

2.
基于遗传算法的入侵检测特征选择*   总被引:1,自引:0,他引:1  
针对入侵检测日志数据存在大量不相关特征和冗余特征,导致入侵检测数据集维数较高,检测算法实时性较低的问题,提出一种基于遗传算法的入侵检测特征选择算法。首先删除入侵检测数据集中的不相关特征及冗余特征,构建有效特征集L,并通过偏F检验对特征进一步选择,构成待优化特征集L’;然后采用遗传算法对L’进行优化选择,选出最能反映系统状态的特征集L″。仿真实验结果证明,该算法在保证特征分类精度和确保入侵检测漏检率、误检率尽量小的前提下明显提高了入侵检测的效率。  相似文献   

3.
相比于基于像素的建筑物提取方法,面向对象方法能减少“异物同谱”和“同物异谱”现象,提高提取精度;针对遥感影像特征繁多,造成特征维数灾难的问题,本文提出了一种面向对象的特征优化方法进行建筑物提取.首先将最小误差自动阈值分割方法和多尺度分割相结合,优化分割技术;然后基于Relief算法和fast correlation-based filter (FCBF)算法进行特征选择,构建最优特征子集;最后使用随机森林方法进行建筑物提取并用最小外接矩形方法优化建筑物边界.结果显示,特征重要性差异较大,基于最优特征子集建筑物提取的总体精度达到0.93, Kappa系数为0.91,明显高于原始特征集和优化特征集提取结果.  相似文献   

4.
针对人为提取的冗余特征集和无关特征集导致可穿戴传感器的人体活动识别分类性能降低的问题,提出一种基于启发式集成特征选择的人体活动识别方法。该方法首先选取了包含功率谱密度(Power spectrum density, PSD)的特征集用于识别易混淆的活动,在此基础上借助皮尔逊系数法(Pearson correlation coefficient, PCC)筛选出低相关的特征子集,然后使用改进的正余弦优化算法(Sine cosine algorithm, SCA)进行特征优化,通过两次特征筛选得到最优特征子集。实验结果表明,在实验室采集的数据集中使用该方法后的特征子集维数为34,识别准确率达到了98.21%。在公开的SCUT-NAA数据集中进行对比实验,特征子集维数为39,低于以往基于该数据集研究方法的特征维数,并且识别准确率达到了96.51%。  相似文献   

5.
医学图像分割过程中,存在图像特征空间维数过高、需处理的数据量太大等问题。为此,利用粗糙集理论中知识约简的思想,对图像高维特征空间进行降维。文中先对图像特征数据离散化,再将粗糙集中基于不可分辨关系的属性约简方法和基于逻辑运算的推理方法相结合,对图像特征集进行约减,最后用模糊C-均值算法进行聚类分割。实验表明,该方法能够找出有效特征集,使图像特征空间的维数减少1半多,分割速度提高了2倍多。  相似文献   

6.
基于类信息的文本特征选择与加权算法研究   总被引:3,自引:1,他引:2  
文本自动分类中特征选择和加权的目的是为了降低文本特征空间维数、去除噪音和提高分类精度。传统的特征选择方案筛选出的特征往往偏爱类分布不均匀文档集中的大类,而常用的TF·IDF特征加权方案仅考虑了特征与文档的关系,缺乏对特征与类别关系的考虑。针对上述问题,提出了基于类别信息的特征选择与加权方法,在两个不同的语料集上进行比较和分析实验,结果显示基于类别信息的特征选择与加权方法比传统方法在处理类分布不均匀的文档集时能有效提高分类精度,并且降维程度有所提高。  相似文献   

7.
《计算机工程》2017,(6):253-258
为提高语音人格的预测精度,结合随机森林模型,提出一种语音人格预测方法。选取用于语音人格预测的候选韵律特征集,通过Bootstrap方式对语音韵律特征集进行抽样,根据基尼系数为每个决策树节点选择最优韵律特征集,最终构造各维人格特征对应的随机森林模型,实现语音人格预测。在公共语音人格预测数据集中的仿真实验结果表明,与其他语音人格预测方法相比,该方法具有更高的预测准确率。  相似文献   

8.
特征选择和分类器设计是网络入侵分类的关键,为了提高网络入侵分类率,针对特征选择问题,提出一种蚁群算法优化SVM选择和加权特征的网络入侵分类方法.首先利用支持向量机的分类精度和特征子集维数加权构造了综合适应度指标,然后利用蚁群算法的全局寻优和多次优解搜索能力实现特征子集搜索;然后选择网络数据的关键特征,计算信息增益获得各个特征权重,并根据特征权重构建加权支持向量机的网络入侵分类器;最后设计了局部细化搜索方式,使得特征选择结果不含冗余特征的同时提高了算法的收敛性,并通过KDD1999数据集验证了算法有效性.结果表明,ACO-SVM有效降低了特征维数,提高了网络入侵检测正确率和检测速度.  相似文献   

9.
由于质谱数据的维数较高,处理时运算量也特别大,同时还降低分类精度.研究者提出一些降维方法,产生了较好的效果.一般降维方法分两类:特征提取和特征选择.两类方法各有优劣,本文提出对特征提取的主成分进行特征选择,提出了将几种特征提取方法与特征选择方法结合的框架,来对数据集进行维数约简.在三个质谱数据集上的实验结果证明新提出的框架对于质谱数据有好的效果,加入特征选择后,建模精度得到了提高.  相似文献   

10.
一种文本特征选择方法的研究   总被引:2,自引:2,他引:0  
在文本分类中,对高维的特征集进行降维是非常重要的,不但可以提高分类精度和效率,也可以找出富含信息的特征子集.而特征选择是有效降低特征向量维数的一种方法.目前常用的一些特征选择算法仅仅考虑了特征词与类别间的相关性,而忽略了特征词与特征词之间的相关性,从而存在特征冗余,影响了分类效果.为此,在分析了常用的一些特征选择算法之后,提出了一种基于mRMR模型的特征选择方法.实验表明,该特征选择方法有助于提高分类性能.  相似文献   

11.
Feature selection is an important method of data preprocessing in data mining. In this paper, a novel feature selection method based on multi-fractal dimension and harmony search algorithm is proposed. Multi-fractal dimension is adopted as the evaluation criterion of feature subset, which can determine the number of selected features. An improved harmony search algorithm is used as the search strategy to improve the efficiency of feature selection. The performance of the proposed method is compared with that of other feature selection algorithms on UCI data-sets. Besides, the proposed method is also used to predict the daily average concentration of PM2.5 in China. Experimental results show that the proposed method can obtain competitive results in terms of both prediction accuracy and the number of selected features.  相似文献   

12.
特征选择是模式识别系统的难点.针对高维数据对象,先运用改进粒子群优化(PSO)算法快速、有效地从特征样本中提取一组最优特征子集,然后采用最小二乘支持向量机(LSSVM)分类器对最优特征子集进行分类,验证特征选择的好坏.经大量实验验证,在保证分类正确率的前提下,该方法有效提高了特征选择效率.  相似文献   

13.
基于粒子群优化算法和相关性分析的特征子集选择   总被引:3,自引:0,他引:3  
特征选择是模式识别与数据挖掘等领域的重要问题之一.针对此问题,提出了基于离散粒子群和相关性分析的特征子集选择算法,算法中采用过滤模式的特征选择方法,通过分析网络入侵数据中所有特征之间的相关性,利用离散粒子群算法在所有特征的空间里优化搜索,自动选择有效的特征子集以降低数据维度.1999 KDD Cup Data中IDS数据集的实验结果表明了提出算法的有效性.  相似文献   

14.
Dimensionality reduction is an important and challenging task in machine learning and data mining. Feature selection and feature extraction are two commonly used techniques for decreasing dimensionality of the data and increasing efficiency of learning algorithms. Specifically, feature selection realized in the absence of class labels, namely unsupervised feature selection, is challenging and interesting. In this paper, we propose a new unsupervised feature selection criterion developed from the viewpoint of subspace learning, which is treated as a matrix factorization problem. The advantages of this work are four-fold. First, dwelling on the technique of matrix factorization, a unified framework is established for feature selection, feature extraction and clustering. Second, an iterative update algorithm is provided via matrix factorization, which is an efficient technique to deal with high-dimensional data. Third, an effective method for feature selection with numeric data is put forward, instead of drawing support from the discretization process. Fourth, this new criterion provides a sound foundation for embedding kernel tricks into feature selection. With this regard, an algorithm based on kernel methods is also proposed. The algorithms are compared with four state-of-the-art feature selection methods using six publicly available datasets. Experimental results demonstrate that in terms of clustering results, the proposed two algorithms come with better performance than the others for almost all datasets we experimented with here.  相似文献   

15.
属性选择通常作为一个主要的预处理步骤,在机器学习和数据挖掘领域有着广泛的应用。选择出能够表征数据集分形特征的属性子集,对研究数据集的分形规律具有重要的价值。根据数据集的分形特征,引入了密度分析方法,指出了当前基于分形维数的属性选择方法的不足,提出了一种基于分形和邻接空间密度变化的属性选择方法。为了分析实验结果的有效性,利用SVM分类算法和K-fold交叉验证相结合的方法对3个数据集属性选择前后的分类性能进行了测试。实验证明该方法在属性选择方面有较好的性能,能够得到较优的属性子集。  相似文献   

16.
特征选择是处理高维大数据常用的降维手段,但其中牵涉到的多个彼此冲突的特征子集评价目标难以平衡。为综合考虑特征选择中多种子集评价方式间的折中,优化子集性能,提出一种基于子集评价多目标优化的特征选择框架,并重点对多目标粒子群优化(MOPSO)在特征子集评价中的应用进行了研究。该框架分别根据子集的稀疏度、分类能力和信息损失度设计多目标优化函数,继而基于多目标优化算法进行特征权值向量寻优,并通过权值向量Pareto解集膝点选取确定最优向量,最终实现基于权值向量排序的特征选择。设计实验对比了基于多目标粒子群优化算法的特征选择(FS_MOPSO)与四种经典方法的性能,多个数据集上的结果表明,FS_MOPSO在低维空间表现出更高的分类精度,并保证了更少的信息损失。  相似文献   

17.
一种基于信息增益与费用评价函数的特征选择准则   总被引:5,自引:0,他引:5  
特征选择问题是机器学习和模式识别中的一个重要问题,然而,在实际应用中,由于没有将特征选择与特征提取过程统一考虑,只注重特征本身的分类性能,没有考虑特征提取的费用问题,导致识别系统的效率较低,文中从实际应用角度,提出一种新的特征选择准则,将分类性能与特征的提取费用统一考虑,利用信息增益与特征提取费用综合评价函数作为特征选择准则,并给出了启发式算法ECFS〈将算法应用于实际领域的学习问题并与决策树算  相似文献   

18.
一种基于Fisher鉴别极小准则的特征提取方法   总被引:3,自引:0,他引:3  
特征提取是模式识别研究领域的一个热点.为了更好地解决人脸识别中的特征提取问题,定义了一种新的基于Fisher鉴别极小准则的特征提取方法,并且提出了类间散布矩阵零空间的概念,解决了先前Fisher线性变换方法中的最终特征维数受类别数的限制.在人脸数据库上的实验结果验证了该算法的有效性.  相似文献   

19.
Feature set partitioning generalizes the task of feature selection by partitioning the feature set into subsets of features that are collectively useful, rather than by finding a single useful subset of features. This paper presents a novel feature set partitioning approach that is based on a genetic algorithm. As part of this new approach a new encoding schema is also proposed and its properties are discussed. We examine the effectiveness of using a Vapnik–Chervonenkis dimension bound for evaluating the fitness function of multiple, oblivious tree classifiers. The new algorithm was tested on various datasets and the results indicate the superiority of the proposed algorithm to other methods.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号