共查询到19条相似文献,搜索用时 79 毫秒
1.
在高维小样本数据的特征选择中,样本的变化会导致最终选出的特征呈现不稳定的特点。针对这种情况,提出了一种新的特征选择算法。首先通过计算特征间的互信息以确定特征关联性的强弱,依据将特征间的关联性强弱将特征分为不同的组,待分组完成后,使用粒子群算法对特征进行选择,并对少部分粒子进行随机扰动,避免粒子陷入局部最优。选择完成后的特征进行集成,得到最终特征子集。结合5个公开数据集进行实验,该算法的特征维度平均降低77.5%。与现有的方法比较,得到的结果在稳定性方面平均提高了4.0%。 相似文献
2.
3.
基于遗传算法的入侵检测特征选择 总被引:1,自引:0,他引:1
本文提出了一种基于遗传算法的入侵检测特征子集选择方法,只选择最具分类信息的特征构建入侵检测模型。在该方法中,根据入侵检测的特点,将特征选择问题作为优化问题来考虑,充分利用遗传算法的全局搜索及并行处理能力,生成最优解集。同时,为了降低误报率,结合指纹识别技术,优化子集中包括四个包头标志符,作为最终的入侵检测特征集合,并通过试验数据表明这一算法的有效性。 相似文献
4.
5.
6.
基于遗传算法的图像特征选择 总被引:2,自引:0,他引:2
针对模式识别时,提取的特征参数量大而又有冗余的现象,提出了基于遗传算法的特征选择方法。介绍了遗传算法的基本原理,阐述并设计了适应度函数和遗传算子。仿真实验表明,该方法在求解的效率和解的质量方面都达到了令人满意的效果。 相似文献
7.
8.
9.
基于相关性分析及遗传算法的高维数据特征选择 总被引:4,自引:0,他引:4
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象,特征选择一方面可以提高分类精度和效率,另一方面可以找出富含信息的特征子集。针对此问题,提出了一种综合了filter模型及wrapper模型的特征选择方法,首先基于特征与类别标签的相关性分析进行特征筛选,只保留与类别标签具有较强相关性的特征,然后针对经过筛选而精简的特征子集采用遗传算法进行随机搜索,并采用感知器模型的分类错误率作为评价指标。实验结果表明,该算法可有效地找出具有较好的线性可分离性的特征子集,从而实现降维并提高分类精度。 相似文献
10.
11.
提出了一种基于改进遗传算法的特征选择算法。该算法以支持向量机分类器的识别率作为特征选择的可分性判据,对传统遗传算法的交叉和选择操作进行了改进,实现了指定数目的特征选择。而且算法在特征选择的过程中,还同时优化了支持向量机分类器的两个参数。实验数据的特征选择实验表明,提出的算法仅以损失2.7%识别率的代价,得到的特征维数却是传统遗传算法的1/5,极大地简化了分类器设计的复杂度。 相似文献
12.
13.
提出了一种基于遗传算法的大数据特征选择算法。该算法首先对各维度的特征进行评估,根据每个特征在同类最近邻和异类最近邻上的差异度调整其权重,基于特征权重引导遗传算法的搜索,以提升算法的搜索能力和获取特征的准确性;然后结合特征权重计算特征的适应度,以适应度作为评价指标,启动遗传算法获取最优的特征子集,并最终实现高效准确的大数据特征选择。通过实验分析发现,该算法能够有效减小分类特征数,并提升特征分类准确率。 相似文献
14.
由于冷轧带钢表面缺陷的类型多种多样,在所提取的特征集中,需要寻找出一组较优的特征集,使之可以更有效地表达缺陷的本质特征,从而提高缺陷识别的准确率。针对该问题,研究了遗传算法在缺陷特征选择中的应用,并在充分研究信息熵理论的基础上,以平均净分类信息为遗传算法的适应度函数,以弥补互信息熵作为适应度函数所导致的不足。实验表明,利用遗传算法得到的特征集,对现场的冷轧带钢表面缺陷进行分类时,能得到更高的分类准确率。 相似文献
15.
16.
基于模式聚类和遗传算法的文本特征提取方法 总被引:2,自引:1,他引:1
采用模式聚类和遗传算法进行文本特征提取,并用Kohonen网络进行分类。模式聚类可以有效降低文本特征的维数,使得特征从几千维降为几百维。但几百维的维数对Kohonen网络来说仍然太高,因此采用遗传算法在此基础上继续降维。实验结果表明,这两种方法结合可以极大地降低文本的维数,并能提高分类准确率。 相似文献
17.
针对简单遗传算法用于特征选择精度不高、过早收敛的问题,提出了一种新的遗传算法——链式智能体遗传算法(LAGA),并与多准则(MC)相结合,从而提出了基于多准则竞争策略的链式智能体遗传算法(LAGA MC)用于特征选择。LAGA引入了链式智能体结构,智能体相互进行竞争选择和自适应交叉,自身进行自适应变异,从而使得该算法能够获得更精确的搜索结果;MC通过对基于单准则进行选择得到的特征子集进行特征位判断,从而确定出最终特征子集,以达到更全面的评价选择结果,获得识别率更稳定的特征子集。实验结果表明,LAGA搜索精度更高,LAGA MC获得的特征子集分类准确率更高、更稳定。 相似文献
18.
为了提高云计算的资源利用率以及减少能耗,采用改进的分组遗传算法来解决虚拟机放置的效率.通过对遗传算法的交配和突变等过程进行重新设计,提高遗传算法过程中优秀基因遗传给后代的几率,并提出了相应的算法,达到快速求解虚拟机放置问题的目的.实验结果表明,该算法可以快速采用最少的物理机来放置虚拟机,有效地提高了虚拟机放置问题的求解速度. 相似文献