首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 79 毫秒
1.
在高维小样本数据的特征选择中,样本的变化会导致最终选出的特征呈现不稳定的特点。针对这种情况,提出了一种新的特征选择算法。首先通过计算特征间的互信息以确定特征关联性的强弱,依据将特征间的关联性强弱将特征分为不同的组,待分组完成后,使用粒子群算法对特征进行选择,并对少部分粒子进行随机扰动,避免粒子陷入局部最优。选择完成后的特征进行集成,得到最终特征子集。结合5个公开数据集进行实验,该算法的特征维度平均降低77.5%。与现有的方法比较,得到的结果在稳定性方面平均提高了4.0%。  相似文献   

2.
基于量子遗传算法的特征选择算法   总被引:6,自引:1,他引:6  
特征选择是模式识别和机器学习等领域中重要而困难的研究课题.提出一种最优特征子集评价准则和实现特征选择的一种新量子遗传算法(NQGA).NQGA采用量子门旋转角更新新方法和增强算法寻优能力及防止早熟收敛的移民和灾变策略.定性分析了NQGA的高效性.典型复杂函数测试和雷达辐射源信号特征选择的应用表明,NQGA寻优能力强、收敛速度快和能有效防止早熟现象.采用提出的准则函数和搜索策略实现特征选择,大大降低了特征维数,获得了更高的正确识别率.  相似文献   

3.
基于遗传算法的入侵检测特征选择   总被引:1,自引:0,他引:1  
本文提出了一种基于遗传算法的入侵检测特征子集选择方法,只选择最具分类信息的特征构建入侵检测模型。在该方法中,根据入侵检测的特点,将特征选择问题作为优化问题来考虑,充分利用遗传算法的全局搜索及并行处理能力,生成最优解集。同时,为了降低误报率,结合指纹识别技术,优化子集中包括四个包头标志符,作为最终的入侵检测特征集合,并通过试验数据表明这一算法的有效性。  相似文献   

4.
基于遗传算法的蛋白质质谱数据特征选择   总被引:2,自引:1,他引:1       下载免费PDF全文
李义峰  刘毅慧 《计算机工程》2009,35(19):192-194
针对蛋白质质谱数据在降维、分类及生物标记物识别过程中存在的问题,提出一种基于遗传算法的特征选择方法,介绍几种常用的相关策略,包括基于排列和精英保留的随机通用采样选择策略和基于自适应变肄率的均匀变异策略,给出2个适应度函数——封装器函数与多变元筛选器函数,将它们引入遗传算法中,并进行性能测试与比较。实验结果表明,基于封装器的遗传算法性能优于其他特征选择算法,而基于多变元筛选器的遗传算法性能优于单变元筛选器算法。  相似文献   

5.
基于遗传算法的特征子集选择   总被引:15,自引:0,他引:15  
数据挖掘对象是大型数据库中的海量数据,而数据库中记录包含众多属性,由于其中存在的冗余和不相关属性降低了数据挖掘性能,增加了算法复杂性,因此,特征子集选择问题成为数据挖掘领域中的重要研究课题。该文根据过滤法思想,提出了基于遗传算法的特征子集选择算法,实验证明该算法获得了良好的收效性和稳定性。  相似文献   

6.
基于遗传算法的图像特征选择   总被引:2,自引:0,他引:2  
针对模式识别时,提取的特征参数量大而又有冗余的现象,提出了基于遗传算法的特征选择方法。介绍了遗传算法的基本原理,阐述并设计了适应度函数和遗传算子。仿真实验表明,该方法在求解的效率和解的质量方面都达到了令人满意的效果。  相似文献   

7.
在分析遥感红外图像特点的基础上,提取了灰度共生矩阵的能量、惯性、熵等14个特征量用于红外图像纹理分析.以最小判别熵可分性判据作为准则,利用遗传算法搜索最优特征子集,实现了遥感红外图像的特征选择.为了验证此算法特征选择的有效性,设计了RBF网络分类器,对遥感红外图像进行分类识别,其结果证明,基于最小熵和遗传算法所得到的特征子集可以简化网络结构,减少训练时间,提高样本的识别概率.  相似文献   

8.
9.
基于相关性分析及遗传算法的高维数据特征选择   总被引:4,自引:0,他引:4  
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象,特征选择一方面可以提高分类精度和效率,另一方面可以找出富含信息的特征子集。针对此问题,提出了一种综合了filter模型及wrapper模型的特征选择方法,首先基于特征与类别标签的相关性分析进行特征筛选,只保留与类别标签具有较强相关性的特征,然后针对经过筛选而精简的特征子集采用遗传算法进行随机搜索,并采用感知器模型的分类错误率作为评价指标。实验结果表明,该算法可有效地找出具有较好的线性可分离性的特征子集,从而实现降维并提高分类精度。  相似文献   

10.
数据挖掘中如何有效地从高维特征空间选择最优特征子集,很大程度上影响模型的预测结果,基于此本文提出一种复合适应性函数、多特征组合搜索的自适应性遗传算法。算法依据统计学原理对原始特征先行过滤构建特征候选集,使用多模型融合的交叉验证结果作为适应性函数以提高每轮进化的适应值,轮盘赌算法、定长基因段交叉算法、随机基因位点变异算法分别构成选择算子、交叉算子和变异算子。通过实验对比表明该遗传算法具有一定的稳定性和有效性,能够在原始特征空间中启发性的选择最优特征子集,从而提高数值型预测准确率。  相似文献   

11.
提出了一种基于改进遗传算法的特征选择算法。该算法以支持向量机分类器的识别率作为特征选择的可分性判据,对传统遗传算法的交叉和选择操作进行了改进,实现了指定数目的特征选择。而且算法在特征选择的过程中,还同时优化了支持向量机分类器的两个参数。实验数据的特征选择实验表明,提出的算法仅以损失2.7%识别率的代价,得到的特征维数却是传统遗传算法的1/5,极大地简化了分类器设计的复杂度。  相似文献   

12.
基于互信息和遗传算法的两阶段特征选择方法   总被引:2,自引:0,他引:2  
为了在特征选择过程中得到较优的特征子集,结合标准化互信息和遗传算法提出了一种新的两阶段特征选择方法。该方法首先采用标准化的互信息对特征进行排序,然后用排序在前的特征初始化第二阶段遗传算法的部分种群,使得遗传算法的初始种群中含有较好的搜索起点,从而遗传算法只需较少的进化代数就可搜寻到较优的特征子集。实验显示,所提出的特征选择方法在特征约简和分类等方面具有较好的效果。  相似文献   

13.
提出了一种基于遗传算法的大数据特征选择算法。该算法首先对各维度的特征进行评估,根据每个特征在同类最近邻和异类最近邻上的差异度调整其权重,基于特征权重引导遗传算法的搜索,以提升算法的搜索能力和获取特征的准确性;然后结合特征权重计算特征的适应度,以适应度作为评价指标,启动遗传算法获取最优的特征子集,并最终实现高效准确的大数据特征选择。通过实验分析发现,该算法能够有效减小分类特征数,并提升特征分类准确率。  相似文献   

14.
由于冷轧带钢表面缺陷的类型多种多样,在所提取的特征集中,需要寻找出一组较优的特征集,使之可以更有效地表达缺陷的本质特征,从而提高缺陷识别的准确率。针对该问题,研究了遗传算法在缺陷特征选择中的应用,并在充分研究信息熵理论的基础上,以平均净分类信息为遗传算法的适应度函数,以弥补互信息熵作为适应度函数所导致的不足。实验表明,利用遗传算法得到的特征集,对现场的冷轧带钢表面缺陷进行分类时,能得到更高的分类准确率。  相似文献   

15.
张平  党选举  陈皓  杨文雷 《传感器与微系统》2011,30(11):135-137,141
针对目前相似重复记录检测方法不能有效处理大数据量的问题,提出一种基于熵的特征优选分组聚类的算法.该方法通过构造一个基于对象间相似度的熵度量,对原始数据集中各属性进行重要性评估,筛选出关键属性集,并依据关键属性将数据划分为不相交的小数据集,在各小数据集中用DBSCAN聚类算法进行相似重复记录的检测.理论分析和实验结果表明...  相似文献   

16.
基于模式聚类和遗传算法的文本特征提取方法   总被引:2,自引:1,他引:1  
郝占刚  王正欧 《计算机应用》2005,25(7):1632-1633
采用模式聚类和遗传算法进行文本特征提取,并用Kohonen网络进行分类。模式聚类可以有效降低文本特征的维数,使得特征从几千维降为几百维。但几百维的维数对Kohonen网络来说仍然太高,因此采用遗传算法在此基础上继续降维。实验结果表明,这两种方法结合可以极大地降低文本的维数,并能提高分类准确率。  相似文献   

17.
针对简单遗传算法用于特征选择精度不高、过早收敛的问题,提出了一种新的遗传算法——链式智能体遗传算法(LAGA),并与多准则(MC)相结合,从而提出了基于多准则竞争策略的链式智能体遗传算法(LAGA MC)用于特征选择。LAGA引入了链式智能体结构,智能体相互进行竞争选择和自适应交叉,自身进行自适应变异,从而使得该算法能够获得更精确的搜索结果;MC通过对基于单准则进行选择得到的特征子集进行特征位判断,从而确定出最终特征子集,以达到更全面的评价选择结果,获得识别率更稳定的特征子集。实验结果表明,LAGA搜索精度更高,LAGA MC获得的特征子集分类准确率更高、更稳定。  相似文献   

18.
李进超  陈静怡  吴杰  梁瑾 《计算机工程与设计》2012,33(5):2053-2056,2072
为了提高云计算的资源利用率以及减少能耗,采用改进的分组遗传算法来解决虚拟机放置的效率.通过对遗传算法的交配和突变等过程进行重新设计,提高遗传算法过程中优秀基因遗传给后代的几率,并提出了相应的算法,达到快速求解虚拟机放置问题的目的.实验结果表明,该算法可以快速采用最少的物理机来放置虚拟机,有效地提高了虚拟机放置问题的求解速度.  相似文献   

19.
特征选择方法综述   总被引:13,自引:0,他引:13  
特征选择是模式识别的关键问题之一,特征选择结果的好坏直接影响着分类器的分类精度和泛化性能.首先分析了特征选择方法的框架;然后从搜索策略和评价准则两个角度对特征选择方法进行了分析和总结;最后分析了对特征选择的影响因素,并指出了实际应用中需要解决的问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号