首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
数据库通常包含很多冗余特征,找出重要特征叫做特征提取。本文提出一种基于属性重要度的启发式特征选取算法。该算法以属性重要度为迭代准则得到属性集合的最小约简。  相似文献   

2.
森林优化算法是一种基于森林中树木播种思想的演化算法,其具有良好的特征空间搜索能力,且实现难度低。但该算法在森林整体的收敛速度和寻优能力上仍存在提升空间,而且对高维数据集的适应度较差。本文针对上述问题提出了基于重复度分析的森林优化特征选择算法(feature selection using forest optimization algorithm based on duplication analysis, DAFSFOA)。该算法提出了基于信息增益的自适应初始化策略、森林重复度分析机制、森林重启机制、候选最优树生成策略、综合考虑特征选择数量和分类正确率的适应度函数。实验结果表明,DAFSFOA在大部分数据集上达到了最高的分类准确率。同时,对于高维数据集SRBCT,在维度缩减率和分类准确率方面,DAFSFOA对比森林优化特征选择算法(feature selection using forest optimization algorithm, FSFOA)都有较大提升。DAFSFOA 比FSFOA具有更强的特征空间探索能力,而且能够适应不同维度的数据集。  相似文献   

3.
特征选择是模式识别系统的分类器设计之前一个重要而困难的一个课题。在目前现有的方法中,基于决策界的特征选择是其中一类方法。文中将覆盖算法应用于特征提取,提出了基于覆盖算法决策界的特征选择算法(Feature SelectionAlgorithm based on the Decision Boundary of Covering Algorithm,简称FSACA法),然后将该算法应用于一个字符识别的实例并与其他算法比较。实验结果证明了FSACA法的可行性和有效性。  相似文献   

4.
特征选择是模式识别系统的分类器设计之前一个重要而困难的一个课题。在目前现有的方法中,基于决策界的特征选择是其中一类方法。文中将覆盖算法应用于特征提取,提出了基于覆盖算法决策界的特征选择算法(Feature Selection Algorithm based on the Derision Boundary of Covering Algorithm,简称FSACA法),然后将该算法应用于一个字符识别的实例并与其他算法比较。实验结果证明了FSACA法的可行性和有效性。  相似文献   

5.
在高维小样本数据的特征选择中,样本的变化会导致最终选出的特征呈现不稳定的特点。针对这种情况,提出了一种新的特征选择算法。首先通过计算特征间的互信息以确定特征关联性的强弱,依据将特征间的关联性强弱将特征分为不同的组,待分组完成后,使用粒子群算法对特征进行选择,并对少部分粒子进行随机扰动,避免粒子陷入局部最优。选择完成后的特征进行集成,得到最终特征子集。结合5个公开数据集进行实验,该算法的特征维度平均降低77.5%。与现有的方法比较,得到的结果在稳定性方面平均提高了4.0%。  相似文献   

6.
特征选择是高维数据降维的一种关键技术。传统数据降维技术如PCA,只是转化数据的表达形式,不能表达数据的相关程度。近年来提出信息度量方法,使用评价函数表示数据的不确定性程度,虽然能较好地体现数据之间的相关程度,但并没有充分考虑选取的特征对整个样本空间的影响。针对传统方法的不足,提出一种基于贝叶斯和谐度特征选择算法。贝叶斯和谐度来自贝叶斯阴阳和谐学习理论,可以估计整个数据空间的联合概率分布,选取的特征能够较好地反应整个样本空间的变化。根据和谐度的变化来度量类之间的相似度从而得到冗余度较低的特征组合。与传统方法如ReliefF、FCBF等比较后发现,在取同样特征个数的情况下,和谐度度量得到的特征组合对数据分类更有效。  相似文献   

7.
8.
基于特征关联性的特征选择算法研究   总被引:5,自引:0,他引:5  
从特征与特征、特征与类的关联性出发,说明了非搜索性特征选择的原理及相关算法。  相似文献   

9.
森林优化特征选择算法(FSFOA)表现出色,但初始化方法的盲目性以及更新机制的局限性限制了该算法的性能。对FSFOA不足之处加以改进,提出自适应森林优化特征选择算法(AFSFOA)。在初始化过程中,加入特征权重评估算法;在更新机制上,使用自适应参数选择策略以及贪心搜索策略替代原始的更新机制。在不同维度的数据集上进行实验,对比实验结果表明,与FSFOA算法以及近年来提出的较高效的特征选择算法进行对比,在准确率以及维度约简上,AFSFOA算法有很强的竞争力。  相似文献   

10.
11.
基于量子遗传算法的特征选择算法   总被引:6,自引:1,他引:6  
特征选择是模式识别和机器学习等领域中重要而困难的研究课题.提出一种最优特征子集评价准则和实现特征选择的一种新量子遗传算法(NQGA).NQGA采用量子门旋转角更新新方法和增强算法寻优能力及防止早熟收敛的移民和灾变策略.定性分析了NQGA的高效性.典型复杂函数测试和雷达辐射源信号特征选择的应用表明,NQGA寻优能力强、收敛速度快和能有效防止早熟现象.采用提出的准则函数和搜索策略实现特征选择,大大降低了特征维数,获得了更高的正确识别率.  相似文献   

12.
谢琪  徐旭  程耕国  陈和平 《计算机应用》2020,40(5):1266-1271
针对传统的基于森林优化算法的特征选择算法在初始化阶段、候选森林生成阶段和更新阶段存在的问题,提出了一种新的基于森林优化算法的特征选择算法。该算法在初始化阶段采用皮尔森相关系数和L1正则化方法代替随机初始化策略;在候选森林生成阶段,采用优劣树分开和差额补足的方法解决优劣树不完备问题;在更新阶段,将与最优树精度相同但维度不同的树木添加到森林中。在实验中,所提算法采用与传统的基于森林优化算法的特征选择算法相同的实验数据和实验参数,分别测试了小维度、中维度和大维度数据。实验结果表明,在2个大维度数据和2个中维度数据上,所提算法的分类精度和维度缩减能力均高于传统的基于森林优化算法的特征选择算法。实验结果验证了所提算法在处理特征选择问题的有效性。  相似文献   

13.
在文本分类系统中,特征的优劣往往极大地影响着分类器的设计和性能。提出一种利用分形维数和带精英策略的非劣支配排序遗传算法进行特征选择的方法。在该方法中分形维数作为特征选择的一个评价机制,利用NSGA-II算法将特征子集选择问题视为多目标优化问题来处理。为了分析结果的有效性,利用SVM分类算法对复旦大学语料库进行测试。实验结果表明该方法具有较好的性能,它可以有效去除无效特征并提高分类准确性。  相似文献   

14.
基于PSO的LS-SVM特征选择与参数优化算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对最小二乘支持向量机特征选择及参数优化问题,提出了一种基于PSO的LS-SVM特征选择与参数同步优化算法。首先产生若干种群(特征子集),然后用PSO算法对特征及参数进行优化。在UCI标准数据集上进行的仿真实验表明,该算法可有效地找出合适的特征子集及LS-SVM参数,且与基于遗传算法的最小二乘支持向量机算法(GALS-SVM)和传统的LS-SVM算法相比具有较好的分类效果。  相似文献   

15.
针对飞参数据中存在的大量冗余和不相关,提出了一种基于神经网络的飞参数据特征选择方法.为克服传统算法收敛速度慢、易陷入局部极小等缺陷,神经网络的训练采用粒子群优化算法和Levenberg-Marquardt优化算法相结合的方式.神经网络训练结束后,先利用网络权值信息对飞参数据特征的相对重要度进行排序,然后根据重要度次序对飞参数据特征进行选择.实验结果表明该方法能快速有效地删除冗余飞参数据特征,同时提高网络的泛化能力.  相似文献   

16.
特征选择在许多领域具有重要作用,提出一种基于混合自适应引力搜索算法的特征选择方法,在最大化分类精度的同时从数据样本中选出最小特征子集。算法设计两种解更新策略进行组合式搜索,引入群体约简方法,有效地平衡算法的全局搜索和局部收敛能力,同时提出自适应调控参数,减少参数设置对算法性能的影响。在七组真实数据集中的实验结果表明,从分类精度、特征子集大小和运行时间三方面比较,提出的方法优于原始算法和已有相近算法,具有良好的综合性能,是一种有效的特征选择方法。  相似文献   

17.
基于遗传算法的入侵检测特征选择*   总被引:1,自引:0,他引:1  
针对入侵检测日志数据存在大量不相关特征和冗余特征,导致入侵检测数据集维数较高,检测算法实时性较低的问题,提出一种基于遗传算法的入侵检测特征选择算法。首先删除入侵检测数据集中的不相关特征及冗余特征,构建有效特征集L,并通过偏F检验对特征进一步选择,构成待优化特征集L’;然后采用遗传算法对L’进行优化选择,选出最能反映系统状态的特征集L″。仿真实验结果证明,该算法在保证特征分类精度和确保入侵检测漏检率、误检率尽量小的前提下明显提高了入侵检测的效率。  相似文献   

18.
基于多目标进化算法的入侵检测特征选择   总被引:2,自引:0,他引:2       下载免费PDF全文
针对入侵检测系统要求检测率和误报率均衡优化,提出一种由顺序搜索策略改进的多目标进化算法,对特征空间进行压缩,以选择最优特征子集。实验结果表明,改进的多目标进化算法实现了检测率与误报率的均衡优化,较好地提高了入侵检测系统的性能。  相似文献   

19.
李伟湋  贾修一 《计算机应用》2010,30(6):1530-1532
针对数据挖掘中的特征选择问题,依据Hellinger距离的特性,研究了两种Hellinger距离的定义方式,提出了基于Hellinger距离的特征选择方法,设计了两种相应的算法。不同数据集上的实验结果表明了新算法选择的特征的有效性。与其他特征选择算法的对比可发现:这两种算法选择的特征个数少且对C4.5分类精度较好。  相似文献   

20.
神经网络分类器已被广泛应用在自动模式识别中。降低输入数据特征维数对其结构的简化和性能的提高至关重要。简单遗传算法早熟收敛和局部搜索能力弱的缺陷,使它在特征选择中的效果不理想。提出基于进化群体中值信息的动态自适应遗传算法。仿真结果表明,该算法优选特征子集速度快,解的质量稳定,神经网络分类器的识别准确率有显著提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号