共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
3.
一种基于信息增益及遗传算法的特征选择算法 总被引:8,自引:0,他引:8
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象,特征选择一方面可以提高分类精度和效率,另一方面可以找出富含信息的特征子集。针对此问题,本文提出一种综合了filter模型及wrapper模型的特征选择方法,首先基于特征之间的信息增益进行特征分组及筛选,然后针对经过筛选而精简的特征子集采用遗传算法进行随机搜索,并采用感知器模型的分类错误率作为评价指标。实验结果表明,该算法可有效地找出具有较好的线性可分离性的特征子集,从而实现降维并提高分类精度。 相似文献
4.
特征选择可以选出最有利于分类的特征,加快算法的运行速度,消除冗余,提高分类准确率.文中提出了一种基于遗传算法的特征选择方法.在遗传算法中结合支持向量机和分类权值的评价准则设计并实现了适合于该模型的适应度函数,并通过实验确定其参数.设计合理的罚函数.根据特征的数量给予一定的惩罚.针对移动企业客户恶意欠费行为,提出并建立基于支持向量机的消费欺诈预警模型.实验将此特征选择方法应用于消费欺诈预警模型中,结果验证了该方法的有效性,得到了满意的分类准确率. 相似文献
5.
提出了一种基于遗传算法的大数据特征选择算法。该算法首先对各维度的特征进行评估,根据每个特征在同类最近邻和异类最近邻上的差异度调整其权重,基于特征权重引导遗传算法的搜索,以提升算法的搜索能力和获取特征的准确性;然后结合特征权重计算特征的适应度,以适应度作为评价指标,启动遗传算法获取最优的特征子集,并最终实现高效准确的大数据特征选择。通过实验分析发现,该算法能够有效减小分类特征数,并提升特征分类准确率。 相似文献
6.
针对如何选定PCA特征空间维数的问题,提出了一种基于改进混沌遗传算法的特征选择方法.改进的混沌遗传算法采用两种不同规则的混沌映射,维持了种群的多样性,增强了算法的全局搜索能力.利用改进的混沌遗传算法对PCA变换后的特征向量进行选择,可以快速搜索到最有利于分类的特征子空间.仿真实验表明,该方法不但降低了特征空间的维数,而且获得了比采用其它方法更好的识别性能. 相似文献
7.
针对入侵检测前必须分析输入散据的特征以及检测中数据维数较高的问题,根据入侵检测的特点,将特征选择问题作为优化问题来考虑,采用量子遗传算法对特征进行选择,充分利用其并行处理及全局搜索能力,提高数据分类质量、降低问题规模、消除冗余属性、加快数据处理速度;在KDD CUP1999数据集上进行实验,结果表明与遗传算法以及粒子群算法相比,该方法可以更有效地精简特征,提高分类质量. 相似文献
8.
9.
基于遗传算法的入侵检测特征选择 总被引:1,自引:0,他引:1
本文提出了一种基于遗传算法的入侵检测特征子集选择方法,只选择最具分类信息的特征构建入侵检测模型。在该方法中,根据入侵检测的特点,将特征选择问题作为优化问题来考虑,充分利用遗传算法的全局搜索及并行处理能力,生成最优解集。同时,为了降低误报率,结合指纹识别技术,优化子集中包括四个包头标志符,作为最终的入侵检测特征集合,并通过试验数据表明这一算法的有效性。 相似文献
10.
11.
基于遗传算法的顾客购买行为特征提取 总被引:2,自引:0,他引:2
提出一种基于遗传算法的顾客行为特征提取算法。首先,采用Tanimoto 相似度来度量顾客间购买行为,并设计遗传聚类算法对顾客群体进行划分,把具有相似购买行为顾客聚集为一类。然后,针对不同顾客群体的购买行为特征,设计一种基于遗传算法的多种群特征提取方法,从各个子群体中发现顾客的购买行为的知识。为了增强种群内部协同进化能力和规则质量,我们采用最近邻替代遗传策略和局部搜索策略。使用实际零售数据集对整个算法进行验证,并与经典的Apriori算法进行比较。实验结果表明该算法在不需要产生频繁项集的情况下,可较高效生成精简规则集,在规则形式方面也更加灵活。最后,对实验结果进行详细分析。 相似文献
12.
13.
针对帝王蝶优化算法(MBO)全局搜索能力较弱、在迁移过程中容易出现种群多样性减少等问题,文中提出基于柯西变异的差分自适应MBO及其特征选择算法.首先,使用差分进化算法中的变异操作替换MBO的迁移算子,提升全局搜索能力.然后,将自适应调整策略融入MBO的调整算子,改变单一的调整方式.最后,对每次更新的种群进行柯西变异,增加种群多样性.为了验证改进帝王蝶优化算法及其特征选择方法的性能,通过基准函数和UCI数据集两部分实验对其进行测试,结果表明文中算法性能较优. 相似文献
14.
基于遗传算法的支撑向量机的特征选取 总被引:1,自引:0,他引:1
提出了一种支撑向量机(SVM)的特征提取方法,该方法使得所提取的特征向量能最小化SVM推广性的界,同时设计了一种有效的遗传算法来实现该方法。模拟数据和心电信号等识别问题的实验结果验证了该方法的有效性。 相似文献
15.
16.
17.
针对离散值数据集特征选择问题,提出基于相对分类信息熵的进化特征选择算法.使用遗传算法搜索最优特征子集,使用相对分类信息熵度量特征子集的重要性.以相对分类信息熵作为适应度函数,使用二进制编码问题的解,使用赌轮方法选择产生下一代个体.实验表明文中算法在测试精度上优于其它方法,此外还从理论上证明文中算法的可行性. 相似文献
18.
提出一种基于图像区域特征估计聚类数的快速FCM图像分割算法。在算法的预测分析阶段, 利用由共生矩阵统计值所构成的特征矢量描述图像中区域特征并结合多个聚类有效性判定函数实现准确的聚类数估计和隶属度矩阵值的初始化。在主聚类阶段,采用Gabor滤波器提取的颜色纹理隐式混合特征进行聚类,不但能获得更加合理的区域分割质量,同时也具有较好的抗噪声能力。实验表明改进算法有效克服基于像素点级特征的FCM图像分割算法在聚类数估计和隶属度矩阵初始化方面的不足,加快FCM主聚类阶段的迭代速度,执行效率更高。 相似文献