首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
在相关性快速过滤特征选择算法(FCBF)基础上,通过最大相关系数的方式改进FCBF算法.首先,通过最大相关系数和对称不确定性度量准则,计算出每个特征与标签之间的相关度量值,并按照数值大小顺序进行排序;其次,通过最大相关系数和近似马尔可夫毯原理进行无关特征和冗余特征的筛选,最终选择出最优特征子集.在加利福尼亚大学欧文分校的机器学习库(UCI)的8个公开数据集中进行对比实验结果表明基于最大相关系数的特征选择算法(NFCBF)总体优于FCBF算法,它所选择出特征数比FCBF算法所选择特征数平均少了3.625个,分类准确率平均提高了0.075%.与互信息最大算法(MIM)、最少的绝对收缩和选择算法(Lasso)和岭算法(Ridge)等相比也具有明显的优势.  相似文献   

2.
通过特征选择的方法解决皮肤检测过程中颜色空间的选取问题,针对现有基于互信息的特征选择方法的不足,提出了改进方法:1)使用互信息缩小特征选择范围,然后选择使分类效果最佳的特征子集;2)尝试多种可能的特征子集初始化方案,然后选择其中最优的方案.实验结果和对比分析表明,使用改进后的特征选择方法得到的混合颜色空间,其皮肤检测效果优于传统颜色空间和已有混合颜色空间.  相似文献   

3.
由于候选特征与类标签间的相关性,候选特征、已选特征与类标签间的交互性以及特征间的冗余性是特征选择算法应考虑的重要因素,而一些基于互信息和三维互信息的特征选择算法没有同时考虑相关性、交互性和冗余性信息,这影响了它们的性能。针对该问题,提出一种采用冗余性动态权重的特征选择算法,将对称不确定性和三路交互信息作为评价指标,采用一种动态更新特征权重的方法使目标函数在考虑相关性、交互性的基础上,同时考虑特征间的冗余性。在10种数据集上利用3种分类器与典型的基于互信息的特征选择算法做了对比实验,结果表明所提算法具有更好的特征选择性能。  相似文献   

4.
为了解决因软件缺陷数据存在数据不平衡问题限制了分类器的性能,将POSS(pareto optimization for subset selection)特征选择算法和随机欠采样技术引入到软件缺陷检测中,并利用支持向量机(support vector machine, SVM)构建预测模型。试验结果表明,通过多次随机欠采样可以有效地解决软件缺陷数据不平衡问题,同时使用POSS方法对目标子集进行双向优化,从而提高分类的准确率,其结果要优于Relief、Fisher、MI(mutual information)特征选择算法。  相似文献   

5.
In order to solve the poor performance in text classification when using traditional formula of mutual information (MI),a feature selection algorithm were proposed based on improved mutual information.The improved mutual information algorithm,which is on the basis of traditional improved mutual information methods that enhance the MI value of negative characteristics and feature’s frequency,supports the concept of concentration degree and dispersion degree.In accordance with the concept of concentration degree and dispersion degree,formulas which embody concentration degree and dispersion degree were constructed and the improved mutual information was implemented based on these.In this paper,the feature selection algorithm was applied based on improved mutual information to a text classifier based on Biomimetic Pattern Recognition and it was compared with several other feature selection methods.The experimental results showed that the improved mutual information feature selection method greatly enhances the performance compared with traditional mutual information feature selection methods and the performance is better than that of information gain.Through the introduction of the concept of concentration degree and dispersion degree,the improved mutual information feature selection method greatly improves the performance of text classification system.  相似文献   

6.
特征选择是生物信息领域中数据预处理阶段必不可少的步骤。传统特征选择算法忽视了特征之间的依赖相关性和冗余性,因此提出一种联合互信息的特征选择算法(JFRR)。该算法利用互信息计算特征之间的冗余值,并利用联合互信息分别计算已选特征集合、候选特征及类标签之间的相关性。将JFRR与其他6个特征选择算法在2个分类器上,使用9个不同基因数据集,进行分类准确率指标(Precision_micro和F1_micro)验证。实验结果表明,该算法能有效提高分类精度。  相似文献   

7.
针对传统单标签特征选择算法不能直接应用于多标签数据的问题,提出一种多标签特征选择算法——MML-RF算法.在ReliefF的基础上,MML-RF算法提出新的类内最近邻样本查找方式,并结合多标签的贡献值改进特征权值的计算方法,能很好地适应多标签数据的特点;同时为了减少特征冗余,MML-RF算法以互信息作为特征冗余度量方式,提出一种去冗余方法,能够得到更小的特征子集.实验表明,MML-RF多标签特征选择算法得到的特征子集规模较小,且在多标签数据集上具有很好的分类效果,能够提升多标签学习和数据挖掘工作的效率.  相似文献   

8.
在石漠化信息的分类和提取过程中,冗余特征的存在影响分类器的性能,同时增加计算的复杂度。提出一种基于K2结构学习算法的石漠化数据特征选择方法,该方法通过BIC评分方法得到贝叶斯网络的结构,从中获得类节点的马尔可夫覆盖,继而进行特征选择。同时借用不同评分函数的等价性来确定结构学习时所需的样本数,并且给出了样本数的参考。实验表明,该方法由于结合了样本的分类信息,获得的特征子集是最优的,显著提高了分类精度,降低了计算复杂度。  相似文献   

9.
10.
常用的特征选择方法利用样本空间的整个区域提取最优的特征子集。与此相反,本文中提出一种新的局部特征选择方法,即样本空间的每个区域都与各自不同的最优特征集相关联,这些特征集能够最优地适应样本空间的局部变化。同时,在求解最优特征集对应的子空间时,基于最近邻思想,本文提出了一种度量测试数据与各个类相似性的方法,用来对测试样本进行分类。本文提出的方法可以描述为线性规划优化问题,因此可以通过简单的凸优化来求解全局最优解。在三组真实数据集和三个主流的方法上进行的对比实验结果证明了该算法的可行性和有效性。  相似文献   

11.
随着现代社会中脑部肿瘤发病率的日渐上升,脑肿瘤患者存活周期分析在临床中的意义也日渐凸显。为解决当前方法分析准确率不高的问题,该文提出一种基于Adaboost的脑肿瘤患者存活周期分析系统,首先对脑肿瘤患者的MR进行预处理、归一化、获取ROI和分割等处理,随后提取脑肿瘤患者的多序列MR的纹理特征以及进行以互信息为评价标准的特征选择并得到特征子集,最后搭建以Adaboost.R2为核心的分析模型,并利用特征子集完成分析模型的训练和调优,以完成肿瘤患者存活周期的分析。Brats2018训练数据上的交叉验证实验结果证实该系统的分析准确率优于Brats2018 challenge前3名的方法和传统回归分析方法。  相似文献   

12.
基于最大互信息方法的机械零件图像识别   总被引:1,自引:0,他引:1  
提出了应用最大互信息方法进行零件图像识别的方法,它利用图像的信息熵描述图像的特征,结合图像的颜色信息及局部形状信息,以互信息作为衡量两幅图像相似性的测度函数进行图像识别,弥补了直方图表达空间信息的不足。该方法既满足位置不变性,又能避免进行图像分割,从而避免了因图像分割引起的复杂计算,使算法容易实现。实验结果表明,该方法提高了零件图像识别的精度、稳定性和可靠性。  相似文献   

13.
王利      张懿恺      舒宝      许豪      魏拓      雷体俊     《延边大学学报(自然科学版)》2023,(3):511-521
针对滑坡监测多源异构数据融合处理中存在的影响因子筛选难、结果差异大、数据处理复杂程度高等问题,提出一种基于最大互信息系数(MIC)、灰色关联分析(GRA)和逐步回归的黄土滑坡多源多点位异构监测数据融合方法。该方法首先将最大互信息系数和灰色关联分析结合起来,采用基于加权关联度的特征优选方法综合筛选滑坡变形影响因子,提取具有代表性的影响因子并剔除关联性差的影响因子; 然后,通过逐步回归方法赋予各监测点位移和优选后的影响因子对应的重要性权重系数,获取多源异构数据融合序列; 最后,采用甘肃黑方台党川滑坡监测设备所获取的全球卫星导航系统(GNSS)监测数据、裂缝位移计数据及气象数据进行实验验证。结果表明:在滑坡变形影响因子筛选性能方面,基于加权关联度的特征优选方法优于传统的Pearson相关系数法; 基于特征优选和逐步回归的多源多点位异构数据融合模型的预测精度较传统的BP神经网络有所提升,其中均方根误差(RMSE)降低了51.8%,平均绝对百分比误差(MAPE)降低了2.26%,拟合优度达到了0.964。  相似文献   

14.
针对基因表达谱数据的特点,提出了一种基于样本加权的基因特征选取模型。首先提出一种样本权重的计算方法;其次结合样本权重改进信息增益度量标准,并用其衡量基因信息量的大小,同时将基因之间信息量的重复性视为基因噪声干扰,建立未消噪和消噪的基因特征选取模型;最后结合支持向量机、逻辑回归、神经网络和决策树4种分类器,将所提模型与常见的基因选取模型进行比较分析。实验结果表明,所提选取模型在不影响分类性能的前提下,具有较好的稳定性。  相似文献   

15.
并行免疫克隆特征选择算法   总被引:1,自引:0,他引:1  
针对模式识别中传统的封装式特征选择算法,难以得到较好的特征子集和复杂度较高的分类器评价特征子集的耗时问题,提出了一种用于特征选择的并行免疫克隆算法,采用免疫克隆算法搜索特征,并利用并行算法评价特征子集,即将种群中个体的适应度计算并行在多个计算节点上同时进行.将该算法在Linux刀片集群上基于MPICH软件对UCI数据集进行特征子集选择算法仿真,特征子集采用最近邻分类并采用留一法验证评价.结果表明该算法选出的特征子集优于经典的顺序浮动前向搜索算法和标准遗传算法,与串行算法运行时间相比,在40个CPU时其加速比最高可达29.57.  相似文献   

16.
通过互信息的思想提出一个新的评价函数来评价属性之间的相关性,并结合LV算法进行特征子集选择.结果表明,该方法对分类问题效果明显.  相似文献   

17.
基于支持向量机和遗传算法的水下目标特征选择算法   总被引:6,自引:0,他引:6  
基于统计学习理论和遗传算法理论,提出了一种基于支持向量机和遗传算法相结合的水下目标特征选择算法。通过对实测数据的特征集的优化选择实验,证明了该算法的有效性和鲁棒性,它能较好地解决在复杂水下目标信号所提取的特征维数高,样本采样困难,数目偏少的实际情况下的分类识别问题。  相似文献   

18.
提出基于支持向量机的灵敏度分析方法选取结肠癌特征基因.用支持向量机分析基因对分类决策函数的灵敏度,递归去除灵敏度较低的若干基因,得到一组候选特征基因子集;以支持向量机为分类工具,检验候选特征基因子集对样本分类的贡献,选取具有最佳分类能力的候选特征基因子集作为结肠癌特征基因子集.通过实验比较,该特征基因子集的分类能力优于文献给出的其他特征基因子集,表明了该方法的可行性和有效性.  相似文献   

19.
在分析了传统特征选择方法构造的4项基本信息元素的基础上提出一种强类别信息的度量标准,并在此基础上,提出一种适用于不平衡文本的特征选择方法。该方法综合考虑了类别信息因子、词频因子,分别用于提高少数类和多数类类别分类精度。该方法在reuter-21578数据集上进行了实验,实验结果表明,该特征选择方法比IG、CHI方法都更好,不但微平均指标有一定程度的提高,而且宏平均指标也有一定程度的提高。  相似文献   

20.
雷达波形优化的特征互信息方法   总被引:1,自引:0,他引:1  
针对扩展目标识别中距离敏感性的波形优化问题,在通用注水法的基础上提出了基于特征提取的波形优化设计方法,简称为特征互信息方法.该方法通过最大化识别特征与目标特性之间的互信息以达到增加各类目标可分性的目的.仿真结果表明,相对于线性调频信号和注水法优化信号,特征互信息方法优化信号可以得到更大的互信息,并能较好地提高目标的识别性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号