首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
特征选择是生物信息领域中数据预处理阶段必不可少的步骤。传统特征选择算法忽视了特征之间的依赖相关性和冗余性,因此提出一种联合互信息的特征选择算法(JFRR)。该算法利用互信息计算特征之间的冗余值,并利用联合互信息分别计算已选特征集合、候选特征及类标签之间的相关性。将JFRR与其他6个特征选择算法在2个分类器上,使用9个不同基因数据集,进行分类准确率指标(Precision_micro和F1_micro)验证。实验结果表明,该算法能有效提高分类精度。  相似文献   

2.
XML强闭包依赖范式的研究   总被引:1,自引:0,他引:1  
为了解决从数据库整体的角度来消除基于不完全信息的XML数据冗余问题,研究了在不完全信息环境下XML数据库的各个模式之间存在的XML强闭包依赖引起数据冗余的判定条件和规范化算法.首先,给出了XML强函数依赖和XML强闭包依赖两者互不影响的定义;其次,提出了XML强函数依赖和非循环XML强闭包依赖互不影响的判定定理,研究了XML强闭包依赖范式以及相应的判定定理;最后,提出了把XML数据库模式转化为XML强闭包依赖范式的规范化算法,对时间复杂度进行了分析.该算法消除了冗余路径,避免了更新异常,实现了整个XML数据库模式更合理的设计.  相似文献   

3.
由于候选特征与类标签间的相关性,候选特征、已选特征与类标签间的交互性以及特征间的冗余性是特征选择算法应考虑的重要因素,而一些基于互信息和三维互信息的特征选择算法没有同时考虑相关性、交互性和冗余性信息,这影响了它们的性能。针对该问题,提出一种采用冗余性动态权重的特征选择算法,将对称不确定性和三路交互信息作为评价指标,采用一种动态更新特征权重的方法使目标函数在考虑相关性、交互性的基础上,同时考虑特征间的冗余性。在10种数据集上利用3种分类器与典型的基于互信息的特征选择算法做了对比实验,结果表明所提算法具有更好的特征选择性能。  相似文献   

4.
特征选择是机器学习和模式识别等领域的重要问题之一.从特征相关性和冗余性的出发,分析了特征相关性的大小与分类能力之间的联系,并利用相关系数对相关特征和冗余特征进行预选取,然后使用顺序前向搜索方法作进一步的降维处理,得到了一种基于相关性的最优特征子集选择方法.实验结果表明,该方法是一种有效的特征选择方法.  相似文献   

5.
为解决特征选择中分辨特征之间的依赖和冗余问题,采用动态权重最大相关最小冗余算法(DWMRMR),在5个公共数据集上进行了验证以及算法比较.  相似文献   

6.
为解决特征选择中分辨特征之间的依赖和冗余问题,采用动态权重最大相关最小冗余算法(DWMRMR),在5个公共数据集上进行了验证以及算法比较.  相似文献   

7.
常用的排列法从微阵列数据中选择的基因集合会包含相关性较高的基因,这会影响分类器的性能,为了去除这些冗余基因(特征),提出了无监督的特征选择算法.该算法主要包含:将原始特征集划分为一组相似的子集(聚类);从每个聚类中选择代表性特征.特征的划分采用特征间的相关性作为测度以k近邻原则来完成.该算法无需指定聚类数量,时间复杂度低.真实的生物学数据实验证明该算法可显著提高分类器的分类准确性.  相似文献   

8.
针对特征选择过程中准确率和计算效率不平衡问题,提出了一种快速特征选择框架(FFFS).基于该框架,使用最小冗余最大相关方法(MRMR)选择候选特征,借助序列前向选择方法(SFS)验证性能,并通过限定迭代次数提高计算性能.与MRMR、SFS和混合序列浮动前向选择算法(FDHSFFS)的对比实验结果表明,提出的快速特征选择算法MRMR-SFS能在预测准确率和计算效率之间取得较好的平衡.  相似文献   

9.
针对在数据挖掘过程中存在的数据冗余特征和维灾难问题,依据Relief F算法和主成分分析算法的理论基础方法,建立了基于Relief F优化的核主成成分析的二次特征选择法,并给出了该方法的实验结果 .该方法能够有效处理维度过高、具有冗余和无关特征的数据,结合机器学习算法,使数据挖掘系统得到准确高效的执行结果,为决策人员提供有力的决策依据。通过实验得出该算法具有更高的分类准确度的结论 .  相似文献   

10.
在相关性快速过滤特征选择算法(FCBF)基础上,通过最大相关系数的方式改进FCBF算法.首先,通过最大相关系数和对称不确定性度量准则,计算出每个特征与标签之间的相关度量值,并按照数值大小顺序进行排序;其次,通过最大相关系数和近似马尔可夫毯原理进行无关特征和冗余特征的筛选,最终选择出最优特征子集.在加利福尼亚大学欧文分校的机器学习库(UCI)的8个公开数据集中进行对比实验结果表明基于最大相关系数的特征选择算法(NFCBF)总体优于FCBF算法,它所选择出特征数比FCBF算法所选择特征数平均少了3.625个,分类准确率平均提高了0.075%.与互信息最大算法(MIM)、最少的绝对收缩和选择算法(Lasso)和岭算法(Ridge)等相比也具有明显的优势.  相似文献   

11.
为了提高不同工况下的轴承故障诊断准确率,提出了一种基于特征筛选和集成学习的轴承故障诊断方法。考虑到特征向量复杂冗余的问题,结合特征有效性和最大均值差异提出了新的特征评分函数,并在此基础上进一步考虑特征关联度和特征维度,筛选出有利于变工况故障诊断的特征子集。针对单一机器学习模型故障诊断准确率不高的问题,将AdaBoost和Stacking算法相结合构造集成学习故障诊断模型。实验结果表明:筛选出的特征子集在相同分类器下拥有更高的故障诊断准确率;集成学习模型相较于单一模型有更高的故障诊断准确率和鲁棒性。  相似文献   

12.
一种基于聚类集成的无监督特征选择方法   总被引:1,自引:0,他引:1  
提出了一种无监督的特征选择方法,其基本思想是利用聚类来指导特征选择,对于无类别标签的数据样本集,先进行聚类获得数据类标签,再利用ReliefF算法进行特征选择.采用聚类集成方法解决一些聚类结果的不稳定问题,最终特征选择结果通过多次特征选择综合得到.实验结果表明,该算法具有良好的特征选择性能,在去除无关或冗余特征后可进一步提高聚类质量.  相似文献   

13.
基于邻域关系的网络入侵检测特征选择   总被引:1,自引:0,他引:1  
入侵检测数据集具有数据量大、特征敷众多、连续型数据的特点.粗糙集是一种有效处理不确定性、不一致性、海量数据的有效分类工具,其特点是保持入侵检测数据集的分类能力不变,进行特征选择.为了避免传统粗糙集特征选择方法所必需的离散化过程带来的信息损失,引入邻域粗糙集模型,提出基于邻域关系的网络入侵检测数据特征选择方法.该方法从所有特征出发,根据特征重要度逐步删除冗余的特征,最后得到关键特征组进行分类研究.在CUP99入侵检测数据集上进行特征选择,并进行了分类实验,实验结果表明该方法是有效可行的.  相似文献   

14.
使用遗传算法的乳腺微钙化点特征优化   总被引:1,自引:0,他引:1  
乳腺微钙化点包含众多属性,由于其中存在的冗余和不相关属性降低了微钙化点病变类型判别的性能。因此,特征子集选择问题成为微钙化点病变类型识别中的重要问题。该文针对传统优化方法用于特征选择的种种缺陷,提出了基于遗传算法的特征子集选择测算法。经乳腺微钙化点特征选择实例分析,证明该方法拥有较强的并行性和寻优能力,在特征选择领域有广阔的应用前景。  相似文献   

15.
针对旋转设备原始故障特征空间中存在的冗余特征问题,提出一种基于支持向量数据描述(SVDD)和遗传算法的故障特征优化方法. 通过理论和实验分析构造了相对完备的设备声学故障特征空间;依据特征可分离性评价准则和SVDD识别率从原始故障样本数据集中提取出先验知识,指导种群的初始化;以类〖JP9〗内-〖JP〗类间距离判据和故障分类器的识别率评价种群中个体的适应度,在此基础上建立改进的遗传算法搜索最优故障特征子集.基于转子振动台所模拟的不平衡故障实验样本数据集,验证了该方法的有效性.  相似文献   

16.
一种类内方差与相关度结合的特征选择算法   总被引:1,自引:0,他引:1  
为了解决现有特征选择算法没有同时考虑特征之间以及特征与类别之间的相关性,且存在计算量大、适用范围窄等问题,从均方误差最小的分类训练准则出发,并借鉴线性鉴别分析的思想,提出了一种类内方差与相关度结合的特征选择算法,并使用核方法将其推广到可以解决非线性分类的特征选择问题.该算法不仅同时考虑了样本特征之间以及特征与分类标号之...  相似文献   

17.
针对模式识别系统中有效特征的选择问题,采用支持向量机作为分类器,提出了基于均匀设计的特征选择方法.根据均匀设计表的结构及采用的数据集进行训练、测试,最后检验所选的特征子集.实验结果表明,该方法能够有效地去除数据集的冗余特征,取得比使用特征全集更好的分类性能.  相似文献   

18.
传统的协同学习算法需要2个充分冗余的特征视图,而在多数情况下达不到特征充分冗余的要求,为此提出松散条件下的协同学习框架.利用支持向量机算法和长短期记忆网络(LSTM)算法分别建立基于向量空间模型的微博特征视图和基于语义相关的词向量特征视图,在2个视图上进行协同学习.针对未标注样本的选择,提出结合主动学习中的不确定策略和协同学习中的最高置信度策略的选择策略,从不同角度充分利用未标注样本中包含的信息量.实验结果表明,在中文微博情感极性研究领域,提出的选择策略与传统选择策略相比,能够提高分类器的性能,并且利用松散条件下的协同学习框架实现微博情感分析性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号