首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于冗余分析的特征选择算法   总被引:1,自引:0,他引:1  
针对冗余特征判定难题,分析了特征和特征之间的相关性以及特征和目标值之间相关性的联系,给出了判定冗余特征的准则,在此基础上给出了近似冗余特征的定义,并提出了一种基于冗余分析的特征选择算法.算法分2步去除无关特征和冗余特征.实验结果表明,所提出的特征选择算法能有效降低特征维数,提高预测准确率.  相似文献   

2.
由于候选特征与类标签间的相关性,候选特征、已选特征与类标签间的交互性以及特征间的冗余性是特征选择算法应考虑的重要因素,而一些基于互信息和三维互信息的特征选择算法没有同时考虑相关性、交互性和冗余性信息,这影响了它们的性能。针对该问题,提出一种采用冗余性动态权重的特征选择算法,将对称不确定性和三路交互信息作为评价指标,采用一种动态更新特征权重的方法使目标函数在考虑相关性、交互性的基础上,同时考虑特征间的冗余性。在10种数据集上利用3种分类器与典型的基于互信息的特征选择算法做了对比实验,结果表明所提算法具有更好的特征选择性能。  相似文献   

3.
特征选择是生物信息领域中数据预处理阶段必不可少的步骤。传统特征选择算法忽视了特征之间的依赖相关性和冗余性,因此提出一种联合互信息的特征选择算法(JFRR)。该算法利用互信息计算特征之间的冗余值,并利用联合互信息分别计算已选特征集合、候选特征及类标签之间的相关性。将JFRR与其他6个特征选择算法在2个分类器上,使用9个不同基因数据集,进行分类准确率指标(Precision_micro和F1_micro)验证。实验结果表明,该算法能有效提高分类精度。  相似文献   

4.
针对多媒体传感网采集图像信息的空间冗余问题,提出了一种面向数据压缩的无线多媒体传感器网络节点的选择方法.该方法从节点3维感知模型出发,设计空间相关模型以描述感知图像数据之间的相关性,在此基础上,提出基于相关性的节点选择方法,减少了采集数据的空间冗余.仿真实验结果验证了新方案的有效性.  相似文献   

5.
为了解决反应堆冗余泵组中相关性(包括泵的温备用、共因失效以及止回阀组同时工作)相互重叠的问题,应用动态可靠性框图(DRBD)建立了冗余泵组的相关动态模型.以冗余泵组为整体,比较分析了其在4种不同相关性情况下的系统故障概率变化,通过状态转移方程求得动态数值解并绘制了曲线图.实验结果表明,多种相关性重叠在冗余泵组中起着重要作用,以DRBD建模为基础,确定并量化各相关因子之间的关系是分析冗余系统相关性的一种有效方法.  相似文献   

6.
为了提高SPC(Statistical Process Control)控制图的识别效果,提出了一种采用改进序列前向选择法(ISFS)和极限学习机(ELM)相结合的方法来进行控制图模式识别。首先,对控制图进行特征提取;然后,采用改进的序列前向选择法对特征进行选择,减少了特征间的相关性和冗余性;最后,利用极限学习机来进行模式识别。仿真结果显示,改进方法的识别率可达到98.7%,从而为控制图提供了一种有效的识别方法。  相似文献   

7.
为了解决短文本对象特征空间稀疏性与背景缺失造成的精确分类困难与语义混淆问题,提出一种背景补偿与边缘相关计算的特征选择方法.通过提取并利用文本间存在的关联性建立小样本簇背景特征集,重构特征空间,并结合边缘相关性分析确定最终的特征集.过程可分为2个阶段:1)基于词矢量语义量化模型计算特征词的背景相关性;2)将测试文本重组特征空间,并进行边缘性相关计算.提出的短文本特征选择方法,可以在保持原始特征空间性质与结构的前提下,强化特征空间紧凑性,减少冗余性,降低特征维度.在Reuters-21578和NewsGroup标准语料集上的实验证明,提出的方法比传统的文档频率、信息增益、互信息等方法更有效,针对两个标准的数据集,其在典型的分类器上运行表现强于一般特征选择方法.  相似文献   

8.
针对特征排序方法较少考虑特征之间的相关关系,导致选择的特征子集存在冗余的问题,提出一种引入冗余控制的特征排序模型。将特征子集判别能力最大且冗余程度最小作为模型的目标函数,以降低特征之间的冗余;使用贪心方法和非线性规划方法对模型进行求解。在9个开源数据上的实验及与特征排序方法比较表明,本模型在大部分数据上,所选择的特征子集能够获得更好的分类准确性且个数更少;使用非线性规划方法求解时,能够直接得到特征子集,有利于确定特征个数。本模型可用于特征之间存在冗余时的特征选择。  相似文献   

9.
针对传统单标签特征选择算法不能直接应用于多标签数据的问题,提出一种多标签特征选择算法——MML-RF算法.在ReliefF的基础上,MML-RF算法提出新的类内最近邻样本查找方式,并结合多标签的贡献值改进特征权值的计算方法,能很好地适应多标签数据的特点;同时为了减少特征冗余,MML-RF算法以互信息作为特征冗余度量方式,提出一种去冗余方法,能够得到更小的特征子集.实验表明,MML-RF多标签特征选择算法得到的特征子集规模较小,且在多标签数据集上具有很好的分类效果,能够提升多标签学习和数据挖掘工作的效率.  相似文献   

10.
针对特征选择过程中准确率和计算效率不平衡问题,提出了一种快速特征选择框架(FFFS).基于该框架,使用最小冗余最大相关方法(MRMR)选择候选特征,借助序列前向选择方法(SFS)验证性能,并通过限定迭代次数提高计算性能.与MRMR、SFS和混合序列浮动前向选择算法(FDHSFFS)的对比实验结果表明,提出的快速特征选择算法MRMR-SFS能在预测准确率和计算效率之间取得较好的平衡.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号