共查询到20条相似文献,搜索用时 11 毫秒
1.
基于排序融合的特征选择 总被引:3,自引:0,他引:3
针对模式分类中的特征选择问题,分别依据ReliefF算法、类间可分性及特征相关性等多个评价准则对待约简特征进行评价与排序,基于排序融合方法实现对多个特征选择评价准则的综合利用.基于多个数据集的实验结果表明,该方法在有效降低特征维度的同时,具有比单准则特征选择方法更高的分类性能. 相似文献
2.
在多标记学习框架中,特征选择是解决维数灾难,提高多标记分类器的有效手段。提出了一种融合特征排序的多标记特征选择算法。该算法首先在各标记下进行自适应的粒化样本,以此来构造特征与类别标记之间的邻域互信息。其次,对得到邻域互信息进行排序,使得每个类别标记下均能得到一组特征排序。最后,多个独立的特征排序经过聚类融合成一组新的特征排序。在4个多标记数据集和4个评价指标上的实验结果表明,所提算法优于一些当前流行的多标记降维方法。 相似文献
3.
4.
5.
排序问题在信息检索领域是一个非常重要的课题。虽然排序学习模型的算法早已被深入研究,但针对排序学习算法中的特征选择的研究却很少。现实的情况是,许多用于分类的特征选择方法被直接应用到排序学习中。但由于排序和分类有着显著的差异,应研究出针对排序的特征选择算法。文中在介绍常用的排序学习的特征选择方法的基础上,提出了一种全新的、适用于QA问题的排序学习的特征选择方法一锦标赛排序特征选择方法。实验结果显示,这种新的特征选择方法在提高特征提取效率和降低特征向量维数方面都有显著改善。 相似文献
6.
基于Fisher准则和特征聚类的特征选择 总被引:2,自引:0,他引:2
特征选择是机器学习和模式识别等领域的重要问题之一。针对高维数据,提出了一种基于Fisher准则和特征聚类的特征选择方法。首先基于Fisher准则,预选出鉴别性能较强的特征子集,然后在预选所得到的特征子集上对特征进行分层聚类,从而最终达到去除不相关和冗余特征的目的。实验结果表明该方法是一种有效的特征选择方法。 相似文献
7.
随着博客数据的迅速增长,在网络媒体中进行信息检索时的效率问题日益受到人们的关注。该文在针对博客搜索中特有的用户需求以及博客系统自身特点进行分析的基础上,提出一种基于博客文章相关性、时效性、查询类型和博客作者兴趣特征一致性等多特征融合的博客文章排序算法。实验结果证明了该算法性能优于传统算法。 相似文献
8.
《计算机应用与软件》2016,(7)
肿瘤特征基因的选择是肿瘤基因表达数据分类的研究热点之一。针对传统的肿瘤特征基因选择方法无法很好地剔除冗余基因,提出一种混合型的特征选择方法。在所提出的方法中,首先将标签相同的样本划分到同一个矩阵,在所有矩阵中,当且仅当特征间的相关系数均大于特定阈值时,即判定这几个特征是相关特征,并对这些相关的特征进行聚类。然后在每个聚类中选择Fisher比最大的特征,对这些特征根据评价函数筛选得到最优特征子集。最后采用SVM分类器对这些最优特征子集进行类别预测。在四个标准的肿瘤DNA微阵列数据集的测试结果证明所提出的肿瘤基因特征选择方法的稳定性和高效性。 相似文献
9.
10.
针对传统的克隆选择算法(CSA)只依次单独针对某一类样本数据进行监督学习从而造成分类效率和精确度不高的问题,提出一种基于改进克隆选择算法的多类监督分类算法。算法通过进化学习可以同时获得多类样本数据的最佳聚类中心,进化过程中抗体适度值的计算综合考虑各类的类内相似性和类间差异性,从而保证得到的最佳聚类中心更具代表性。后续的分类实验中,分别利用常用的4组UCI数据和红树林多光谱TM遥感图像对算法进行验证,实验结果表明遥感图像的分类总精度达到92%,Kappa系数为0.91,UCI数据分类结果也较好,证明该算法是一种有效的多类数据分类算法。 相似文献
11.
Fisher Score (FS)是一种快速高效的评价特征分类能力的指标,但传统的FS指标既无法直接应用于多标记学习,也不能有效处理样本极值导致的类中心与实际类中心的误差。提出一种结合中心偏移和多标记集合关联性的FS多标记特征选择算法,找出不同标记下每类样本的极值点,以极值点到该类样本的中心距离乘以半径系数筛选新的样本,从而获得分布更为密集的样本集合,以此计算特征的FS得分,通过整体遍历全体样本的标记集合中的每个标记,并在遍历过程中针对具有更多标记数量的样本自适应地赋以标记权值,得到整体特征的平均FS得分,以特征的FS得分进行排序过滤出目标子集实现特征选择目标。在8个公开的多标记文本数据集上进行参数分析及5种指标性能比较,结果表明,该算法具有一定的有效性和鲁棒性,在多数指标上优于MLNB、MLRF、PMU、MLACO等多标记特征选择算法。 相似文献
12.
13.
14.
针对标签排序问题的特点,提出一种面向标签排序数据集的特征选择算法(Label Ranking Based Feature Selection, LRFS)。该算法首先基于邻域粗糙集定义了新的邻域信息测度,能直接度量连续型、离散型以及排序型特征间的相关性、冗余性和关联性。然后,在此基础上提出基于邻域关联权重因子的标签排序特征选择算法。实验结果表明,LRFS算法能够在不降低排序准确率的前提下,有效剔除标签排序数据集中的无关特征或冗余特征。 相似文献
15.
数据挖掘中所获取的数据维数多,常常导致数据存储所需容量大,知识挖掘所需时间长,预测正确率不高等问题,特征选择是解决上述问题的重要方法之一。针对现有特征选择算法最佳特征个数难以确定及分类准确率有待进一步提高等问题,提出一种同时考虑相关性和冗余度的多准则赋权排序的算法(mCRC),mCRC结合两种准则同时对特征进行排序,并利用C-SVM对按重要性降序排好的特征采用顺序前向浮动搜索得出最佳特征子集。实验结果表明,mCRC算法与单独基于互信息或类别可分性赋权排序的特征选择方法相比能在更短的时间内获得分类性能更好的最佳特征子集,为快速并高效地对数据集进行挖掘提供了有力保障。 相似文献
16.
17.
18.
针对单特征手指静脉识别中识别率难以继续提高的技术瓶颈,采用多特征融合技术不仅可以提高识别率,而且可以降低误识率.为此提出一种基于Fisher准则的手指静脉融合算法.首先对手指静脉图像进行特征点提取,分别计算待匹配图像特征点与注册图像特征点的正向平均豪斯道夫距离(FMHD)和反向平均豪斯道夫距离(RMHD),然后基于Fisher准则确定FMHD和RMHD的融合参数,将融合得到的豪斯道夫距离作为新的匹配分数;在上述算法的基础上,将得到的食指、中指和无名指3根手指静脉的匹配分数进行融合,以进一步提高手指静脉的识别率.实验结果表明,与通常采用的FMHD相比,采用融合后的豪斯道夫距离的误识率有明显降低;而采用三指静脉融合后,误识率由单个手指的1.95%降低到0.27%. 相似文献
19.
在模式识别和数据分析中,经常会遇到数据特征的高维问题.为了有效地进行数据分析,特征维数的削减或特征降维就显得异常重要.针对特征选择这一问题,依据概率密度距离准则,提出一个新的无监督特征排序方法.基于交叉验证的实验结果表明,该方法与现有的方法相比更为有效. 相似文献
20.
自动文本分类就是在给定的分类体系下,让计算机根据文本的内容确定与它相关联的类别。特征选择作为文本分类中的关键,困难之一是特征空间的高维性,因此寻求一种有效的特征选择方法,降低特征空间的维数,成为文本分类中的重要问题。在分析已有的文本分类特征选择方法的基础上,实现了一种组合不同特征选择方法的多特征选择方法,应用于KNN文本分类算法,实验表明,多特征选择方法分类效果比单一的特征选择方法分类效果有明显的提高。 相似文献