首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 11 毫秒
1.
基于排序融合的特征选择   总被引:3,自引:0,他引:3  
针对模式分类中的特征选择问题,分别依据ReliefF算法、类间可分性及特征相关性等多个评价准则对待约简特征进行评价与排序,基于排序融合方法实现对多个特征选择评价准则的综合利用.基于多个数据集的实验结果表明,该方法在有效降低特征维度的同时,具有比单准则特征选择方法更高的分类性能.  相似文献   

2.
在多标记学习框架中,特征选择是解决维数灾难,提高多标记分类器的有效手段。提出了一种融合特征排序的多标记特征选择算法。该算法首先在各标记下进行自适应的粒化样本,以此来构造特征与类别标记之间的邻域互信息。其次,对得到邻域互信息进行排序,使得每个类别标记下均能得到一组特征排序。最后,多个独立的特征排序经过聚类融合成一组新的特征排序。在4个多标记数据集和4个评价指标上的实验结果表明,所提算法优于一些当前流行的多标记降维方法。  相似文献   

3.
《电子技术应用》2018,(1):84-87
利用网络流量的统计特征进行流量的分类识别需要从众多的特征中选取最优特征集合,以避免冗余和不相关特征造成的系统模型复杂度过高、分类准确率和效率下降等问题。针对该问题,提出一种基于统计排序的网络流量特征选择方法。首先利用基于统计方法定义的特征选择系数生成初始特征子集,再将基于分类准确率构建的特征影响系数作为特征评估排序的依据,对初始特征子集进行二次特征选择,生成最优特征子集。实验结果表明,该方法在保证分类整体准确率的同时有效减少了流量统计特征的个数,在分类效果、效率以及稳定性之间实现了较好的平衡。  相似文献   

4.
基于Fisher准则的多特征融合   总被引:6,自引:0,他引:6  
阐述了单个特征向量及其鉴别矢量与模式可分性的关系,最佳鉴别矢量使模式关于该特征具有最大的可分性。给出了多特征融合的一种方法,它综合考查了模式对不同的特征、不同的鉴别矢量的可分性,由多个特征经融合产生的新特征吸收了单个特征的对模式分类的优势。手写体汉字的识别试验验证了所给方法的有效性。  相似文献   

5.
排序问题在信息检索领域是一个非常重要的课题。虽然排序学习模型的算法早已被深入研究,但针对排序学习算法中的特征选择的研究却很少。现实的情况是,许多用于分类的特征选择方法被直接应用到排序学习中。但由于排序和分类有着显著的差异,应研究出针对排序的特征选择算法。文中在介绍常用的排序学习的特征选择方法的基础上,提出了一种全新的、适用于QA问题的排序学习的特征选择方法一锦标赛排序特征选择方法。实验结果显示,这种新的特征选择方法在提高特征提取效率和降低特征向量维数方面都有显著改善。  相似文献   

6.
基于Fisher准则和特征聚类的特征选择   总被引:2,自引:0,他引:2  
王飒  郑链 《计算机应用》2007,27(11):2812-2813
特征选择是机器学习和模式识别等领域的重要问题之一。针对高维数据,提出了一种基于Fisher准则和特征聚类的特征选择方法。首先基于Fisher准则,预选出鉴别性能较强的特征子集,然后在预选所得到的特征子集上对特征进行分层聚类,从而最终达到去除不相关和冗余特征的目的。实验结果表明该方法是一种有效的特征选择方法。  相似文献   

7.
一种基于多特征融合的博客文章排序算法   总被引:1,自引:1,他引:0       下载免费PDF全文
卢刚 《计算机工程》2009,35(2):47-48,5
随着博客数据的迅速增长,在网络媒体中进行信息检索时的效率问题日益受到人们的关注。该文在针对博客搜索中特有的用户需求以及博客系统自身特点进行分析的基础上,提出一种基于博客文章相关性、时效性、查询类型和博客作者兴趣特征一致性等多特征融合的博客文章排序算法。实验结果证明了该算法性能优于传统算法。  相似文献   

8.
肿瘤特征基因的选择是肿瘤基因表达数据分类的研究热点之一。针对传统的肿瘤特征基因选择方法无法很好地剔除冗余基因,提出一种混合型的特征选择方法。在所提出的方法中,首先将标签相同的样本划分到同一个矩阵,在所有矩阵中,当且仅当特征间的相关系数均大于特定阈值时,即判定这几个特征是相关特征,并对这些相关的特征进行聚类。然后在每个聚类中选择Fisher比最大的特征,对这些特征根据评价函数筛选得到最优特征子集。最后采用SVM分类器对这些最优特征子集进行类别预测。在四个标准的肿瘤DNA微阵列数据集的测试结果证明所提出的肿瘤基因特征选择方法的稳定性和高效性。  相似文献   

9.
10.
郑仙花  骆炎民 《计算机应用》2012,32(11):3201-3205
针对传统的克隆选择算法(CSA)只依次单独针对某一类样本数据进行监督学习从而造成分类效率和精确度不高的问题,提出一种基于改进克隆选择算法的多类监督分类算法。算法通过进化学习可以同时获得多类样本数据的最佳聚类中心,进化过程中抗体适度值的计算综合考虑各类的类内相似性和类间差异性,从而保证得到的最佳聚类中心更具代表性。后续的分类实验中,分别利用常用的4组UCI数据和红树林多光谱TM遥感图像对算法进行验证,实验结果表明遥感图像的分类总精度达到92%,Kappa系数为0.91,UCI数据分类结果也较好,证明该算法是一种有效的多类数据分类算法。  相似文献   

11.
Fisher Score (FS)是一种快速高效的评价特征分类能力的指标,但传统的FS指标既无法直接应用于多标记学习,也不能有效处理样本极值导致的类中心与实际类中心的误差。提出一种结合中心偏移和多标记集合关联性的FS多标记特征选择算法,找出不同标记下每类样本的极值点,以极值点到该类样本的中心距离乘以半径系数筛选新的样本,从而获得分布更为密集的样本集合,以此计算特征的FS得分,通过整体遍历全体样本的标记集合中的每个标记,并在遍历过程中针对具有更多标记数量的样本自适应地赋以标记权值,得到整体特征的平均FS得分,以特征的FS得分进行排序过滤出目标子集实现特征选择目标。在8个公开的多标记文本数据集上进行参数分析及5种指标性能比较,结果表明,该算法具有一定的有效性和鲁棒性,在多数指标上优于MLNB、MLRF、PMU、MLACO等多标记特征选择算法。  相似文献   

12.
在图像标注、疾病诊断等实际分类任务中,数据标记空间的类别通常存在着层次化结构关系,且伴随着特征的高维性.许多层次特征选择算法因不同的实际任务需求而提出,但这些已有的特征选择算法忽略了特征空间的未知性和不确定性.针对上述问题,提出一种基于ReliefF的面向层次分类学习的在线流特征选择算法OH_ReliefF.首先将类别...  相似文献   

13.
针对计算机视觉领域的目标跟踪问题,提出一种基于排序支持向量机的多特征融合目标跟踪算法。利用排序支持向量机学习得到排序函数,提取2种不同的图像特征分别构造分类器,使2个排序支持向量机并行预测,分别计算2个分类器的错误率,从而得到分类器权重完成融合。实验结果表明,与目前主流的跟踪算法相比,该算法的跟踪结果更准确,在复杂视频环境下也能对目标进行稳定跟踪,具有较强的鲁棒性。  相似文献   

14.
针对标签排序问题的特点,提出一种面向标签排序数据集的特征选择算法(Label Ranking Based Feature Selection, LRFS)。该算法首先基于邻域粗糙集定义了新的邻域信息测度,能直接度量连续型、离散型以及排序型特征间的相关性、冗余性和关联性。然后,在此基础上提出基于邻域关联权重因子的标签排序特征选择算法。实验结果表明,LRFS算法能够在不降低排序准确率的前提下,有效剔除标签排序数据集中的无关特征或冗余特征。  相似文献   

15.
数据挖掘中所获取的数据维数多,常常导致数据存储所需容量大,知识挖掘所需时间长,预测正确率不高等问题,特征选择是解决上述问题的重要方法之一。针对现有特征选择算法最佳特征个数难以确定及分类准确率有待进一步提高等问题,提出一种同时考虑相关性和冗余度的多准则赋权排序的算法(mCRC),mCRC结合两种准则同时对特征进行排序,并利用C-SVM对按重要性降序排好的特征采用顺序前向浮动搜索得出最佳特征子集。实验结果表明,mCRC算法与单独基于互信息或类别可分性赋权排序的特征选择方法相比能在更短的时间内获得分类性能更好的最佳特征子集,为快速并高效地对数据集进行挖掘提供了有力保障。  相似文献   

16.
黄莉莉  汤进  孙登第  罗斌 《计算机应用》2012,32(10):2888-2890
针对传统特征选择算法局限于单标签数据问题,提出一种多标签数据特征选择算法——多标签ReliefF算法。该算法依据多标签数据类别的共现性,假设样本各类标签的贡献值是相等的,结合三种贡献值计算方法,改进特征权值更新公式,最终获得有效的分类特征。分类实验结果表明,在特征维数相同的情况下,多标签ReliefF算法的分类正确率明显高于传统特征选择算法。  相似文献   

17.
针对现有微博主客观分类方法特征冗余度高和未考虑特征选择方法之间的互补关系问题,该文提出了一种基于融合特征的微博主客观分类方法。通过对多种不同特征选择方法进行有效组合,利用特征融合算法对词特征、内容特征、微博特征等基本特征进行了选择和融合,以获取更加有效的主客观分类特征。在新浪微博数据上的实验结果表明,该特征融合算法能够获得比最优单一特征选择方法更好的分类效果。  相似文献   

18.
针对单特征手指静脉识别中识别率难以继续提高的技术瓶颈,采用多特征融合技术不仅可以提高识别率,而且可以降低误识率.为此提出一种基于Fisher准则的手指静脉融合算法.首先对手指静脉图像进行特征点提取,分别计算待匹配图像特征点与注册图像特征点的正向平均豪斯道夫距离(FMHD)和反向平均豪斯道夫距离(RMHD),然后基于Fisher准则确定FMHD和RMHD的融合参数,将融合得到的豪斯道夫距离作为新的匹配分数;在上述算法的基础上,将得到的食指、中指和无名指3根手指静脉的匹配分数进行融合,以进一步提高手指静脉的识别率.实验结果表明,与通常采用的FMHD相比,采用融合后的豪斯道夫距离的误识率有明显降低;而采用三指静脉融合后,误识率由单个手指的1.95%降低到0.27%.  相似文献   

19.
在模式识别和数据分析中,经常会遇到数据特征的高维问题.为了有效地进行数据分析,特征维数的削减或特征降维就显得异常重要.针对特征选择这一问题,依据概率密度距离准则,提出一个新的无监督特征排序方法.基于交叉验证的实验结果表明,该方法与现有的方法相比更为有效.  相似文献   

20.
董梅  胡学钢 《微机发展》2007,17(7):117-119
自动文本分类就是在给定的分类体系下,让计算机根据文本的内容确定与它相关联的类别。特征选择作为文本分类中的关键,困难之一是特征空间的高维性,因此寻求一种有效的特征选择方法,降低特征空间的维数,成为文本分类中的重要问题。在分析已有的文本分类特征选择方法的基础上,实现了一种组合不同特征选择方法的多特征选择方法,应用于KNN文本分类算法,实验表明,多特征选择方法分类效果比单一的特征选择方法分类效果有明显的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号