首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 50 毫秒
1.
面向现代战场中各类感知设备产生海量实时数据,消除冗余及无关数据是提升信息质量,降低军事信息系统资源开销的关键技术。提出了一种基于特征选择的数据降维方法,实验结果表明该方法能够大幅消减噪音数据,有效提升信息质量,降低系统开销,适用于现代战争环境。  相似文献   

2.
《信息技术》2019,(2):53-57
随着信息技术的飞速发展以及网民规模的扩大,互联网数据量与日俱增,其中含有大量非结构化文本数据,因此,文中分类已成为当前的研究热点。特征选择的好坏直接影响文本分类的精度。传统单一的特征选择方法侧重点不同,使用不同的特征选择方法选择后的特征子集可能差别较大,进而导致不稳定的分类结果。文中提出了一种混合CHI与IG的特征选择方法,引入了融合特征的指标SOM(Score of Mixed),将特征根据SOM值排序,通过预定的阈值进行特征筛选,得出相对稳定且具代表性的特征子集。实验结果表明,使用该方法进行特征选择,文本分类的效果相比使用其他特征选择方法有一定的提升。  相似文献   

3.
刘洺辛  陈晶  王麒媛 《电信科学》2018,34(10):85-95
提出了结合情感词典的改进信息增益特征选择方法。首先,针对现有的信息增益特征选择存在注重特征词的文档频率而忽视语料均衡等问题,提出了改进方法。其次,考虑情感词对文本分类的影响,提出了基于情感词典的特征选择(information gain combining sentiment classification,IGSC)算法进行文本分类。该算法通过对文本情感词进行匹配并结合情感词赋权重,实现了特征降维并解决了文本数据稀疏影响分类性能的问题;最后,针对旅游评论数据集对所提出的特征选择方法进行了实验验证及分析。实验结果表明,本文提出的改进文本情感分类特征选择方法在分类准确率、召回率和F值方面均得到了提升,并且具有较好的分类稳定性。  相似文献   

4.
文本分类中特征选择方法研究   总被引:2,自引:0,他引:2  
对四种特征选择方法:互信息、信息增益、x2统计和期望交叉熵作了简要的介绍,并且结合KNN分类算法,使用查全率、查准率、宏平均和微平均对四种特征选择方法分别进行评估,提出并讨论了互信息修正的两种方法.  相似文献   

5.
吕子敬  张鹏  刘志明  张志辉  韩强 《红外》2021,42(5):33-38
为了以最小的代价筛选出最优的光谱特征,从信息亏损角度提出了一种Filter型光谱特征选择算法。该算法依据联合互信息的大小对特征进行排序,并采用一种零信息亏损原则对排序后特征全集中的冗余特征进行判断和删减。这样既能获得一个规模较小并可表现整个原始光谱特征的最优光谱特征子集,又减小了由冗余特征删减带来的信息亏损。  相似文献   

6.
吕子敬  张鹏  刘志明  张志辉  韩强 《红外》2021,42(5):33-38
为了以最小的代价筛选出最优的光谱特征,从信息亏损角度提出了一种Filter型光谱特征选择算法.该算法依据联合互信息的大小对特征进行排序,并采用一种零信息亏损原则对排序后特征全集中的冗余特征进行判断和删减.这样既能获得一个规模较小并可表现整个原始光谱特征的最优光谱特征子集,又减小了由冗余特征删减带来的信息亏损.  相似文献   

7.
基于TSVM分类算法和混合型特征选择方法,提出了一种网络入侵检测的新方法,能够高效地检测网络入侵.通过大量基于著名的KDD Cup 1999数据集的实验,表明其相对于传统的入侵检测方法在保证较高检测率的前提下,有效地降低了误报率.  相似文献   

8.
烟丝化学成分可以由实验方法提取出来,但其关键致香成分很难确定。针对这一问题,一般采用化学分析方法,但分析耗时比较长。根据烟丝化学成分与香气风格关系,使用基于信息增益的特征选择方法进行提取致香成分。通过计算烟丝化学成分中的每个属性的信息增益,从中挑选出信息增益大于。的值作为特征选择的结果进行分类预测。实验结果表明,使用该方法能够得到较准确的关键致香成分,与传统特征选择方法相比,其特征数据集的分类结果也更加准确,可以作为烟叶香型分类的有效工具。  相似文献   

9.
通过在不同文本数据集上的试验表明,文中提出的算法具有不错的表现。与文本分类中常用的特征选择算法IG、CHI相比,文中算法是有效的且能够提高分类的精确率。  相似文献   

10.
在大数据时代,特征选择是对数据进行预处理的必要环节.特征选择作为一种数据降维技术,其主要目的是从原始数据中选择出对算法最有益的相关特征,降低数据的维度和学习任务的难度,提升模型的效率.现阶段,有关特征选择算法方面的研究已取得阶段性成效,但也面临着重大挑战,其中维度灾难就是特征选择与分类问题所面临的重大挑战.首先,介绍了...  相似文献   

11.
曲智国  谭贤四  费太勇  王红  唐瑭 《信号处理》2017,33(8):1027-1033
特征点是图像中常用的局部特征结构,现有的检测算子旨在提取图像中所有符合某一准则的特征点,往往会在同一位置得到大量的特征点,形成对图像局部区域的过描述,增加了高层处理任务的运算量。为了选取出一定数量较好的特征点来描述图像,常用方法是根据特征点响应函数来选取响应值大于某一阈值的特征点,但是这种选取方法并没有考虑特征点的分布均匀性和独特性,而特征点的分布均匀程度和独特性对于图像匹配的结果同样具有重要的影响。为此提出了一种新的特征点选取方法,首先基于检测算子得到的特征点构造最小生成树,然后定义特征点分布均匀性和独特性等选取准则,再通过删剪最小生成树,选取符合(准)最优准则的一组特征点。实验表明,该方法选取的特征点在图像描述和图像匹配等任务中优于传统的特征点选取方法。   相似文献   

12.
樊龙夫 《电子技术》2010,37(10):17-20
特征选择在模式分类中扮演了一个重要的角色。它的目标是尽可能多地将不相关特征排除在外,同时,得到区分度大的特征子集。那些信息量小的特征的存在,不仅使得学习算法表现不佳,而且会掩盖数据背后重要的本质信息。随着新兴技术的发展,在很多领域数据集变得越来越大,很多不相关特征通常会出现在这样的数据集中,使得传统的学习算法遇到了巨大的挑战,尤其在效率和推广性方面。于是,一种可以从数据集中消除冗余和非相关信息的算法变得十分必要。本文提出一种boosting策略的特征选择方法,利用基于核空间的距离评价函数,采用前向分步搜索方法,为核向量机(CVM)分类器选择特征子集。实验结果显示,这种方法和非boosting策略,以及其他评价方法相比,能给分类器带来更优的特征。  相似文献   

13.
量子GA-PLS特征选择算法及其应用   总被引:1,自引:0,他引:1  
为进一步提高遗传算法-偏最小二乘法的计算速度和计算效率,将量子算法融合到遗传算法-偏最小二乘法中,提出一种新的特征选择方法—量子遗传算法-偏最小二乘法(Quantum Genetic Algorithm-Partial Square Least,QGA-PLS)算法。该方法利用量子态和叠加态原理对染色体进行编码,采用量子旋转门进行遗传操作,以实现参数的更新和增强种群多样性,同时,用量子计算重新构建了偏最小二乘法回归模型来计算个体适应度,以充分发挥快速收敛和全局优化能力。将方法应用于函数极值优化和Iris数据集的特征选择,实验结果表明,QGA-PLS在特征选择、运算时间和分类准确率方面优于QGA和GA-PLS,从而验证了QGA-PLS算法的有效性。  相似文献   

14.
文本的特征选择可以被看成是组合优化问题,而遗传算法是求解此类问题的较好方法。在遗传算法的基础上,提出了一种新的算法-免疫算法,用于文本的特征选择,通过免疫算子的构造,减轻了遗传算法后期的波动现象,提高了收敛速度。  相似文献   

15.
为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法.该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征.将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法,能有效降低数据的不平衡性,提高少数类的分类精度.  相似文献   

16.
曹琼  郑红  李行善 《电子学报》2009,37(3):562-566
 针对目标与背景两类图像模式识别问题,在已有的特征选择方法基础上,提出了一种新颖的基于免疫分子编码机理的图像特征选择方法(Immune Antibody Construction Algorithm,IACA).该方法借鉴生物免疫系统的抗体分子编码机理,在对样本进行参数估计情况下,提出熵度量单个特征对于目标和背景的识别敏感度;从集合的角度研究并且定义了特征之间的包含和互补关系;并且基于组成抗体分子氨基酸结合能量最小原则,提出了关于图像目标的免疫抗体构建规则;最终实现了寻找最优特征子集的算法IACA,该特征子集的维数通过算法自动获得无需人为设定,选择结果为目标的"免疫抗体",能很好的从背景中识别目标.利用归纳法证明了用IACA得到的特征子集的最优性.与其他特征选择方法比较,测试结果显示该算法具有较低的计算复杂度和错误识别率,表明了该方法的优越性和先进性.  相似文献   

17.
在开放式网络中,高维混合特征的冗余或不相容属性会降低网络入侵检测的效率.为提高入侵检测系统的响应性能,提出一种混合特征选择方法,利用粗糙集形式化描述入侵检测的特征选择,采用信息熵和平均权重分别定义数值型和字符型特征的重要度.算法产生降序特征序列,采用K-means聚类算法评估出优化特征子集.在KDD CUP99数据集上的仿真实验表明,算法有效选择特征子集并缩短了检测时间.  相似文献   

18.
Journal of Signal Processing Systems - Labeling of data is often difficult, expensive, and time consuming since efforts of experienced human annotators are required, and often we have large number...  相似文献   

19.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号