首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
一种基于粗糙集启发式的特征选择算法   总被引:1,自引:0,他引:1  
梁琰  何中市 《计算机科学》2007,34(6):162-165
本文基于粗糙集中关于非精确集和精确集理论思想,提出了一个新的特征度量指标,即相对互信息比RMI,由此,设计了一种基于粗糙集的启发式特征选择算法MRMI-UC。首先利用可辨识矩阵,计算出条件属性相对于决策属性的核,以核形成当前候选特征子集作为基准点,以最大化相对互信息和不确定性系数为原则,筛选剩余特征。通过对比实验,结果表明,本文提出的算法在多数情况下能够得到较优的特征子集,算法是有效的,切实可行的。  相似文献   

2.
一个混合特征属性选择算法   总被引:1,自引:1,他引:0  
1.引言特征属性选择(feature attribute selection,FAS)是机器学习和模式识别中比较困难而又非常有意义的一个问题。FAS问题是从一个大的侯选属性集合中选择一个较好的、有代表性的属性子集。由于在实际应用中,过多的属性会严重影响归纳学习的质量,一些不必要的属性会加大训练数据量,影响学习速度,损害所生成规则的精度,因此FAS是一个有实际意义的问题。  相似文献   

3.
新的特征选择方法   总被引:1,自引:0,他引:1  
对于一个给定的待分类模式,特征选择要求人们从大量的特征中选取一个最优特征子集,以代表被分类的模式.对特征选择问题提出了基于一种特殊度量的特征选择方法,先通过对数据集的训练得到特殊的度量,然后用该度量对特征进行分类,从各类中选取一个特征,最后再用特征选择算法对所选的特征进行选择.大量实验的结果表示该方法具有较好的效果.  相似文献   

4.
特征降维是文本分类过程中的一个重要环节。在现有特征选择方法的基础上,综合考虑特征词在正类和负类中的分布性质,综合四种衡量特征类别区分能力的指标,提出了一个新的特征选择方法,即综合比率(CR)方法。实验采用K-最近邻分类算法(KNN)来考查CR方法的有效性,实验结果表明该方法能够取得比现有特征选择方法更优的降维效果。  相似文献   

5.
在处理高维特征数据时通常会面临冗余和不相关的问题,Relief作为一种传统的特征选择算法因其具有较高的稳定性和计算效率,从而被广泛应用。但其特征选择结果具有随机性,且对于特征之间存在较强依赖关系的数据集,如共线性等,可能会导致结果不准确。基于对特征选择方法的研究,给出了基于LightGBM和蚁群算法的L-ACO方法,使用LightGBM算法的特征重要性来表示L-ACO算法蚁群路径搜索过程的启发式信息。同时,使用特征之间的皮尔森相关系数来调整信息素浓度,以便更好地控制特征的相关性。实验证明,L-ACO方法可以在保证分类准确率的前提下,减少特征数量,降低特征冗余,并提高算法性能。  相似文献   

6.
基于特征关联性的特征选择算法研究   总被引:5,自引:0,他引:5  
从特征与特征、特征与类的关联性出发,说明了非搜索性特征选择的原理及相关算法。  相似文献   

7.
8.
基于特征的空间数据不确定性管理模型   总被引:1,自引:0,他引:1  
从空间数据的质量表达方法和管理的角度出发,对基于特征的空间数据不确定性管理模型进行研究。首先对现行的元数据质量管理方法进行了分析,指出其不足。随后根据GIS发展的趋势,指出空间数据质量管理面临的挑战和问题,进一步提出了基于特征的空间数据不确定性管理模型,并对模型中几个关键的问题进行了探讨。  相似文献   

9.
特征选择是模式识别系统的分类器设计之前一个重要而困难的一个课题。在目前现有的方法中,基于决策界的特征选择是其中一类方法。文中将覆盖算法应用于特征提取,提出了基于覆盖算法决策界的特征选择算法(Feature SelectionAlgorithm based on the Decision Boundary of Covering Algorithm,简称FSACA法),然后将该算法应用于一个字符识别的实例并与其他算法比较。实验结果证明了FSACA法的可行性和有效性。  相似文献   

10.
特征选择是模式识别系统的分类器设计之前一个重要而困难的一个课题。在目前现有的方法中,基于决策界的特征选择是其中一类方法。文中将覆盖算法应用于特征提取,提出了基于覆盖算法决策界的特征选择算法(Feature Selection Algorithm based on the Derision Boundary of Covering Algorithm,简称FSACA法),然后将该算法应用于一个字符识别的实例并与其他算法比较。实验结果证明了FSACA法的可行性和有效性。  相似文献   

11.
基于遗传算法和模拟退火算法的特征选择方法   总被引:9,自引:0,他引:9  
针对模式识别时原始特征数量大而有冗余的现象,提出了一种基于遗传退火算法的特征选优方法。首先对遗传算法和模拟退火做了简要评论,然后在遗传算法中引入模拟退火的Boltzmann更新机制,以克服传统的遗传算法易于过早收敛和易于陷入局部极小的问题。最后阐述、设计了适应度函数和遗传算子。仿真实验表明,该方法在求解的效率和解的质量方面都达到了令人满意的效果。  相似文献   

12.
入侵检测建模过程中特征提取最优化评估   总被引:2,自引:0,他引:2  
胡威  李建华  陈波 《计算机工程》2006,32(12):150-151,168
在入侵检测建模过程中,特征提取是一个重要的步骤。特征提取有利干提高入侵检测的效率和准确性,好的特征可以在特征空间提供完美的分类独立性。但在以往的入侵检测模型评估中,对原始数据的特征提取并没有涉及提取的标准和原则。文章利用KDD数据集,针对不同种类的网络入侵攻击,使用经典聚类算法对特征提取的特征类别进行比较,以获取该领域的知识。  相似文献   

13.
KDD中的特征选择   总被引:1,自引:0,他引:1  
随着数据库、数据仓库技术的发展,各种数据处理和分析工具不断出现,数据库中的知识发现(简称KDD)就是现在受到研究人员和软件开发商广泛关注的一种数据分析方法。文章主要针对KDD的数据预处理阶段的一类重要问题———分类问题,描述了特征选择的概念,分析了它在KDD中应用的重要性和必要性,并针对KDD的特点介绍现有的特征选择的各种方法并进行归纳,为下一步的研究和开发提供一个有益的框架。  相似文献   

14.
Selection of input variables (features) is a key stage in building predictive models. As exhaustive evaluation of potential feature sets using full non-linear models is impractical, it is common practice to use simple fast-evaluating models and heuristic selection strategies. This paper discusses a fast, efficient, and powerful non-linear input selection procedure using a combination of probabilistic neural networks and repeated bitwise gradient descent with resampling. The algorithm is compared with forward selection, backward selection and genetic algorithms using a selection of real-world data sets. The algorithm has comparative performance and greatly reduced execution time with respect to these alternative approaches.  相似文献   

15.
基于遗传算法的支撑向量机的特征选取   总被引:1,自引:0,他引:1  
许建强  李高平 《计算机工程》2004,30(24):1-2,182
提出了一种支撑向量机(SVM)的特征提取方法,该方法使得所提取的特征向量能最小化SVM推广性的界,同时设计了一种有效的遗传算法来实现该方法。模拟数据和心电信号等识别问题的实验结果验证了该方法的有效性。  相似文献   

16.
王萌  丁志军 《计算机科学》2020,47(7):257-262
近年来,随着移动互联网的快速发展,越来越多的业务从浏览器端转移到了移动端。但是,寄生在移动互联网上的黑色产业链也达到了泛滥的地步。设备指纹技术应运而生,即利用设备的特征属性为每个设备生成独一无二的标识。其间涌现了很多利用机器学习方法进行设备唯一性认证的策略,其中大部分方法注重于模型的建立,很少对特征选择部分展开深入研究,而特征选择直接关系到最终模型的性能。针对该问题,文中提出了一种新的设备指纹特征选择及模型构建方法(Feature Selection Based on Discrimination and Stability and Weight-based Similarity Calculation,FSDS-WSC),即根据不同设备的特征区分度和相同设备的特征稳定性选出最具价值的一些特征,并将这些特征的重要程度作为特征权重应用到模型建立的后续过程中。在真实场景中的6 424台Android设备上,将FSDS-WSC与当今主流的其他特征选择方法进行了对比实验。结果表明,FSDS-WSC相比其他方法有了较大改进,设备唯一性认证的准确率达到了99.53%,证实了FSDS-WSC的优越性...  相似文献   

17.
文本分类中的特征选取   总被引:21,自引:0,他引:21  
刘丽珍  宋瀚涛 《计算机工程》2004,30(4):14-15,175
研究了文本分类学习中的特征选取,主要集中在大幅度降维的评估函数,因为高维的特征集对分类学习未必全是重要的和有用的。还介绍了分类的一些方法及其特点。  相似文献   

18.
19.
针对入侵检测前必须分析输入散据的特征以及检测中数据维数较高的问题,根据入侵检测的特点,将特征选择问题作为优化问题来考虑,采用量子遗传算法对特征进行选择,充分利用其并行处理及全局搜索能力,提高数据分类质量、降低问题规模、消除冗余属性、加快数据处理速度;在KDD CUP1999数据集上进行实验,结果表明与遗传算法以及粒子群算法相比,该方法可以更有效地精简特征,提高分类质量.  相似文献   

20.
特征选择的优化算法研究   总被引:1,自引:0,他引:1  
目标识别成为战争胜败的关键,而对目标识别的关键之一是对目标特征的提取与选择.因此,特征的选择尤为重要.为了提高效率,通过一种算法选择较少(优化)的特征是所希望的.鉴于此该文简单介绍基于扩张矩阵与粗集理论的算法、启发式搜索算法、自适应神经网络、混沌神经网络等几种典型特征选择的优化算法的原理,并比较它们的性能,在此基础上提出了一种结合混沌神经网络和自适应神经网络的特征选择的改进方法,并对其原理进行简单介绍.最后用MATLAB编程验证启发式搜索算法特征选择的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号