共查询到20条相似文献,搜索用时 46 毫秒
1.
一种基于粗糙集启发式的特征选择算法 总被引:1,自引:0,他引:1
本文基于粗糙集中关于非精确集和精确集理论思想,提出了一个新的特征度量指标,即相对互信息比RMI,由此,设计了一种基于粗糙集的启发式特征选择算法MRMI-UC。首先利用可辨识矩阵,计算出条件属性相对于决策属性的核,以核形成当前候选特征子集作为基准点,以最大化相对互信息和不确定性系数为原则,筛选剩余特征。通过对比实验,结果表明,本文提出的算法在多数情况下能够得到较优的特征子集,算法是有效的,切实可行的。 相似文献
2.
一个混合特征属性选择算法 总被引:1,自引:1,他引:0
1.引言特征属性选择(feature attribute selection,FAS)是机器学习和模式识别中比较困难而又非常有意义的一个问题。FAS问题是从一个大的侯选属性集合中选择一个较好的、有代表性的属性子集。由于在实际应用中,过多的属性会严重影响归纳学习的质量,一些不必要的属性会加大训练数据量,影响学习速度,损害所生成规则的精度,因此FAS是一个有实际意义的问题。 相似文献
3.
4.
特征降维是文本分类过程中的一个重要环节。在现有特征选择方法的基础上,综合考虑特征词在正类和负类中的分布性质,综合四种衡量特征类别区分能力的指标,提出了一个新的特征选择方法,即综合比率(CR)方法。实验采用K-最近邻分类算法(KNN)来考查CR方法的有效性,实验结果表明该方法能够取得比现有特征选择方法更优的降维效果。 相似文献
5.
在处理高维特征数据时通常会面临冗余和不相关的问题,Relief作为一种传统的特征选择算法因其具有较高的稳定性和计算效率,从而被广泛应用。但其特征选择结果具有随机性,且对于特征之间存在较强依赖关系的数据集,如共线性等,可能会导致结果不准确。基于对特征选择方法的研究,给出了基于LightGBM和蚁群算法的L-ACO方法,使用LightGBM算法的特征重要性来表示L-ACO算法蚁群路径搜索过程的启发式信息。同时,使用特征之间的皮尔森相关系数来调整信息素浓度,以便更好地控制特征的相关性。实验证明,L-ACO方法可以在保证分类准确率的前提下,减少特征数量,降低特征冗余,并提高算法性能。 相似文献
6.
7.
8.
基于特征的空间数据不确定性管理模型 总被引:1,自引:0,他引:1
从空间数据的质量表达方法和管理的角度出发,对基于特征的空间数据不确定性管理模型进行研究。首先对现行的元数据质量管理方法进行了分析,指出其不足。随后根据GIS发展的趋势,指出空间数据质量管理面临的挑战和问题,进一步提出了基于特征的空间数据不确定性管理模型,并对模型中几个关键的问题进行了探讨。 相似文献
9.
10.
特征选择是模式识别系统的分类器设计之前一个重要而困难的一个课题。在目前现有的方法中,基于决策界的特征选择是其中一类方法。文中将覆盖算法应用于特征提取,提出了基于覆盖算法决策界的特征选择算法(Feature Selection Algorithm based on the Derision Boundary of Covering Algorithm,简称FSACA法),然后将该算法应用于一个字符识别的实例并与其他算法比较。实验结果证明了FSACA法的可行性和有效性。 相似文献
11.
12.
13.
14.
A. Hunter 《Neural computing & applications》2000,9(2):124-132
Selection of input variables (features) is a key stage in building predictive models. As exhaustive evaluation of potential feature sets using full non-linear models is impractical, it is common practice to use simple fast-evaluating models and heuristic selection strategies. This paper discusses a fast, efficient, and powerful non-linear input selection procedure using a combination of probabilistic neural networks and repeated bitwise gradient descent with resampling. The algorithm is compared with forward selection, backward selection and genetic algorithms using a selection of real-world data sets. The algorithm has comparative performance and greatly reduced execution time with respect to these alternative approaches. 相似文献
15.
基于遗传算法的支撑向量机的特征选取 总被引:1,自引:0,他引:1
提出了一种支撑向量机(SVM)的特征提取方法,该方法使得所提取的特征向量能最小化SVM推广性的界,同时设计了一种有效的遗传算法来实现该方法。模拟数据和心电信号等识别问题的实验结果验证了该方法的有效性。 相似文献
16.
近年来,随着移动互联网的快速发展,越来越多的业务从浏览器端转移到了移动端。但是,寄生在移动互联网上的黑色产业链也达到了泛滥的地步。设备指纹技术应运而生,即利用设备的特征属性为每个设备生成独一无二的标识。其间涌现了很多利用机器学习方法进行设备唯一性认证的策略,其中大部分方法注重于模型的建立,很少对特征选择部分展开深入研究,而特征选择直接关系到最终模型的性能。针对该问题,文中提出了一种新的设备指纹特征选择及模型构建方法(Feature Selection Based on Discrimination and Stability and Weight-based Similarity Calculation,FSDS-WSC),即根据不同设备的特征区分度和相同设备的特征稳定性选出最具价值的一些特征,并将这些特征的重要程度作为特征权重应用到模型建立的后续过程中。在真实场景中的6 424台Android设备上,将FSDS-WSC与当今主流的其他特征选择方法进行了对比实验。结果表明,FSDS-WSC相比其他方法有了较大改进,设备唯一性认证的准确率达到了99.53%,证实了FSDS-WSC的优越性... 相似文献
17.
文本分类中的特征选取 总被引:21,自引:0,他引:21
研究了文本分类学习中的特征选取,主要集中在大幅度降维的评估函数,因为高维的特征集对分类学习未必全是重要的和有用的。还介绍了分类的一些方法及其特点。 相似文献
18.
19.
针对入侵检测前必须分析输入散据的特征以及检测中数据维数较高的问题,根据入侵检测的特点,将特征选择问题作为优化问题来考虑,采用量子遗传算法对特征进行选择,充分利用其并行处理及全局搜索能力,提高数据分类质量、降低问题规模、消除冗余属性、加快数据处理速度;在KDD CUP1999数据集上进行实验,结果表明与遗传算法以及粒子群算法相比,该方法可以更有效地精简特征,提高分类质量. 相似文献
20.
特征选择的优化算法研究 总被引:1,自引:0,他引:1
目标识别成为战争胜败的关键,而对目标识别的关键之一是对目标特征的提取与选择.因此,特征的选择尤为重要.为了提高效率,通过一种算法选择较少(优化)的特征是所希望的.鉴于此该文简单介绍基于扩张矩阵与粗集理论的算法、启发式搜索算法、自适应神经网络、混沌神经网络等几种典型特征选择的优化算法的原理,并比较它们的性能,在此基础上提出了一种结合混沌神经网络和自适应神经网络的特征选择的改进方法,并对其原理进行简单介绍.最后用MATLAB编程验证启发式搜索算法特征选择的有效性. 相似文献