首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
Tabu搜索在特征选择中的应用   总被引:25,自引:0,他引:25  
研究利用Tabu搜索从大特征集中选择一组有效特征的问题.分析了Tabu搜索中表长、邻域大小和候选解数量等参数对Tabu搜索的影响.对两种特征选择的问题,与经典及最近新提出的一些特征选择方法如SFS,SBS,GSFS,GSBS,PTA,BB,GA和SFFS,SFBS等算法的实验比较表明,Tabu搜索在求解时间和解的质量上都取得了满意的结果.  相似文献   

2.
一种用于特征选择的禁忌搜索算法   总被引:1,自引:1,他引:0  
特征选择问题是机器学习和模式识别中的一个重要问题,特征的优劣直接影响分类器的设计和性能。首先介绍了禁忌搜索的基本原理,然后将禁忌搜索方法用于特征选择,并给出了新算法的实现方法及步骤。仿真实验表明,该方法在求解的效率和解的质量方面都达到了令人满意的效果。  相似文献   

3.
分类准确性是分类器最重要的性能指标,特征子集选择是提高分类器分类准确性的一种有效方法。现有的特征子集选择方法主要针对静态分类器,缺少动态分类器特征子集选择方面的研究。首先给出具有连续属性的动态朴素贝叶斯网络分类器和动态分类准确性评价标准,在此基础上建立动态朴素贝叶斯网络分类器的特征子集选择方法,并使用真实宏观经济时序数据进行实验与分析。  相似文献   

4.
容忍噪音的特征子集选择算法研究   总被引:4,自引:0,他引:4  
特征子集选择问题一直是人工智能领域研究的重要内容,特别是近几年来,特征子集选择算法研究已经成为机器学习和数据挖掘等领域的研究热点,提出了一个新的特征子集选择算法-容忍噪音的特征子集选择算法(NFS),该算法将聚类的思想引入到噪音的处理,并将Gini系数和墨西哥帽函数应用于特征选取,实现对偏吸噪音数据集的特征子集选择,实际领域的实验结果表明,NFS算法具有噪音容忍度高,选择特征代表性强和求解速度快的优点,因此能够有效地应用于实际领域。  相似文献   

5.
一种最优特征集的选择算法   总被引:16,自引:0,他引:16  
文中在实例特征矩阵的基础上,提出了一个最优特征的启发式健算法,并对该算法的有效性进行了数据测试,给出了它与特征选择的贪心算法的比较结果。  相似文献   

6.
将情感识别中的特征选择看成组合优化问题,从四种生理信号EMG、ECG、RSP、SC中抽取统计特征,将参数可调的遗传算法和K-近邻算法相结合尝试找出最能"代表"某一情感状态joy、anger、sadness、pleasure的最优情感特征组合模式.仿真表明,该方法是有效的.  相似文献   

7.
针对医学影像中高维特征的问题,提出一种用于影像组学的多级特征选择方法(MSOM-GA).用组内相关系数过滤对边界敏感的特征.用混合F-Score和信息增益的方法,去除不相关特征.用遗传算法去除冗余特征,选择最优特征子集.该算法在河南省人民医院脑胶质瘤影像数据上进行验证,实验显示,特征选择算法能显著提升特征的质量,算法的...  相似文献   

8.
一种基于关联性的特征选择算法   总被引:1,自引:0,他引:1  
目前在文本分类领域较常用到的特征选择算法中,仅仅考虑了特征与类别之间的关联性,而对特征与特征之间的关联性没有予以足够的重视.提出一种新的基于关联分析的特征选择算法,该方法以信息论量度为基本工具,综合考虑了计算代价以及特征评估的客观性等问题.算法在保留类别相关特征的同时识别并摒弃了冗余特征,取得了较好的约简效果.  相似文献   

9.
为改善遗传算法求解多目标组合优化问题的搜索效率,提出一种新的遗传局部搜索算法.算法采取非劣解并行局部搜索策略以及基于分散度的精英选择策略,并采用基于NSGA-Ⅱ的适应度赋值方式和二元赌轮选择操作,以提高算法收敛性,保持群体多样性.实验结果表明,新算法能够产生数量较多分布较广的近似Pareto最优解.  相似文献   

10.
基于传感器的行为识别是环境智能中的一个关键问题,但是"该使用哪些种类的传感器?"以及"每种传感器该使用多少个?"都还是有待解决且具有挑选性的问题。针对这些问题,提出一种基于特征选取的方法来选择传感器。实验结果显示,在OPPORTUNITY标准数据集上,1)相比于加速度传感器和陀螺仪传感器,磁性传感器的识别效果较好;2)只使用被选取的5个最好的磁性传感器特征也能达到和使用全部传感器特征类似的识别准确度。  相似文献   

11.
提出了一种基于分类性能的二维主分量特征选择方法.即将二维主分量分析中图像总体散布矩阵的特征向量在二维线性鉴别分析的目标函数上进行投影,并选择分类性更好的特征向量进行投影.另外,为了保持原有的二维主分量分析主特征的优点,对最后的投影特征向量进行组合,也就是最后的投影特征向量选取对图像重建和图像分类分别起着重要作用的特征进行组合.在XM2VTS标准人脸库上的试验结果表明,所提出的方法融合了两种具有互补性的图像并行特征,在识别性能上优于传统的二维主分量分析方法.  相似文献   

12.
针对邮件过滤系统中普遍存在的维数灾难、类别主题差异和反馈信息缺失问题,提出一种基于类别特征选择与反馈学习随机森林算法的邮件过滤模型。该方法将隐含的Dirichlet模型引入到邮件的特征选择环节,在不同类型的邮件集中建立各自的生成模型,分别搜寻构成各个主题的特征信息,有效降低冗余信息和噪声数据对分类性能的影响。反馈学习随机森林算法发挥了决策树集成与反馈学习的优势,实现邮件过滤系统的自我调节,及时捕捉垃圾邮件的变化趋势。在公开的语料库CCERT和Trec06上进行测试,并与典型算法进行比较,实验结果表明所提算法的可行性和有效性。  相似文献   

13.
特征选择算法(TFFS)存有一定的不足:集中度难于正确衡量低频繁特征项的权值;分散度忽略了互信息为负数的特征项对文本分类的影响。提出一种改进的特征选择算法(TFFSL),TFFSL对集中度、分散度做了一定的改进,避免了TFFS的缺陷,同时TFFSL结合特征项长度信息,提高了短语和词语在分类中的作用。SVM分类实验结果表明:与TFFS相比,TFFSL有更高的文本分类性能和剔除无关特征项的能力。  相似文献   

14.
文本分类是在给定的分类体系下,根据文本的内容自动确定文本类别的过程.在文本分类中,特征的提取对于分类的结果相当重要.从特征提取这一阶段出发,提出了一个集成合并的特征提取方法,该方法主要集成多种特征提取方法并合并关系密切的特征,并利用支持向量机SVM(Support Vector Machine)分类的高准确率,能够求出全局最优方法等优点来对得到的特征向量进行分类评估.实验证明,此种特征提取能够降低分类时间和提高分类的准确率.  相似文献   

15.
分析了特征选择采用互信息方法时文本分类性能较低的原因,认为与其在特征选择时倾向于选择稀有特征这一缺陷有很大关系。在此基础上,提出了一种基于分散度和平均频度的互信息特征选择方法。实验结果表明,改进后的互信息方法使文本分类性能有明显提高。  相似文献   

16.
大数据时代,数据的共享与挖掘存在隐私泄露的安全隐患。针对使用K-匿名隐藏实现隐私保护会大幅降低数据分类挖掘性能问题,提出一种基于随机森林特征重要性的K-匿名特征选择算法(RFKA)用于分类挖掘。使用随机森林特征重要性度量特征的分类性能;采用前向序列搜索策略每次选择不破坏K-匿名且分类性能最大的特征加入特征子集;使用特征子集对应的数据集构建模型进行分类实验。实验结果表明,该算法能更有效地平衡K-匿名和分类挖掘性能,且算法运行效率更高。  相似文献   

17.
Algorithms for feature selection in predictive data mining for classification problems attempt to select those features that are relevant, and are not redundant for the classification task. A relevant feature is defined as one which is highly correlated with the target function. One problem with the definition of feature relevance is that there is no universally accepted definition of what it means for a feature to be ‘highly correlated with the target function or highly correlated with the other features’. A new feature selection algorithm which incorporates domain specific definitions of high, medium and low correlations is proposed in this paper. The proposed algorithm conducts a heuristic search for the most relevant features for the prediction task.  相似文献   

18.
一种结构自适应的神经网络特征选择方法   总被引:10,自引:0,他引:10  
特征选择是数据处理的一项重要内容,现有的基于神经网络的特征选择方法没有考虑网络中隐结点数目的变化,使网络结构的特征选择过程中往往变得不合理,这阻碍了特征的进一步删除以及网络泛化性能的提高,针对以上问题提出了一种结构自适应的神经网络特征选择方法,通过交替删除网络中冗余的输入特征和隐结点,使网络结构在特征选择的过程中保持相对良好,实验表明,该方法既能快速有效地删除特征,又提高了网络的泛化性能。  相似文献   

19.
针对传统的特征选择使用阈值过滤导致有效信息丢失的问题,提出一种粗糙集的文本特征选择方法。该方法以核为起点利用特征属性的重要性和依赖性作为启发式信息进行特征选择,使文本的特征维数得到一定程度的降低。实验表明,此算法不仅易于实现而且能够有效降低特征数目,提高分类效率。  相似文献   

20.
提出多特征结合的图像分类方法,分别提取颜色特征和LBP纹理特征,同时提出Adaboost算法对特征进行选择,选择最能表示图像的特征,这样既降低了特征的维数,又提高了分类的精度。最后对基于SVM的多类图像分类方法进行了研究,提出在二类支持向量机的基础上构造多类分类器的方法,实验结果表明,提出的方法能够很好地用于图像分类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号