首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
以信息增益作为属性重要性的度量方法,提出了一种基于信息增益的属性约简算法.该算法总是优先考虑对于决策更为重要的属性,用条件属性对决策属性的信息增益作为条件属性的属性重要性度量,并以此度量作为启发式信息,算法从空集开始逐步将重要的属性加入到选择属性集,直到决策表达到一致分类时结束.并通过实例分析验证了该算法能有效地对属性进行约简,同时可以得到简单规则集.  相似文献   

2.
基于信息增益的属性约简算法   总被引:1,自引:0,他引:1  
以信息增益作为属性重要性的度量方法,提出了一种基于信息增益的属性约简算法.该算法总是优先考虑对于决策更为重要的属性,用条件属性对决策属性的信息增益作为条件属性的属性重要性度量,并以此度量作为启发式信息,算法从空集开始逐步将重要的属性加入到选择属性集,直到决策表达到一致分类时结束.并通过实例分析验证了该算法能有效地对属性进行约简,同时可以得到简单规则集.  相似文献   

3.
基于支持向量机和遗传算法的水下目标特征选择算法   总被引:6,自引:0,他引:6  
基于统计学习理论和遗传算法理论,提出了一种基于支持向量机和遗传算法相结合的水下目标特征选择算法。通过对实测数据的特征集的优化选择实验,证明了该算法的有效性和鲁棒性,它能较好地解决在复杂水下目标信号所提取的特征维数高,样本采样困难,数目偏少的实际情况下的分类识别问题。  相似文献   

4.
基于微分进化算法的SVM参数选择   总被引:2,自引:0,他引:2  
支持向量机(support vector machines, SVM)的性能在很大程度上取决于参数的设置, 所以参数选择问题一直是SVM理论和应用研究中的重点问题.SVM的参数选择本质上是一个优化搜索过程, 并且这个优化问题往往是多峰的.微分进化算法(differential evolution, DE)是一种实数编码的基于种群进化的优化算法, 具有强劲的全局搜索能力, 在多峰函数的寻优问题上已表现出优异的性能.为此, 将DE算法用于SVM参数选择, 提出了基于DE算法的SVM参数选择方法(DE-SVM).在标准数据集上的几个仿真实验证明了该方法的有效性.与基于微粒群算法(partical swarm algorithm, PSO)的参数选择方法相比, DE-SVM在复杂问题或多参数的寻优问题上具有更快的寻优速度.  相似文献   

5.
面向线性不可分的未知格式网络数据,提出了一种基于支持向量机的无监督特征选择算法。该算法通过非线性映射函数将不可分的网络数据映射到高维空间中,然后在高维空间中进行无监督的特征选择。该算法在特征选择之前不需要人工构造候选特征集合,直接从原始网络数据中自动地选择关键特征。利用人工数据集和网络数据集进行的实验结果表明:本文算法在特征选择可行性和有效性方面都有良好的表现。  相似文献   

6.
基于SVM特征选择的整经轴数预测算法   总被引:1,自引:2,他引:1  
提出了一种基于改进支持向量机(SVM)特征选择算法及神经网络的整经轴数预测算法,该算法采用改进SVM算法选择影响整经轴数的关键特征,在此基础上利用前馈神经网络获得整经轴数的预测值. 在数值计算及实际制造企业的应用效果表明该算法有效,能满足实际棉纺生产过程整经轴数预测的需要.  相似文献   

7.
JMVC编码器采用全搜索算法在视点间和时间参考帧中遍历所有可能的预测模式选择最优, 以获得最佳编码质量, 在获得高压缩比的同时也带来非常高的编码复杂度, 严重影响多视点视频的实际应用.针对此问题, 利用JMVC多视点视频编码模型提出一种基于SVM的多视点视频编码快速宏块模式选择算法, 利用SVM方法训练参考视点中提取到的相关信息, 进行分级3层的SVM归类.对采用的3层分类策略进行讨论, 并对特征参数的选取进行详细描述.实验结果表明, 与JMVC全搜索算法相比, 本文算法可在保持视频编码质量的同时节省大量编码时间.  相似文献   

8.
针对数据挖掘算法在预测电信客户离网时存在的过拟合问题,提出一种基于特征选择和支持向量机的电信客户离网预测算法。将原始的电信数据分别进行数据缺失值填充、数据冗余识别、数据结构化和数据归一化等预处理,得到利于分析处理的规范性数据;利用信息增益完成特征选择,提取影响客户离网的主要因素,降低数据维度,防止出现过拟合现象。将经过特征选择后的数据作为支持向量机算法的输入数据对客户是否离网进行分类,预测客户是否存在离网行为。测试结果表明,该算法预测离网客户的正确率为86%,提升了离网客户预测准确率。  相似文献   

9.
文本倾向性分类可以广泛应用到信息检索,产品质量在线跟踪,民情民意调查分析以及聊天系统等.本文提出了基于限定词性词语与信息增益、基于情感倾向词汇与信息增益的两种混合特征选择方法,并设计了基于支持向量机的分类器.以汽车产品、篮球赛事以及中日关系3种中文评论文本为训练与测试语料,对本文所提方法进行了实验验证,结果表明:限定词性词语与信息增益的混合特征选择优于信息增益与情感倾向词汇混合特征选择方法.  相似文献   

10.
基于支持向量机和遗传算法的特征选择   总被引:1,自引:1,他引:1  
支持向量机是一个具有多类分类能力的非线性分类器,利用特征集中的不同特征组合构成特征子集,所提供的数据在支持向量机上的平均正确分类率为目标函数值,利用遗传算法在整个特征组合空间中搜索能实现平均正确分类率最大化的最优特征子集。  相似文献   

11.
Iterative Dichotomiser version3(ID3)算法是数据挖掘中经典的决策树分类算法,其核心是分裂训练集属性的选择标准,即分裂前后的信息增益量最大,用该标准选择属性时对于取值较多的属性具有较强依赖性。剖析了ID3算法存在的不足并加以改进,引入了属性关注度,提出了改进算法AAID3算法。实验表明改进算法对原ID3算法的取值偏向问题有所克服并使分类更加准确,决策树更加简明。  相似文献   

12.
针对经典属性约简算法不能有效适应大数据集的问题,通过分析经典属性约简算法的特点,提出了一种改进的基于条件信息熵的属性约简算法.该算法以分类为基础,引入了类分布链表,将条件信息熵和成熟的数据库技术相结合,解决了内存限制问题,优化了算法的结构,同时加快了决策表的运行速度.最后通过实例对算法的有效性和可伸缩性做了分析.实例仿真计算表明,该算法在具有更快的约简速度的同时又不失其准确率.  相似文献   

13.
属性约简是粗糙集理论研究的重要内容之一,是在保持信息系统分类能力不变的基础上,删除冗余属性.为了获得决策系统中属性最小相对约简,本文将信息论应用于决策信息系统属性约简中,与遗传算法相结合,并采用加权平均的属性重要度和知识量作为启发式信息指导约简,提出了一种改进的基于核子集的属性约简算法.  相似文献   

14.
针对文献[8]中加权平均属性重要度中权值人为确定的不足,提出改进的属性重要度定义,并以实例说明其应用情况.提出约简质量的定义,从属性约简率和近似质量两方面来衡量约简效果.基于改进的属性重要度定义(标准),构造了两种启发式属性约简算法,并利用UCI数据库中的一些典型算例验证了算法的有效性;说明在某些情况下,提出的属性约简算法在一定程度上能够提高数据的约简质量.  相似文献   

15.
在不完备序信息系统中,通过引入包含度的概念,对属性重要度进行了定义;在此基础上,提出了一种基于包含度的属性约简算法;最后,通过实例分析表明,该算法能得到不完备序信息系统的一个约简.  相似文献   

16.
基于信息概念格,给出了信息形式背景下协调集的判定定理.同时区分了在信息概念格属性约简中起不同作用的属性,给出了各类属性的特征和判别方法.  相似文献   

17.
基于遗传算法的SVM参数选取   总被引:8,自引:0,他引:8  
支持向量机(SVM)是一种非常有前景的学习机器。然而在实际应用中,SVM的参数选取问题一直没有得到很好的解决,这在很大程度上限制了它的应用。为了能够自动地获得最佳参数,提出了基于遗传算法的SVM参数选取方法。该方法首先通过分析SVM参数对其性能的影响来确定遗传算法的搜索区间,然后在该区间内对搜索的参数进行选取。将该文提出的方法应用于5个由R tsch收集的标准模式库,实验结果表明由该方法所得参数确定的SVM具有较优的识别率和较简单的结构,即具有较佳的整体性能。  相似文献   

18.
结合ReliefF和互信息的多标签特征选择算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对传统单标签特征选择算法不能直接应用于多标签数据的问题,提出一种多标签特征选择算法——MML-RF算法.在ReliefF的基础上,MML-RF算法提出新的类内最近邻样本查找方式,并结合多标签的贡献值改进特征权值的计算方法,能很好地适应多标签数据的特点;同时为了减少特征冗余,MML-RF算法以互信息作为特征冗余度量方式,提出一种去冗余方法,能够得到更小的特征子集.实验表明,MML-RF多标签特征选择算法得到的特征子集规模较小,且在多标签数据集上具有很好的分类效果,能够提升多标签学习和数据挖掘工作的效率.  相似文献   

19.
分类器的模型参数对分类结果有直接影响.针对引入无关样本的Universum SVM算法中模型参数选择问题,采用粒子群优化(particle swarm optimization,PSO)算法对其进行优化.该方法概念简单、计算效率高且受问题维数变化的影响较小,可实现对多个参数同时优选.此外,在PSO中粒子适应度函数的选择是一个关键问题.考虑k遍交叉验证法的估计无偏性,利用交叉验证误差作为评价粒子优劣的适应值.通过舌象样本数据实验,对参数优选前后测试样本识别正确率进行比较,实验结果验证了该算法的有效性.  相似文献   

20.
产品评论的情感倾向性分析是一个很有研究价值的领域,可以帮助客户、商家进行决策。针对产品评论中的属性词和情感词在文本中的各种关系,制定了8组特征选择规则,利用SVM算法训练模型来判断属性词和情感词的搭配识别,进而依据情感词及否定词等分析属性特征的情感倾向。实验结果表明:提出的基于S V M的搭配识别方法,在识别属性特征与情感词的搭配方面具有不错的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号