共查询到20条相似文献,搜索用时 11 毫秒
1.
基于Lasso特征选择的方法比较 总被引:1,自引:0,他引:1
刘晓宁 《安徽电子信息职业技术学院学报》2014,13(1):26-30
模型和特征选择是统计学中较为重要的问题之一。Lasso是一种基于一范式的特征选择方法,与现有特征选择方法比较,Lasso不仅能够准确地选择出重要变量,同时还具有特征选择的稳定性。文中对线性回归模型中变量选择的Lasso算法、基于线性模型的Lasso、Lars、Adaptive-lasso、elastic net等方法进行了比较,指出了它们间的联系,并通过对几个选自UCI数据集的数据进行对比验证,给出了变量选择方法的具体实现。 相似文献
2.
Kalman滤波模型中三种残差的比较 总被引:1,自引:0,他引:1
Kalman滤波中不可避免地存在模型误差,模型误差的存在会引起滤波结果失真,严重时还会导致滤波发散。在对Kalman滤波模型进行检验时,有三种常用的残差——观测残差,预测残差和状态预报值残差。以往不同学者选用不同的残差对模型进行检验。当模型含有误差时,分别推导这三种残差变化后的表达式并对它们检验模型误差的能力进行比较,结果表明预测残差在模型检验中反应最灵敏,并且计算量最小。最后给出仿真算例,结果也证实预测残差能够更有效、更快捷地探测模型误差。 相似文献
3.
信息传输的快速性及其准确性是车联网(VANETs)中车辆间通信的关键,将协同通信引入车联网并针对不同情况选择合适的自适应协同通信算法十分重要。在车联网中,首先提出了三种不同的自适应协同通信算法,即随机选择传输路径算法(RP)、基于最佳信道特性的传输路径算法(OPCG)与基于丢包率最小的传输路径算法(OPLR);然后研究了不同路径衰落指数与不同中继节点运动速度下三种算法的系统误码率(SER)性能;最后比较三种算法的性能并分别给出了其相应的应用场景。仿真结果表明,OPCG算法性能最优,但车辆低速行驶时RP算法即可满足要求,OPLR算法则适用于时延不敏感的场景。 相似文献
4.
一种新的混合特征选择方法RRK 总被引:1,自引:1,他引:1
提出一种新的基于包装方法和过滤器方法的混合特征选择算法RRK。该算法主要包括两个方面:①在特征预选阶段,提出一种基于ReliefF算法的特征加权算法NReliefF和降维算法DR,以实现特征加权并去掉不太重要的特征;②在特征选择阶段,把NReliefF算法和KNN算法结合起来,将预选特征作为输入,用分类正确率来选择最优特征。分别采用一个实际的乘员类型数据集和UCI上的imagine标准数据集进行了实验。实验结果表明,采用RRK后分类的效率和正确率都有明显提高。 相似文献
5.
一种基于文本分类的特征选择方法 总被引:1,自引:0,他引:1
文本分类中通常采用向量空间模型(VSM)来表示文本特征,如何选择最能够表达文本主题的特征词,从而减少特征空间维数,降低时空复杂度,是一个十分重要的问题。针对此问题本文提出了采用截集模糊C-均值(S2FCM)聚类进行类间特征降维,该方法以最大隶属度原则为指导,在保持模糊聚类的同时,提高收敛速度,并且能够提高特征选择的正确性。同时在算法中使用改进的隶属度、聚类中心计算方法并使用非随机方法确定初始聚类中心。最后实验表明采用该方法选择的文本特征项进行文本分类能够收到比较好的分类结果。 相似文献
6.
一种基于SVM的快速特征选择方法 总被引:2,自引:0,他引:2
针对现有特征选择方法计算量大、速度慢的缺点,提出了一种基于SVM的快速特征选择算法。该算法使用SVM作为分类器,并利用粒子群优化算法进行搜索。通过利用SVM线性核与多项式核函数的特性,减少了在特征选择中训练分类器的次数,降低了计算复杂度。实验结果表明在不损失分类精度的情况下,能显著提高特征选择的速度。 相似文献
7.
一种改进的文本特征选择方法的研究与设计 总被引:1,自引:0,他引:1
特征选择是文本挖掘技术的一个重要环节。在中文分词的基础上,通过设计一个简单的应用程序,对文本进行预处理。然后,在分析比较几种用于文本分类的特征选择方法的基础上,提出了一种基于信息增益和互信息相结合的特征选择方法。利用它对文本文档进行特征选择,抽取代表其特征的元数据或特征词条构成特征向量,降低噪音。最后通过实验来和其他几种特征选择方法作比较,分析这种方法获取文本特征的精度。 相似文献
8.
针对特征选择过程中准确率和计算效率不平衡问题,提出了一种快速特征选择框架(FFFS).基于该框架,使用最小冗余最大相关方法(MRMR)选择候选特征,借助序列前向选择方法(SFS)验证性能,并通过限定迭代次数提高计算性能.与MRMR、SFS和混合序列浮动前向选择算法(FDHSFFS)的对比实验结果表明,提出的快速特征选择算法MRMR-SFS能在预测准确率和计算效率之间取得较好的平衡. 相似文献
9.
特征选择是机器学习和模式识别等领域的重要问题之一.从特征相关性和冗余性的出发,分析了特征相关性的大小与分类能力之间的联系,并利用相关系数对相关特征和冗余特征进行预选取,然后使用顺序前向搜索方法作进一步的降维处理,得到了一种基于相关性的最优特征子集选择方法.实验结果表明,该方法是一种有效的特征选择方法. 相似文献
10.
为了在面向旅游领域的文本分类系统中选择有效的分类特征,提高分类性能,本文根据系统采用的训练集、训练过程及分类算法等因素重新对各常用的特征选择方法进行了综合实验评测,比较了五种常用的特征选择方法,对于评测结果最好的三种函数:期望交叉熵、信息增益和互信息,通过理论分析和科学实验,分别提出了不同的改进方法.实验结果表明改进的期望交叉熵方法在本应用中能够最有效地提高系统的分类性能. 相似文献
11.
针对入侵检测的需求,设计了一种攻击特征的在线选择方法。该方法不涉及专业领域知识,较为客观。通过自行设计的攻击平台,模拟了几个攻击,进行了这些攻击有关特征的选择,通过与可视化工具展示的特征值的变化情况进行对比,验证了该方法及其特征选择算法的有效性。 相似文献
12.
产品线特征模型的可变点决定了产品线实例的多样性,运用变体度来度量产品线实例数量.在特征模型的基础上分析了特征可变性类型和特征约束依赖类型对变体度的影响,提出的变体度算法不仅支持度量特征单型分解和单特征依赖的变体度,也能精确度量多型分解和多特征依赖的变体度.最后通过一个电梯控制系统实例验证了算法的有效性. 相似文献
13.
数据流环境下的高维、属性冗余、含噪音等问题是经常且可能同时存在的,在一定程度上影响了数据流的分类效果.为改善这一现状,提出一种快速、有效的数据流特征选择方法.引入统计指标IV(information value)值作为特征重要度的评价标准,在此基础上依据经验阈值来进行特征选择,从而解决了传统特征选择方法时空效率不高、区分度不明显、难以应用数据流的问题.实验结果表明:FS-IV具有较小的时间开销和较好的抗噪性能,该方法与已有的数据流分类模型相结合,在保证分类精度可比的情况下,能显著提高时空性能. 相似文献
14.
一种网络流量分类特征的产生及选择方法 总被引:1,自引:0,他引:1
在基于机器学习方法的网络流量分类系统中,特征产生及特征选择将直接影响到分类的速度及精度。针对这种情况,在特征产生方面,结合Packet-Level和Flow-Level上的信息,对报文属性(大小、个数、时间、标志位)、流的属性(时间)进行分析和研究,产生了37个网络流量统计特征。在特征选择方面,提出一种结合Filter模型和Wrapper模型的网络流量特征选择方法,实现了降维作用。实验表明,提出的方法提高了分类的精度。 相似文献
15.
文本分类面临的一个主要问题就是如何降低文本巨大的特征维数,并且保持分类精度甚至提高分类精度。针对该问题,提出了一种基于信息论的特征再提取方法,旨在删除稀疏分布的特征、保留有利于分类的特征。使用该方法时配合特征选择方法,可进一步降低特征维数。实验结果表明,该方法能将特征维数降低到几百维,而且能提高分类器的性能。 相似文献
16.
人才资本的度量方法研究 总被引:1,自引:0,他引:1
桂昭明 《武汉工程大学学报》2009,31(10)
在知识经济时代,人才资本是现代经济增长的主要生产要素.人才资本的科学度量是研究人才资本对经济增长贡献率的基础,在对人力资本的不同度量方法进行评析并论证了受教育年限方法的科学性的基础上,将人才资本从总人力资本中分离出来,进而运用Maddison方法和Schultz方法对之进行优化,得到了人才资本存量的一般计算公式. 相似文献
17.
考虑到微型计算机内存空间有限而汉字个数较多的特点,本文提出了一个适合于微型计算机处理的汉字特征选择的可分性准则函数.使用此方法进行汉字特征选择能保证不同汉字的分类特征距离较大并且同一汉字聚类性较好,使得汉字特征选取十分合理. 相似文献
18.
基于混合不确定性的特征选择方法(简称SU-P方法),利用对称不确定性找出相关特征,并利用偏相关分析去除数据集中的冗余特征.将SU-P方法与其它传统算法进行了仿真对比. 相似文献
19.
奇异特征区域在人脸直方图匹配过程具有更高的可分辨性。基于此,在人脸直方图特征匹配算法的基础上提出一种基于缩放因子的人脸直方图特征距离度量方法。该方法通过缩小直方图距离较近区域的距离、放大直方图距离较远区域的距离,并在匹配中突出高可分辨性区域,以获得更高的识别精度。实验表明该方法可以显著提高各种局部特征提取方法和直方图距离度量算法在人脸识别中的精度。 相似文献
20.
机器人在进行动态目标识别过程中,由于同一物体在运动中会引起多种目标图像参数的改变,对特征选择与提取造成困难.介绍一种新的基于遗传算法的机器人动态目标特征选择方法.用遗传算法对目标的不变矩特征进行选择.通过对特征进行二进制编码,采用类内类间距离作为适应度函数,对其进行选择和优化,获得最优特征子集.实验结果表明与其他方法相比,提高了目标的识别率. 相似文献