首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 484 毫秒
1.
针对核空间中大数据集的计算代价高问题, 提出用NSVM方法减少分类器的训练数据. 先用NSVM、核主成分分析(KPCA)和贪婪KPCA分别从全部训练数据中提取训练分类器的子集; 再用子集训练分类器, 并用训练和测试数据的错分率对分类结果进行评价. 在两个数据集和两种分类器中, 用KPCA提取的子集训练的分类器的分类性能弱于NSVM和贪婪KPCA, 但用贪婪KPCA提取的子集训练的分类器的泛化能力弱于NSVM. 仿真结果表明, 用NSVM方法提取的子集训练的分类器, 不仅保证了分类器的泛化能力, 也降低了分类算法的计算复杂度.  相似文献   

2.
基于随机子空间的多分类器集成   总被引:2,自引:0,他引:2  
提出了一种基于随机子空间的多分类器集成算法RFSEn.首先选择一个合适的子空间大小,然后随机选择特征子集并投影,并得到子空间上的基分类器,从而通过基分类器构成集成分类器,并由集成分类器来进行文本的分类.将该算法与单一分类器和基于重抽样技术的bagging算法进行了比较,在标准数据集上进行了实验.结果表明,该方法不仅优于单一分类器的分类性能,而且一定程度上优于bagging算法.  相似文献   

3.
针对贝叶斯(Naive Bayes,NB)分类器的集成学习方法,研究如何提高分类器集成中各成员分类器之间的多样性,同时提高分类器系统准确率。实现方法是把训练集的所有属性特征划分特征子集,并处理所划分的属性特征子集,最后为每个成员分类器构造出不同的完整特征属性训练集。研究结果表明采用的NB集成方法(Ensemble of Naive Bayes,ENB)提高了分类性能,把ENB机器学习方法应用到自动图像标注中也获得了很好的效果。  相似文献   

4.
为降低噪声和异常值对集成剪枝的影响,并鲁棒性地选择更稀疏的基分类器子集,从而提升人脸情感识别的性能,提出了一种具有依赖分数的鲁棒性稀疏低冗余集成剪枝方法用于人脸情感识别。首先,该方法将样本实例的预测结果视为基分类器特征,分别利用互信息和熵来评估成对基分类器之间的依赖性和它们之间的优先级。其次,将优先级依赖关系添加到基于回归的目标方程中实现冗余基分类器的修剪,此目标方程使用l2,1范数来增加分类器子集的鲁棒性从而提升算法的泛化性能。然后,将内积正则化项引入到目标方程中,通过计算分类器特征系数向量内积的绝对值的和去选择稀疏和低冗余的基分类器。最后,使用大多数投票法对选择的基分类器子集进行集成从而得到最终的识别结果。结果表明:本文提出的方法在FER2013、JAFFE、CK+和KDEF 4个公共人脸情感数据集上的识别准确率,比所有基分类器进行集成得到的准确率分别高3.29%、10.39%、1.76%和4.89%,表明该方法可以选择出识别效果更好、冗余度更低的分类器子集,提高集成剪枝的泛化能力。  相似文献   

5.
垃圾网页检测存在数据不平衡、特征空间维度较高的问题,为此,提出一种基于随机混合采样和遗传算法的集成分类算法.首先,使用随机混合采样技术,通过随机抽样,减少多数类样本数量,用少数类样本合成过采样技术方法生成少数类样本,获得多个平衡的训练数据子集;然后使用改进的遗传算法对训练数据集进行降维,得到多个具有最优特征的训练数据子集;使用极端梯度算法(XGBoost)作为分类器,训练多个平衡数据子集,用简单投票法对多个分类器进行集成,得到新的分类器;最后对测试集进行预测,得到最终预测结果.实验结果表明,提出算法的分类结果与XGBoost的结果相比,准确率提高了约19.25%,且减少了建立学习模型的时间,提高了分类性能,是一种较好的分类算法.  相似文献   

6.
基于基因表达谱的结肠癌特征基因选取   总被引:2,自引:0,他引:2  
在分析肿瘤基因表达谱的基础上,运用模式识别方法选取结肠癌特征基因.利用浮动顺序搜索算法在结肠癌基因表达谱数据中生成若干个候选特征基因子集,再以RBF支持向量机作分类器,以其在训练集和测试集中的错误分类率为依据,从候选特征基因子集中选取结肠癌特征基因集合.实验结果表明了该方法的可行性和有效性.  相似文献   

7.
该文提出一种基于随机森林的不完整数据集的多功能雷达(MFR)辐射源识别方法,该方法在MFR辐射源波形单元识别框架基础上,首先对参数缺失的先验知识集进行多重划分,得到多个不含缺失参数的样本子集,然后删减冗余子集并利用随机森林算法对各个子集构建弱分类器,最后根据弱分类器对识别结果贡献率的不同,进行权值设定,得到最终的识别模型。仿真实验证实了提出的MDRF-WA方法能够提高少量先验知识条件下波形单元识别的准确率和鲁棒性,降低计算成本。  相似文献   

8.
提出了一种基于HSV(Hue-Saturation-Value)空间的Haar小波特征和多SVM(Support Vector Machine)分类器的摩托车识别算法,以解决因样本比例不平衡所导致的对摩托车识别性能差的问题.首先在HSV颜色空间基于无符号小波系数构造特征提取算法,然后对训练数据应用所提出的样本重构方法得到若干训练子集,基于各个训练子集训练相应的SVM分类器,识别时将各SVM的输出结果进行融合即可得到最终识别结果.实验结果表明:该方法识别性能高,鲁棒性好,对于受数据的不平衡性严重影响的对象识别具有较好的应用和推广价值.  相似文献   

9.
该文应用蚊群算法和支持向量机实现多光谱遥感图像分类.首先提取出多光谱遥感图像的光谱特征、纹理特征和形状特征,然后利用蚁群优化算法从提取出的多维特征空间中选择最优的特征子集向量,最后将特征子集作为支持向量机分类器的输入量实现分类.实验结果显示,较传统的K均值方法文章给出的方法能够提高遥感图像的分类精度.  相似文献   

10.
在多标记学习中,标记之间往往既不是完全独立也不是完全排斥的,因此在构建多标记分类器时要充分利用标记之间的依赖关系.目前利用标记间关系的方法有将标记集合划分为子集和将各标记间关系表示为链式两种.本文提出了一种结合上述两种思想的算法,首先根据标记对间的依赖度量值来启发式地对标记集合进行划分,然后在最终的划分子集合间依次建立分类器组成分类器链.通过与其他算法的比较,实验结果表明该算法能提升分类器性能.  相似文献   

11.
为了解决传统的辨识矩阵空间复杂度高,难以应用于大规模数据的问题,提出了一种基于随机抽样的属性约简算法.首先随机抽取多个小样本子集,以降低辨识矩阵的空间复杂度; 然后分别对每个样本子集进行属性约简,并计算每个属性子集的权重; 最后选择高权重的几个属性子集进行测试,找出精度最高的属性子集.实验结果证明,本文方法比传统辨识矩阵的占用空间降低2~3个数量级,并且精度与其基本相当.  相似文献   

12.
一种基于互信息增益率的新属性约简算法   总被引:13,自引:1,他引:13  
为了获得决策系统中更好的相对属性约简,提出了一种基于互信息增益率的属性约简算法.该算法考虑了所选择条件属性与决策属性的互信息,还考虑了所选择属性的值的分布情况,从信息论角度定义了基于互信息增益率的属性重要性度量方法,并以此度量为启发式信息,算法从空集开始逐步将最重要的条件属性加入到选择属性集,直到所选择的条件属性集与决策属性集的互信息等于整个条件属性集与决策属性集的互信息时,算法停止.结果表明,算法能更有效地对决策系统进行约简,同时约简后的对象数目较少.  相似文献   

13.
针对属性特别多仅用一种属性约简方法难以实现有效约简的情况,提出了基于双重属性约简的混合支持向量机分类方法.通过引入贡献率和正确率两个概念,首先采用主成分分析算法计算各个条件属性的贡献率,根据贡献率大小和给定的阈值去掉条件属性中贡献率小的成分,提取信息量最大的主要成分;然后再基于粗糙集的属性约简理论,计算这些主要成分对决策变量的正确率,对这些属性进行第二次约简;该方法采用定性定量相结合的方式,可以最大程度地去除属性集中冗余的或不重要的属性,保证将最简的属性样本集输入支持向量机进行建模预测.最后的仿真试验验证了我们所提方法的有效性和正确性.  相似文献   

14.
为获取连续属性值数据集的最小属性子集,提出了一种两步约简方法.该方法以模糊粗糙集模型为基础,将描述条件属性和决策属性依赖关系的模糊依赖度概念进行了扩展,使其能对条件属性之间的依赖关系进行度量,利用属性与类别之间的依赖度选出候选属性集,然后根据单个属性与类别和属性之间的依赖度对候选属性集进行约简.仿真结果表明,该方法在有效降低属性维数的同时一定程度上保证了分类正确率.  相似文献   

15.
针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中心点选取的随机性,同时利用信息熵确定数值数据的属性权重,并对分类属性度量公式进行改进,给出了一种混合属性数据度量公式.结果表明,改进后的算法具有较高的准确率,能够有效处理混合属性数据.  相似文献   

16.
提出一种基于信息测度对取值范围大的属性进行分划(分类)的方法,即开始对属性的值域划分为两类,其分断点为使信息获取量为最大,再划分为三类,也取其分断点(两个)为使信息获取量为最大值,当增加分类不能较多地提供信息获取量或分类数为预先约束范围,则终止划分,并通过例子说明此算法的具体应用。  相似文献   

17.
为选择有代表性的、较全面反映链路质量的参数,提出了基于动态直觉模糊多属性决策的链路质量参数优选方法.从链路质量评估的稳定性和敏捷性出发,以4种不同链路质量等级下的决策矩阵作为优选依据,采用优劣解距离法得到备选参数集的排序,并进行筛选,根据贴近度对筛选后的备选参数集进行加权平均融合,得到优选的基于动态直觉模糊多属性的链路质量参数.实验结果表明,与平滑后的包接收率、模糊链路质量评估器(F-LQE)相比,采用优选的链路质量参数具有较强的稳定性和敏捷性.  相似文献   

18.
通过OSEM算法在不同子集下重建图像的仿真研究,分析在相同迭代次数和时间下子集数对重建图像收敛速度的影响,得到对含噪声的投影数据在子集数多时重建图像会随着迭代次数的增加而变差.若采用序列划分子集(即子集数由多到少)重建图像则可避免这种情况.通过对各种子集分类在相同时间内重建图像误差的比较,得到序列划分子集方法能在较少迭代次数和较短时间内得到好的重建图像.  相似文献   

19.
属性区间识别模型在溃坝后果综合评价中的应用   总被引:2,自引:0,他引:2  
溃坝后果严重程度综合评价是大坝风险评价与风险管理的重要组成部分.针对溃坝后果综合评价指标体系的模糊性与不确定性,以属性区间识别理论为基础,建立了溃坝后果综合评价的属性区间识别模型,采用均化系数将属性测度区间转化为综合属性测度;然后对熵权计算公式进行合理改进,并有效选择偏好系数将主客观权重有机结合得到了理想的组合权重;最后分别根据置信度准则、灰色接近度和样本评分准则进行溃坝后果等级识别和比较排序分析.实例研究表明,该模型简单方便、合理有效,为溃坝后果综合评价提供了一种新方法.  相似文献   

20.
针对未知恶意代码数量急剧增长,现有的检测方法不能有效检测的问题,提出一种基于属性相似度的恶意代码检测方法.该方法将样本文件转换成十六进制格式,提取样本文件的所有n-gram,计算每个n-gram的信息增益,并选择具有最大信息增益的N个n-gram作为特征属性,分别计算恶意代码和正常文件每一维属性的平均值,通过比较待测样本属性与恶意代码和正常文件两类别属性均值的相似度来判断待测样本类别.结果表明,该方法对未知恶意代码的检测性能优于基于n-gram的恶意代码检测方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号