共查询到19条相似文献,搜索用时 105 毫秒
1.
2.
3.
以氨基酸含量为特征向量,研究了SVM和KNN预测蛋白质耐热性的准确度。结果表明,基于SVM的分类效果较好,其局部预测率和全局预测率分别为82.4%和83.4%;而基于KNN方法的局部预测率和全局预测率分别为77.6%和79.9%。两种方法的预测率均表明氨基酸含量是影响蛋白质耐热性的主要因素。 相似文献
4.
针对传统支持向量机(SVM)多分类一对多算法存在的运算量大、耗时长、数据偏斜以及对最优超平面附近点分类易出错问题,提出了一种改进方法。将数据空间分为密集区和稀疏区,各类中密集点归于密集区,其余归于稀疏区。将每类中密集点连同它附近的点用于训练得到相应的SVM分类器。在测试阶段,对密集区的待测样本用传统的一对多判别准则来做类别预测;对稀疏区的待测样本则采用K近邻(KNN)算法。数值实验结果表明,改进的算法在耗时和分类精度上都优于原算法,对解决一对多算法存在的问题有较好的成效。 相似文献
5.
针对相关向量机(RVM)算法分类精度低、核参数选择困难等问题,文中提出临界滑动阈值的概念并以其为基础将RVM与K近邻(KNN)算法结合构建分类器——KNN-RVM分类器。从理论上提出并证明KNN-RVM分类过程等价于带软间隔约束的支持向量机的分类过程、KNN-RVM分类器等价于每类只选一个代表点的1-NN分类器、KNN-RVM分类效果优于RVM这3个结论。对这3个不同数据集进行实验证明临界滑动阈值的临界性与滑动性及KNN-RVM分类器的准确性、适应性及全局最优性,提高分类精度,减轻算法对核参数的依赖性,进而证明KNN-RVM分类器是一种有效的分类器。 相似文献
6.
提出了一种基于PIDC和二叉决策树SVM的人耳识别方法。采用PIDC方法以类间概率信息距离为监督提取人耳特征,降低了提取特征的维数;将PIDC方法与二叉决策树SVM分类方法相结合,实现了利用多类间概率信息距离监督人耳特征提取和分类。利用该方法对400个人耳进行识别实验,并将识别结果同PCA方法进行了比较,实验表明,文中方法降低了分类难度,提高了人耳识别率。 相似文献
7.
支持向量机(Support Vector Machine,SVM)是一种基于统计学习理论的机器学习方法,由于其出色的学习性能,早已成为当前机器学习界的研究热点;而决策树是一种功能强大且相当受欢迎的分类和预测工具。本文重点介绍支持向量机与决策树结合解决多分类问题的算法,并对其进行评析和总结。 相似文献
8.
KNN算法是一种在人工智能领域如专家系统、数据挖掘、模式识别等方面广泛应用的算法。该算法简单有效,易于实现。但是KNN算法在决定测试样本的类别时,是把所求的该测试样本的K个最近邻是等同看待的,即不考虑这K个最近邻能表达所属类别的程度。由于训练样本的分布是不均匀的,每个样本对分类的贡献也就不一样,因此有必要有区别的对待训练样本集合中的每个样本。利用聚类算法,求出训练样本集合中每个训练样本的隶属度,利用隶属度来区别对待测试样本的K个最近邻。通过实验证明,改进后的KNN算法较好的精确性。 相似文献
9.
通过实验对SVM、KNN文本分类算法进行了深入探讨。基于KNN和SVM算法,提出了一种SVM.KNN算法。该算法结合KNN和SVM两种分类器,并通过分类预测概率的反馈和修正来提高分类器性能。在CWT100G中文网页分类测试系统中,对SVM.KNN算法的实际效果进行了测试和算法性能验证。 相似文献
10.
11.
利用GA与SVM对NIDS进行关键特征提取 总被引:2,自引:0,他引:2
入侵检测是网络信息安全系统的重要组成部分,而检测特征数量的多少是影响整个入侵检测系统性能的重要因素。介绍了一种减少冗余特征、确定关键特征的方法。这种方法以检测精度为基准,借助遗传算法(GA)寻优,利用支持向量机(SVM)评价,根据统计学原理进行重要性排序。最后按照排序,根据检测精度和误判率变化情况减少冗余,确定关键特征。实验结果理想,并且,与文献[1,2]相比,关键特征更少,说明这种方法是科学的,是完全可行的。 相似文献
12.
支持向量机是在统计学习理论基础上发展起来的新一代学习算法,适宜构造高维有限样本模型,具有很好的分类精度和泛化性能。文中介绍了中文文本分类过程,将支持向量机应用于中文文本分类模型中,对分类器参数选择进行了分析和讨论。实验分析表明,该系统在较小训练集条件下可以取得较好的分类效果。 相似文献
13.
14.
情感分类是一项具有较大实用价值的分类技术,它可以在一定程度上解决网络评论信息杂乱的现象,方便用户准确定位所需信息。目前针对中文情感分类的研究相对较少,该文考虑将一些网络评论进行情感分类,判断一篇评论是正面还是反面。文本分类的机器学习方法较多,该文采用支持向量机的方法进行分类。该文特点在于采用具有语意倾向的词并综合其词性作为特征项.采用TF—IDF的值作为特征项权值。实验表明,用这种方法对网上的一些评论进行分类可以达到一个高的准确率。 相似文献
15.
情感分类是一项具有较大实用价值的分类技术,它可以在一定程度上解决网络评论信息杂乱的现象,方便用户准确定位所需信息。目前针对中文情感分类的研究相对较少,该文考虑将一些网络评论进行情感分类,判断一篇评论是正面还是反面。文本分类的机器学习方法较多,该文采用支持向量机的方法进行分类。该文特点在于采用具有语意倾向的词并综合其词性作为特征项,采用TF-IDF的值作为特征项权值。实验表明,用这种方法对网上的一些评论进行分类可以达到一个高的准确率。 相似文献
16.
文本分类技术是文本数据挖掘的基础和核心,是基于自然语言处理技术和机器学习算法的一个具体应用。特征选择和分类算法是文本分类中两个最关键的技术,该文提出了利用潜在语义索引进行特征提取和降维,并结合支持向量机(SVM)算法进行多类分类,实验结果显示与向量空间模型(VSM)结合SVM方法和LSI结合K近邻(KNN)方法相比,取得了更好的效果,在文本类别数较少、类别划分比较清晰的情况下可以达到实用效果。 相似文献
17.
支持向量机多类分类方法 总被引:30,自引:0,他引:30
支持向量机本身是一个两类问题的判别方法,不能直接应用于多类问题。当前针对多类问题的支持向量机分类方法主要有5种:一类对余类法(OVR),一对一法(OVO),二叉树法(BT),纠错输出编码法和有向非循环图法。本文对这些方法进行了简单的介绍,通过对其原理和实现方法的分析,从速度和精度两方面对这些方法的优缺点进行了归纳和总结,给出了比较意见,并通过实验进行了验证,最后提出了一些改进建议。 相似文献
18.
基于SVM的图像分类研究 总被引:1,自引:0,他引:1
图像分类技术有着重要的应用前景,而且对于基于内容的图像检索的发展会有积极的推动作用。多类图像分类是图像分类中的难点,对基于SVM的多类图像分类方法进行了研究,提出在二类支持向量机的基础上构造多类分类器的方法,实验结果证明和传统方法相比,分类准确率有了较大的提高。 相似文献