共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
针对SVM方法在大样本情况下学习和分类速度慢的问题,提出了大样本情况下的一种新的SVM迭代训练算法。该算法利用K均值聚类算法对训练样本集进行压缩,将聚类中心作为初始训练样本集,减少了样本间的冗余,提高了学习速度。同时为了保证学习的精度,采用往初始训练样本集中加入边界样本和错分样本的策略来更新训练样本集,迭代训练直到错分样本数目不变为止。该文提出的基于K均值聚类的SVM迭代算法能在保持学习精度的同时,减小训练样本集及决策函数的支持向量集的规模,从而提高学习和分类的速度。 相似文献
3.
针对障碍物检测中因样本量过大而造成的标记困难以及样本分布不均衡等问题,提出了一种基于AUC优化的非线性主动学习算法.该算法的计算处理过程是:首先利用基于AUC 优化的算法在训练集上对非线性分类器进行训练;然后利用已训练好的分类器对所有未标记样本进行分类;接着利用基于AUC 优化的样本选择函数计算分类后的样本的得分;最后算法根据分值大小选出最有信息量样本,并且专家根据该样本所在的图像及在图像中位置对其进行标记并放入训练集中.重复上述过程,直到AUC 收敛为止.在户外环境图像库上进行了实验,结果表明:该算法能显著减小数据标记的工作量,并能解决因样本分布不平衡而引起的次优解问题,与已有主动学习算法相比性能更优. 相似文献
4.
属性聚类算法在入侵检测中的应用 总被引:1,自引:0,他引:1
赵玲 《网络安全技术与应用》2004,(12):49-51
理论分析表明属性均值聚类是比模糊均值聚类更稳健的聚类方法,因此本文提出了基于属性均值聚类的入侵检测新方法。实验结果表明该方法对入侵检测是非常有效的。 相似文献
5.
障碍物的检测与跟踪技术是移动机器人行驶过程中的一个重要技术, 有利于提高移动机器人的运动安全. 为了提高了障碍物检测的准确率, 针对欧氏聚类存在过分割和欠分割的情况, 做出了两点改进: 提出动态欧氏聚类搜索半径的方法来解决远处点云过于稀疏的问题; 提出将半径搜索改成深度方向上的拓展搜索的方法来解决点云数据在深度方向上检测不完全和拖尾等问题. 为了提高动态障碍物跟踪的准确率, 在进行两帧障碍物数据关联时, 设计了一种新的关联矩阵的计算方式, 加入了障碍物的六自由度信息和尺寸信息, 提高了动态匹配的成功率. 仿真实验表明, 经过改进后障碍物检测准确率达到了95.2%, 多目标跟踪精度达到了13.2 mm. 相似文献
6.
针对观测场景结构复杂、建模困难的问题,提出了一种基于运动目标跟踪的场景障碍物模型检测方法.结合对目标的检测与跟踪过程,利用空间投影关系确定场景中障碍物的位置,并将其映射到场景模型上,即可得到场景观测模型.该方法只需要对目标运动进行简单地跟踪和统计,不需要进行三维结构恢复以及图像拼接处理,能够有效解决场景的在线自适应建模问题. 相似文献
7.
在K均值算法基础上,提出了改进的K均值算法(K+均值)。此方法计算每个数据对象所在区域的密度选择相互距离,最远的k个处于高密度区域的点作为初始聚类中心。将K均值算法和K+均值算法分别应用于入侵检测,试验结果表明:K+均值算法能够避免K均值算法固有的缺点,并且有比较高的检测性能。 相似文献
8.
李鹏飞 《计算机应用与软件》2012,(2):289-290,300
为解决模糊C均值(FCM)聚类算法在入侵检测中存在的检测效率低的问题,提出一种改进方法,将改进的模糊C均值聚类算法应用于入侵检测。测试表明,该算法有效提高了聚类检测的检测率,降低了误检测率,具有可行性和有效性。 相似文献
9.
K-means算法以其简单性和快速性在文本聚类中得到广泛应用,但是传统的K-means算法对初值的依赖性很强,需要事先给出要生成的簇的数目k,而这个参数k的确定一般是根据用户的经验知识给出的;另外,其初始聚类中心是随机选取的,这种随机性往往导致聚类结果的不德定.可以说,不同的k值和不同的初始聚类中心对聚类质量和时间效率... 相似文献
10.
聚类算法广泛应用于入侵检测系统(ID6)的数据挖掘中.虽然K-MEANS算法是最为经典的聚类算法之一,但是由于入侵检测系统的数据集具有特殊性,直接在其上进行K-MEANS聚类的效果不佳.为了提高K-MEANS在IDS数据集上的聚类准确性,引入一种数据预处理方法.该方法对IDS的记录特征做标准化处理,使原本取值范围差异很大的数值型特征在同一个区间内取值,排除原始数据中不同度量带来的不良影响,从而优化聚类的效果.仿真实验表明,K-MEANS算法对预处理后的IDS数据集的聚类准确度有很大的提高. 相似文献
11.
12.
13.
14.
支持向量机(SVM)主动学习方法研究与应用 总被引:22,自引:2,他引:22
文中介绍了一种用SVM进行主动学习的方法,解决在某些机器学习问题中,训练样本获取代价过大带来的问题。实验表明,该方法与普通SVM方法相比,在保证SVM分类器性能的前提下,可有效减少学习所需的样本数量。最后设计了一个基于该思想的邮件过滤器模型,依据该模型设计的邮件过滤器将有实时监控、自动更新邮件过滤模块的能力。 相似文献
15.
为解决监督学习过程中难以获得大量带有类标记样本且样本数据标记代价较高的问题,结合主动学习和半监督学习方法,提出基于Tri-training半监督学习和凸壳向量的SVM主动学习算法.通过计算样本集的壳向量,选择最有可能成为支持向量的壳向量进行标记.为解决以往主动学习算法在选择最富有信息量的样本标记后,不再进一步利用未标记样本的问题,将Tri-training半监督学习方法引入SVM主动学习过程,选择类标记置信度高的未标记样本加入训练样本集,利用未标记样本集中有利于学习器的信息.在UCI数据集上的实验表明,文中算法在标记样本较少时获得分类准确率较高和泛化性能较好的SVM分类器,降低SVM训练学习的样本标记代价. 相似文献
16.
入侵检测系统已经成为网络安全技术的重要组成部分。然而,传统的异常入侵检测技术需要通过对大量训练样本的学习才能达到较高的检测精度,而大量训练样本集的获取在现实网络环境中是比较困难的。本文研究在网络入侵检测中采用基于支持向量机(SVM)的主动学习算法,解决训练样本获取代价过大带来的问题。通过基于SVM的主动学习算
算法与传统的被动学习算法的对比实验说明,主动学习算法能有效地减少学习样本数及训练时间,能有效地提高入侵检测系统的分类性能。 相似文献
算法与传统的被动学习算法的对比实验说明,主动学习算法能有效地减少学习样本数及训练时间,能有效地提高入侵检测系统的分类性能。 相似文献
17.
基于学习算子的自学习遗传算法设计 总被引:2,自引:0,他引:2
遗传算子是影响遗传算法优化效果的重要因素。针对目前遗传算法研究中忽视个体能动性,没有充分利用进化经验信息的不足,提出反映个体学习能力的学习算子。给出了以个体适应度的变化方向和速度为依据的学习算子设计方法及其计算过程。在此基础上与现有的改进遗传算子结合,提出一种新的改进遗传算法-自学习遗传算法,分析了自学习遗传算法与自适应遗传算法之间在原理上的区别。以一个弹道导弹射程优化问题为算例对算法进行了性能测试,结果表明,在采用相同的改进遗传算子的条件下,学习算子能够以较低的代价提高遗传算法的收敛速度,并获得更好的最终优化结果。 相似文献
18.
随着信息时代的到来,互联网平台上的文本数据开始爆发式增长,其中难免夹杂着一些不法数据.这些数据往往隐藏在海量数据中,因此给平台检索这些不法数据增加了难度.在这种情况下再用传统的文本分类方法已经不能满足需求了.因此论文根据文本数据的特点提出了基于主动学习的SVM评论内容分类方法,该方法使用主动学习的思想将敏感词向量、k-... 相似文献
19.
在对两种SVM学习算法(SMO和SVMlight)进行分析的基础上,提出了一种改进的基于集合划分和SMO的算法SDBSMO。该算法根据样本违背最优化条件的厉害程度将训练集划分为多个集合,每次迭代后利用集合信息快速更新工作集和相关参数,从而减少迭代开销,提高训练速度。实验结果表明该算法能很好地提高支持向量机的训练速度。 相似文献