共查询到18条相似文献,搜索用时 62 毫秒
1.
黄永毅;龚垒 《电子技术与软件工程》2016,(14):168
本文以支持向量机文本分类方法为基础,针对学习过程中样本较少、分类精度不高的问题,提出基于主动学习的交互式支持向量机文本分类方法,即依据已知样本设计分类规则,然后通过主动学习提取不确定样本,二次构建交互式分类器。实验表明,该方法优化了文本分类器学习能力,具有更好的推广能力。 相似文献
2.
3.
针对支持向量机(svM)模型不能有效处理海量数据挖掘的问题,提出一种改进的基于主动学习的支持向量机(AL_SVM)方法。该方法首先将训练集随机划分为多个独立同分布的子集,并选择其中一个子集作为初始训练集来训练SVM得到初始分类器和支持向量集,然后根据已经得到的分类器信息在剩余样本集中选择对于分类器改进作用最大的有价值样本。并与已得到的支持向量集合并构成新训练集,以更新分类器,从而在保留重要支持向量信息的前提下,去除大量不重要的支持向量,一定程度上避免了过学习问题,提高了学习效率。实验表明,AL_SVM方法能够在保持学习器泛化能力的同时提高其学习效率。 相似文献
4.
5.
入侵检测研究中,采用基于支持向量机的主动学习算法,有效地降低了学习的样本复杂度.针对支持向量机主动学习算法中存在的随机构造的初始训练集样本质量不高和容易陷入次优等问题,提出了一种结合核空间聚类的初始训练集构建方法,并在距离准则的基础上引入了概率选择机制.仿真实验表明,在不降低检测效果的前提下,该算法所需的学习样本更少,并表现出较高的稳定性. 相似文献
6.
亓沂滨 《电子技术与软件工程》2013,(15):18-19
随着信息技术在人类生活各个方面的深入,信息网络中所包含的牵涉个人及国家利益的信息业变得越来越多,利益的存在滋生了网络攻击。网络攻击通过各种不法手段,来窃取其所需要的网络信息。本文重点研究了支持向量机主动学习的通信网络入侵检测算法的优化设计,主要研究支持向量机设计到的风险函数、支持向量机的原理、支持向量机的分类和回归,深入探讨了主动学习的流程和结构,对主动学习中的学习算法做了深入研究,研究其各种相关定义以及其的学习过程和查询过程。 相似文献
7.
针对传统的二分类支持向量机在数据种类繁多并含有很多不带标签的样本时的固有缺陷,提出了一种主动学习与非平衡二叉树结合的多类分类支持向量机.该方法首先通过类距离构造一个非平衡二叉树结构,从易到难依次构造节点,将最容易分出的类放在根节点,然后利用主动学习策略,自动为选择的样本添加标签,并添加到训练样本集中.实验结果表明本文提出算法性能优于常规主动学习支持向量机,有效提高了分类精度,且大大缩短了算法运行时间. 相似文献
8.
网络新闻自动分类已经成为当下的热点问题,SVM分类算法是文本分类中应用较为成熟的一种方法.文章针对SVM文本分类中特征选择和核函数选择的两个重要问题,在新闻文本实验环境下进行了探讨,结果表明使用互信息特征选择法且特征数在4000左右,使用SIGMOID核函数的情况下准确率与召回率均可达到97%的分类效果. 相似文献
9.
由于网络的发展,中文文本的分类技术也有待提高.向量空间模型是中文文本分类中常用的模型,词作为中文文本的特征,其维数很高,如此高的维数对分类并不是都有用的.所以对特征的选择尤为重要,文章通过两种分类器对多种特征选择方法在同一平面内进行比较,将分类器的各种参数设为最优状态,得到了IG的分类效果较好,并且利用了平均查全率对不同的特征选择方法进行纵向与横向的比较,实验证明,SVM整体的分类效果要优于KNN的分类效果. 相似文献
10.
一种基于RVM回归的分类方法 总被引:3,自引:0,他引:3
支持向量机是用于分类与回归的技术.由于其自身的诸多缺点,如无法获得概率输出,需要估计一个误差参数C,以及必须使用Mercer核函数等.相关向量机算法,克服了SVM上述缺点,RVM能获得与SVM相比拟的推广性能,并且更为稀疏.在此基础上,文中介绍了一种RVM回归用于分类的新分类方法,用RVRC来表示.并通过实验证明了它的... 相似文献
11.
一种基于半监督学习的应用层流量分类方法 总被引:3,自引:0,他引:3
基于应用层的流量分类在用户行为识别、网络带宽管理等方面有着十分重要的应用.将机器学习应用到应用层流量分类问题中.首先提出了一种基于熵函数的组合式特征选择算法,提取了5种TCP连接的特征.针对监督学习中无法识别新流量类型的问题,提出了一种基于半监督学习的流量分类算法.实验结果表明,算法的检测率优于Kmeans方法.在少量标记样本的情况下,随着未标记样本数增加,算法的检测率在增加. 相似文献
12.
13.
14.
战车类型的识别分类是现代情报获取的重要研究内容。为了获得数据并研究战车分类算法,常进行外场真实实验,但其时间长、耗资巨大。本文在虚拟战场仿真平台上建立坦克、装甲车、运兵车三种战车模型。利用仿真环境中的战车噪声、磁场、振动特征信号作为样本数据,进行战车的分类算法研究。同时基于一对一多分类支持向量机,设计了一种战车分类算法,并给出了分类器交叉验证参数调整策略。实验表明,相比于AdaBoost算法,文章提出的战车分类算法的分类准确率较高。 相似文献
15.
深度学习就是机器学习研究的过程,主要通过模拟人脑分析学习的过程对数据进行分析。目前,深度学习技术已经在计算机视觉、语音识别、自然语言处理等领域获得了较大发展,并且随着该技术的不断发展,为网络流量分类和异常检测带来了新的发展方向。移动智能手机与大家的生活息息相关,但是其存在的安全问题也日益凸显。针对传统机器学习算法对于流量分类需要人工提取特征、计算量大的问题,提出了基于卷积神经网络模型的应用程序流量分类算法。首先,将网络流量数据集进行数据预处理,去除无关数据字段,并使数据满足卷积神经网络的输入特性。其次,设计了一种新的卷积神经网络模型,从网络结构、超参数空间以及参数优化方面入手,构造了最优分类模型。该模型通过卷积层自主学习数据特征,解决了传统基于机器学习的流量分类算法中的特征选择问题。最后,通过CICAndmal2017网络公开数据集进行模型测试,相比于传统的机器学习流量分类模型,设计的卷积神经网络模型的查准率和查全率分别提高了2.93%和11.87%,同时在类精度、召回率以及F1分数方面都有较好的提升。 相似文献
16.
针对图像分类学习不够深入的问题,提出图像分类问题的几种深度学习策略研究。通过分析当前主流的主动深度学习图像、多标签图像和多尺度网络图像三种深度学习方法的工作原理和存在的优势与不足,探讨图像分类问题的优化学习策略。随后采用图像分类问题的几种深度学习策略实验的方式加以对比,实验结果表明,参数共享的深度学习图像分类方法不仅提高了预测速度,而且还能确保模型的准确性。 相似文献
17.
18.
在分析了文本中重要事件识别和文本分类方法的基础之上,提出了一种基于重要事件的文本分类方法.重点研究了该方法涉及到的两个关键技术:以重要事件表示文本和获取文本类别的模板.在中文事件语料CEC上,使用本文介绍的文本分类方法得到的平均准确率达到80%,而使用传统的以词为特征的文本分类方法得到的平均准确率为72%. 相似文献