共查询到17条相似文献,搜索用时 343 毫秒
1.
毕孝儒 《电脑与微电子技术》2014,(8):3-6
针对被动机器学习在P2P网络流识别中需要大量标记训练数据的问题,提出一种改进的主动学习机制,并将其与SVM分类模型相结合运用到P2P网络流识别。在采用锦标赛方法对未标记样本筛选过程中,引入样本差异性概念以避免标记样本同化而导致主动学习的早熟问题;在通过动态阈值调节因子加快主动学习收敛速度的同时,加入过拟合样本过滤策略以增强分类模型的泛化能力。理论分析和实验结果表明,该机制能有效提高未标记样本的利用率,避免主动学习可能产生的早熟收敛和过学习现象,提高P2P网络流识别精度。 相似文献
2.
P2P流的识别对于网络的维护与运营都具有重要意义,基于机器学习的流识别技术是目前研究的热点和难点内容,但目前仍然存在着建立分类模型需要大量适用的训练数据、训练数据的标记需要依赖领域专家以及因此而导致的工作量及难度过大和实用性不强等问题,而当前的研究工作很少涉及到这些问题的解决办法。针对这一问题,采用主动学习技术提取少量高质量的训练样本进行建模,并结合SVM分类算法提出了一种基于锦标赛选择的样本筛选方法。实验结果表明,其相对于已有的流识别方法,能够在仅依赖少量高质量训练样本的前提下,保证较高召回率及较低误报率,更适用于现实网络环境。 相似文献
3.
毕孝儒 《电脑与微电子技术》2014,(10):3-6
针对标准支持向量机在P2P网络流量识别中不支持增量学习的问题.提出一种适于P2P网络流量识别的SVM快速增量学习方法。在对违背Karush—Kuhn—Tucker条件的新增正负样本集分别进行聚类分析基础上,运用聚类簇中心对支持向量机训练生成一个接近增量学习最优分类超平面的过渡超平面.并以此超平面为基准确定初始训练样本集上非支持向量和支持向量的互相转化.进而生成新的样本集实现SVM增量学习。理论分析和实验结果表明。该方法能有效简化增量学习的训练样本集.在不降低P2P网络流量识别精度的前提下.明显缩短SVM的增量学习时间和识别时间。 相似文献
4.
5.
为解决监督学习过程中难以获得大量带有类标记样本且样本数据标记代价较高的问题,结合主动学习和半监督学习方法,提出基于Tri-training半监督学习和凸壳向量的SVM主动学习算法.通过计算样本集的壳向量,选择最有可能成为支持向量的壳向量进行标记.为解决以往主动学习算法在选择最富有信息量的样本标记后,不再进一步利用未标记样本的问题,将Tri-training半监督学习方法引入SVM主动学习过程,选择类标记置信度高的未标记样本加入训练样本集,利用未标记样本集中有利于学习器的信息.在UCI数据集上的实验表明,文中算法在标记样本较少时获得分类准确率较高和泛化性能较好的SVM分类器,降低SVM训练学习的样本标记代价. 相似文献
6.
P2P流媒体占用大量带宽,且容易传播病毒,有必要对其进行识别.分析了Abacus方法的不足,提出一种基于SVM概率输出的P2P流媒体识别法P-Abacus.P-Abacus将待识别样本属于已知应用可能性的大小反映在概率输出上.对输出结果进行排序,根据最大概率,判决样本是属于最大概率类应用还是未知应用,或是需要进一步判断.若需进一步判断,则通过计算前两大类构建SVM概率输出的差值,来判断样本是属于其中的一类,还是未知应用.由于SVM概率输出包含大量可用信息,使得P-Abacus具有更好的识别效果.实验表明,P-Abacus比Abacus具有更高的识别率和更低的误判率,且时间开销增加有限. 相似文献
7.
监督学习算法的一个主要困难在于需要大量标记过的训练集数据,采用人工的方法不够现实。文章提出了SVM分类器在少量标记训练样本情况下,采用Rocchio法和KNN方法从大量的未标记数据中,挑选相似度较高、区别度较大的数据加入到训练集中,弥补训练样本的不足。实验表明该算法有效地利用了丰富的未标记数据,减少了人工标记量,较好地提高了SVM分类器的性能。 相似文献
8.
针对对等网络(Peer-to-Peer,P2P)流量具有的多尺度和突变性等问题,提出了基于小波核函数的支持向量机(Support Vector Machine,SVM)的P2P流量识别算法。进一步,对常用的SVM参数训练方法训练时间过长和易陷入局部极优值等缺陷进行分析,使用混沌粒子群算法对SVM参数进行优化以提高参数训练效率和识别准确率。最后利用真实的校园网网络流量数据对所提方法的有效性进行测试,结果表明,相对于使用传统核函数和参数训练方法的支持向量机P2P流量识别方法,所提方法具有更高的P2P流量识别正确率和计算效率。 相似文献
9.
10.
11.
P2P流量逐渐成为互联网流量的重要组成部分,精确分类P2P流量对于有效管理网络和合理利用网络资源都具有重要意义。近年来,利用机器学习方法处理P2P流量分类问题已成为流量识别领域的一个新兴研究方向。利用决策树中的C4.5算法和P2P流量的特征属性来构建决策树模型,进而完成P2P流量分类问题。实验结果表明,基于决策树模型的方法能有效避免P2P网络流分布变化所带来的不稳定性;与SVM(support vector machine,支持向量机)、NBK(nave Bayes using kernel densi 相似文献
12.
13.
目前对等网络(Peer-to-Peer,P2P)流量的识别是网络管理研究的热门话题。基于支持向量机(Support Vector Machine , SVM)的P2P流量识别方法是常用的P2P流量识别方法之一。然而SVM的性能主要受参数和其使用特征的影响,而传统的方法则是将SVM的参数优化和特征选择问题分开处理,因此这样很难获得整体性能最优的SVM分类器。本论文提出了一种基于最优人工蜂群算法和支持向量机相结合的P2P流量识别方法,利用人工蜂群算法,将SVM的参数和特征选择问题视为最优化问题同步处理,可以获得整体性能最优的参数和特征子集。在真实的P2P数据上的实验结果表明提出的方法具有很好的自适应性和分类精度,能够同时获取特征子集和SVM参数的最优解,提高SVM分类器的整体性能。 相似文献
14.
15.
P2P流量逐渐成为互联网流量的重要组成部分,但在对Internet起巨大推动作用的同时,也带来了因资源过度占用而引起的网络拥塞以及安全隐患等问题,妨碍了网络业务的正常开展.首先介绍了各种P2P流量识别方法及其优缺点,然后提出一种基于损失函数机制的支持向量机算法,用于实时P2P流量检测,并构建了一个基于本算法的检测控制模型.实验结果显示,该算法更符合P2P流量的实际检测要求,具有更好的检测精度. 相似文献
16.
P2P流量逐渐成为了互联网流量的重要组成部分,在对Internet起巨大推动作用的同时,也带来了因资源过度占用而引起的网络拥塞以及安全隐患等问题,妨碍了正常的网络业务的开展.首先介绍了各种P2P流量识别方法及其优缺点,然后提出一种基于方差分析的P2P流量特征选择方法和基于该方法的支持向量机技术在P2P流量准实时检测中的应用模型.实验结果及分析表明,该方法能较有效地检测P2P流量并具有更好的检测精度. 相似文献