共查询到19条相似文献,搜索用时 93 毫秒
1.
目前对等网络(Peer-to-Peer,P2P)流量的识别是网络管理研究的热门话题。基于支持向量机(Support Vector Machine , SVM)的P2P流量识别方法是常用的P2P流量识别方法之一。然而SVM的性能主要受参数和其使用特征的影响,而传统的方法则是将SVM的参数优化和特征选择问题分开处理,因此这样很难获得整体性能最优的SVM分类器。本论文提出了一种基于最优人工蜂群算法和支持向量机相结合的P2P流量识别方法,利用人工蜂群算法,将SVM的参数和特征选择问题视为最优化问题同步处理,可以获得整体性能最优的参数和特征子集。在真实的P2P数据上的实验结果表明提出的方法具有很好的自适应性和分类精度,能够同时获取特征子集和SVM参数的最优解,提高SVM分类器的整体性能。 相似文献
2.
《模式识别与人工智能》2014,(5)
当特征集合存在强相关的特征子集且共同对分类问题有重要贡献时,传统方法通常从该子集中随机选择一个特征,导致数据可读性和分类性能下降.为此,面向多分类问题,提出一种基于支持向量机的特征选择算法,并设计一种快速迭代算法.该算法能够自动选择或剔除强相关的特征子集,在得到有效特征的同时实现特征降维.利用人工数据集和标准数据集进行试验,结果表明文中算法在特征选择可行性和有效性方面都有良好表现. 相似文献
3.
4.
特征选择可以选出最有利于分类的特征,加快算法的运行速度,消除冗余,提高分类准确率.文中提出了一种基于遗传算法的特征选择方法.在遗传算法中结合支持向量机和分类权值的评价准则设计并实现了适合于该模型的适应度函数,并通过实验确定其参数.设计合理的罚函数.根据特征的数量给予一定的惩罚.针对移动企业客户恶意欠费行为,提出并建立基于支持向量机的消费欺诈预警模型.实验将此特征选择方法应用于消费欺诈预警模型中,结果验证了该方法的有效性,得到了满意的分类准确率. 相似文献
5.
6.
本文先介绍了目前主流的P2P流量识别方法及其优缺点,通过实际捕包分析了BT协议的交互过程及特点。分析选取流量特征中的平均包长度、流持续时间、上下行流量包数比、目的端口等4个特征,结合支持向量机方法对网络流量的进行识别。实验结果显示,该方法能够有效地检测网络流量中的P2P流量。 相似文献
7.
8.
提出了一种基于改进遗传算法的特征选择算法。该算法以支持向量机分类器的识别率作为特征选择的可分性判据,对传统遗传算法的交叉和选择操作进行了改进,实现了指定数目的特征选择。而且算法在特征选择的过程中,还同时优化了支持向量机分类器的两个参数。实验数据的特征选择实验表明,提出的算法仅以损失2.7%识别率的代价,得到的特征维数却是传统遗传算法的1/5,极大地简化了分类器设计的复杂度。 相似文献
9.
针对多光谱图像数据维数高,数据量大的特点,鉴于自适应遗传算法在搜索最优解上特有的优点,提出了采用自适应遗传算法进行白细胞的特征提取,同时为了增强算法的稳定性,提高收敛速度,部分改进了原算法。在此基础上,利用选取的53个特征和二值支持向量机相结合,构造分类器,有效地解决了白细胞的分类识别问题。实验结果表明,改进后的算法具有更快的收敛速度,更好的稳定性,设计的分类器有效地提高了识别速度和精度,识别率达89.02%。 相似文献
10.
特征选择是模式识别和数据挖掘等研究领域的一个热点。提出了一种新的特征选择方法FeBES ( Feature Selection Based on (m+λ)-ES Evolutionary Strategy),它以遗传算法为基础,以定义的最优特征集的评价准则为适应度函数,采用(m+λ)-ES进化策略挑选出一组较高质量的特征子集。仿真实验结果表明了该方法的有效性。 相似文献
11.
针对传统支持向量机方法用于数据分类存在分类精度低的不足问题, 将支持向量机分类方法与特征选择同步结合, 并利用智能优化算法对算法参数进行优化研究. 首先将遗传算法(Genetic algorithm, GA)和乌燕鸥优化算法(Sooty tern optimization algorithm, STOA)进行混合, 先通过对平均适应度值进行评估, 当个体的适应度函数值小于平均值时采用遗传算法对其进行局部搜索的加强, 否则进行乌燕鸥本体优化过程, 同时将支持向量机内核函数和特征选择目标共同作为优化对象, 利用改进后的STOA-GA寻找最适应解, 获得所选的特征分类结果. 其次, 通过16组经典UCI数据集和实际乳腺癌数据集进行数据分类研究, 在最佳适应度值、所选特征个数、特异性、敏感性和算法耗时方面进行对比研究, 实验结果表明, 该算法可以更加准确地处理数据, 避免冗余特征干扰, 在数据挖掘领域具有更广阔的工程应用前景. 相似文献
12.
谓词的自动识别是浅层句法分析的重要内容。本文提出了基于支持向量机分类算法的谓词自动识别方法,重点描述了在特征构建过程中基于信息增益的特征筛选方法与基于同义词词林的特征词度量方法。信息增益方法选取对分类影响较大的特征,降低了特征维度;同义词词林的度量方法将特征词映射为深层次的语义概念,增强了特征的表达能力,强调了属性特征与模型的相关度。在小规模语料库上的实验表明,谓词识别的最好F-Score达到了84.0%,相较于对数据无任何处理的情况F-Score提高了4.6%。结果表明,这种新的特征筛选与特征度量方法在谓词识别中十分有效,可以极大提高分类器的性能。 相似文献
13.
在基于网络流量分析,被动式的网络设备识别研究中,网络流量数据中往往存在许多高维数据,其中的部分特征对设备识别贡献不大,甚至会严重影响分类结果和分类性能.所以针对这个问题本文提出了一种将Filter和Wrapper方式相结合,基于对称不确定性(SU)和近似马尔可夫毯(AMB)的网络流量特征选择算法FSSA,本文提出的方法... 相似文献
14.
The use of machine learning techniques to automatically analyse data for information is becoming increasingly widespread.
In this paper we primarily examine the use of Genetic Programming and a Genetic Algorithm to pre-process data before it is
classified using the C4.5 decision tree learning algorithm. Genetic Programming is used to construct new features from those
available in the data, a potentially significant process for data mining since it gives consideration to hidden relationships
between features. A Genetic Algorithm is used to determine which such features are the most predictive. Using ten well-known
datasets we show that our approach, in comparison to C4.5 alone, provides marked improvement in a number of cases. We then
examine its use with other well-known machine learning techniques. 相似文献
15.
文本分类是信息检索和数据挖掘的基础,被广泛应用于网络数据挖掘及搜索引擎等方面。首先对文本进行分词,对分词的结果分别使用x2统计量(CHI)方法与相关系数法(CC法)进行降维,并使用维数调节的思想进行特征提取。在得到特征集后,使用覆盖算法作为文本分类器进行学习。实验结果表明,通过结合相关系数法、覆盖算法以及维数调节方法,可实现一个效果较好的文本分类器。 相似文献
16.
入侵检测系统面临的主要问题是计算量大,特征选择被引入解决这一问题。针对现有方法的缺点,利用改进的粒子群算法来搜索最优特征子集,提出了一种基于混合CatfishPSO和最小二乘支持向量机的特征选择方法,利用混合的CatfishBPSO和CatfishPSO选择特征子集并同步对LSSVM的参数进行优化,最后建立了一个基于该特征选择方法的入侵检测模型。在KDD Cup 99数据集上进行的实验结果表明该模型的检测性能较高。 相似文献
17.
挂号是医疗过程最基本的单元,通常患者不知道自己病情,挂错科室的情况十分普遍,智能医疗系统的挂号功能很好地解决了这一难题,智能医疗系统利用医疗部门积累的海量病案文本进行训练和机器学习,对患者的病例特征进行分析将其分类到正确的病种,得出应挂的科室然后推荐给患者.而影响传统的支持向量机(SVM)文本分类的效率和准确率主要是特征值的提取和核函数参数的优化问题,由此提出了一种遗传算法(GA)和SVM相结合的文本分类方法,即把文本特征值和核函数的参数看作遗传算法中的一个染色体(一个个体),并进行二进制编码,对每一个个体进行选择、交叉、变异的遗传操作,得到最优的个体,最后通过支持向量机利用最优特征和最优参数进行文本分类.实验表明,该模型提高了患者智能诊断挂号的正确率,是一种较好的智能推荐诊断挂号算法. 相似文献
18.
特征选择在文本分类中是非常必要的,这是由于它可以使分类更加有效与准确。本文根据特征选择方法χ2统计方法的不足,对χ2统计进行改进,并在支持向量机分类算法上进行实验。实验结果表明改进的方法可以提高分类的准确度。 相似文献
19.
一种高效的面向轻量级入侵检测系统的特征选择算法 总被引:9,自引:0,他引:9
特征选择是网络安全、模式识别、数据挖掘等领域的重要问题之一.针对高维数据对象,特征选择一方面可以提高分类精度和效率,另一方面可以找出富含信息的特征子集.文中提出一种wrapper型的特征选择算法来构建轻量级入侵检测系统.该算法采用遗传算法和禁忌搜索相混合的搜索策略对特征子集空间进行随机搜索,然后利用提供的数据在无约束优化线性支持向量机上的平均分类正确率作为特征子集的评价标准来获取最优特征子集.文中按照DOS,PROBE,R2L,U2R 4个类别对KDD1999数据集进行分类,并且在每一类上进行了大量的实验.实验结果表明,对每一类攻击文中提出的特征选择算法不仅可以加快特征选择的速度,而且基于该算法构建的入侵检测系统在建模时间、检测时间、检测已知攻击、检测未知攻击上,与没有运用特征选择的入侵检测系统相比具有更好的性能. 相似文献