排序方式: 共有2条查询结果,搜索用时 0 毫秒
1
1.
对网络流量数据进行分类时,由于网络流量具有多个类别,并且各类样本数量不均衡,故在利用机器学习进行分类时,会导致分类的模型的性能降低,致使样本被误分为样本数量多的类别,进而致使样本数量较少的类别(小类别)的召回率过低。针对该问题,提出一种基于卡方方法及对称不确定性网络流量特征选择方法。该方法首先计算特征与类之间的加权卡方值,选择卡方值较大的特征组成候选特征子集,然后根据特征与所有类之间的对称不确定性进一步筛选特征集。在Moore网络流量数据集上进行实验,得到的实验结果证明,通过该方法选择的特征对网络流量数据进行分类,在保证准确率高的前提下也得到了较高的小类召回率,减轻了数据不均衡问题带来的不良影响。 相似文献
2.
支持向量机对网络流量进行分类时,支持向量机参数易导致分类模型的性能下降,分类精度低下等问题。针对该问题,提出一种改进差分优化算法与最小二乘支持向量机多分类器结合的方法,该模型采用具有自适应算子的DE算法作为优化方法,以LSSVM作为分类方法,交替进行,最终使分类结果最好。实验结果证明,该模型在网络流量多分类中,具有较低的均方根误差和更高的F1指数。 相似文献
1