首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
机器学习用于网络流量识别   总被引:6,自引:2,他引:4  
提出了将机器学习中的C4.5算法应用于传输层的网络流量特征识别技术.运用相关性特征选择和遗传算法形成了流量特征子集.提出并采用 N折交叉验证与测试集相结合的方法评估了国家运营宽带网络中的流量测试分类结果.实验证明,无需预知端口和协议标签,网络流量就能被成功地识别与分析.  相似文献   

2.
网络流量分类是实现网络管理的重要技术之一,但是单一的基于DPI或是机器学习的分类方法分类精确度低.提出了一种基于DPI和机器学习相结合的网络流量分类方法.该方法采用DPI检测已知特征的网络流量,利用机器学习方法辅助分析未知特征以及加密的网络流.实验表明该方法能够提高网络流量分类的精确度.  相似文献   

3.
细胞穿膜肽是一类特殊的多肽,具有独特的医学价值,因此如何通过计算方法高效地识别细胞穿膜肽是一个值得研究的重要问题。目前的主流方法是使用各种特征表示算法获取序列特征,然后使用机器学习分类器进行分类。提出了一种新的识别算法 ConvCPP,利用改进的卷积神经网络提取蛋白质序列特征。改进之处包括在卷积层之前添加注意力层,并且优化了池化层的池化方式。设计消融实验来验证改进的有效性,之后结合多种其他基于蛋白质序列特征的特征提取算法,并测试了两种特征选择算法,最终得到最优的向量表示。再根据得到的向量表示,结合多种机器学习分类器对蛋白质序列进行分类识别。在基准数据集上的实验表明,该算法比当前的细胞穿膜肽识别方法具有更好的预测性能。  相似文献   

4.
特征选择和分类算法是文本分类中的两个关键技术,提出了基于主成分分析和KNN相结合的文本分类方法。该方法利用主成分分析对文本向量的高维空间进行特征选择,为克服因类别特征选择不当带来的不利影响,使用KNN算法进行分类可以最大程度地减少分类过程中的误差。为了验证方法的有效性,针对UCI标准数据集进行仿真实验。实验结果显示,PCA-KNN方法优于主成分分析和随机森林相结合的方法,能在一定程度上提高文本分类的精度。  相似文献   

5.
传统的入侵检测机器学习算法,面对有差异的新旧数据尤其是未知的攻击行为,会出现检测准确率较低、漏检率较高的问题.为此,提出了一种将人工蜂群(ABC)算法、XGBoost模型与迁移学习相结合的ABC-XGBTrl算法.首先通过使用少量有标签的新数据训练初始分类模型,然后将有标签的旧数据中分类正确的部分与少量有标签的新数据合...  相似文献   

6.
支持向量机是20世纪90年代发展出的一种新的通用机器学习算法,在解决小样本、非线性及高维模式识别问题中表现出许多独特的优势,成为国际上机器学习领域新的研究热点.作者以支持向量机为分类工具,对IRS-P6数据在土地覆盖应用中分类特征的选取进行了研究,与其他传统方法的分类结果比较,使用SVM分类方法分类总精度与Kappa系数均有所提高,并进行了分类精度评价,取得了良好的效果.实验表明SVM方法对高维输入向量具有较高的推广能力,且对遥感图像分类有着较强的优势.  相似文献   

7.
对机器学习替代DFT能量计算方法加速CALYPSO结构预测进行研究,选择5种机器学习方法评估其预测硼团簇总能量时的性能.使用库伦矩阵把原始数据表征为结构信息矩阵,提取矩阵特征值向量作为算法输入输出来训练模型;采用相同数据集评估算法,并探索影响算法性能的其他因素.提出基于势能面特征的相似性判断方法,建立置信度模型对性能最佳算法进行验证,结果表明:核岭回归算法预测出的势能面和DFT具有相似性;当允许误差为1kcal/mol时,算法置信度接近90%.时间测试结果显示,核岭回归算法时间复杂度为O(n),比DFT方法提高1~2个数量级.  相似文献   

8.
为了有效利用机加零件工艺信息和检测信息,提出基于机器学习算法的质量预测与工艺参数优化方法. 以集成工艺信息和检测信息的基于模型定义(MBD)模型为输入,通过对三维建模软件的二次开发实现参数提取,并建立结构化数据集. 利用多种机器学习分类器构建基于工艺参数与质量分类标签的质量预测模型. 结合信息增益算法对所有工艺参数进行优先级排序,筛选出对质量影响最大的工艺参数;开发质量预测与工艺参数优化工具集,利用梯度提升树模型优化对质量影响最大的工艺参数. 以某航空企业提供的铣削实验数据验证所提出方法的有效性和可靠性. 验证结果表明,该方法能够较好地实现机加零件的质量预测和工艺参数优化.  相似文献   

9.
分类是机器学习领域最重要的一类问题,其中K近邻法和Logistic回归是两个重要的机器学习算法。本文主要研究了K近邻算法和Logistic回归模型在数据分类问题中的具体应用。针对K近邻算法,在考虑数据特征基础上,分别用欧氏距离和曼哈顿距离作为距离度量,同时,对于Logistic回归分类问题,提出了一种改进的随机梯度上升算法。通过选取了UCI机器学习数据集中的Horse Colic、Wine Quality两个数据集对算法进行验证,应用结果表明:K近邻算法中使用欧氏距离更适合Wine Quality,并且改进的随机梯度上升算法显著提高了Logistic学习机器的训练时间,说明了K近邻法和改进Logistic回归分类算法具有良好的分类效果。  相似文献   

10.
提出一种基于ReliefF算法的时频联合特征及随机森林的配电网电缆故障识别方法. 针对零序电压,从时域和频域构造23个故障敏感特征,采用ReliefF算法进行特征选择,得到最具分类能力的特征子集. 将特征子集作为基于随机森林的输入进行训练,得到最终的分类模型,实现了电缆故障类型识别. 所提方法与基于单一特征的方法相比,能够更加充分地挖据数据潜力,同时由于采用ReliefF算法筛除了无关特征,提高了算法效率. 最后采用Matlab软件进行仿真,并与决策树、KNN、SVM等算法进行比较,仿真结果验证了所提方法的可行性和高准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号