首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
基于支持向量数据描述的异常检测方法   总被引:9,自引:0,他引:9  
提出了一种基于支持向量数据描述算法的异常检测方法。该方法将入侵检测看作是一种单值分类问题,建立正常行为的支持向量描述模型,通过该模型可以检测各种已知和未知的攻击行为。该方法是一种无监督的异常检测方法,能够在包含噪声的数据集进行模型训练,降低了训练集的要求。在KDD CUP99标准入侵检测数据集上进行实验,并与无监督聚类异常检测实验结果相比较,证实该方法能够获得较高检测率和较低误警率。  相似文献   

2.
针对包含噪声与干扰数据的大规模机器学习问题,采用非凸Ramp损失函数抑制噪声和干扰数据的影响,提出一种基于随机优化的非凸线性支持向量机快速学习方法,有效改进训练速度和预测精度.实验结果表明该方法降低学习时间,在MNIST数据集上较传统学习方法的训练时间降低4个数量级.同时在一定程度上改进预测速度,并有效提升分类器对噪声数据集的泛化性能.  相似文献   

3.
流量分类模型在更新过程中易受数据污染的干扰而降低模型性能,现有基于数据清洗的防御方法需依赖专家经验和人工筛选,且无法有效应对利用未知分布样本构造的投毒攻击。针对上述问题,受分布外检测和判别主动学习的启发,设计一种基于样本分布特征的数据投毒防御方法,通过二分类判别器筛选每轮新增样本中的已知及未知分布样本。对于新增的已知分布样本,通过模型预测与标注结果一致率评估新增样本的数据质量,决定是否进行模型更新;对于新增的未知分布样本,则利用基于标注正确率的少样本抽检评估样本可用性。实验结果表明,该方法在抵御数据投毒攻击的同时可以保证模型准确率,并有效识别利用未知分布样本构造的数据投毒攻击。  相似文献   

4.
为解决机器学习模型中投毒样本的注入问题,提出一种基于样本原生特征的投毒防御算法infoGAN_Defense。基于投毒样本的制作原理设计投毒样本原生特征的提取方法,提高模型对样本原生特征的训练权重;在此基础上,利用样本原生特征的不变性进行投毒防御,引入样本原生特征与人为特征的概念,采用耦合infoGAN结构实现样本特征的分离及提取;进行机器学习模型的重训练。在真实数据集上设计实验评估防御效果,其结果验证了infoGAN_Defense算法的可行性和有效性。  相似文献   

5.
近年来,机器学习被逐渐运用到基于社交媒体文本数据的抑郁症检测中并凸显重要应用价值。为梳理其应用现状和发展方向,对用于抑郁症检测的社交媒体文本数据集、数据预处理和机器学习方法进行整理分类。在数据特征表示方面,对比分析了基础特征表示、静态词嵌入和语境词嵌入。全面分析了利用不同基础特征和不同算法类型的传统机器学习以及深度学习进行抑郁症检测的性能和特点。总结并建议未来在中文数据集的创建、模型的可解释性、基于隐喻的检测和轻量级预训练模型方面做进一步的探索。  相似文献   

6.
近年来,使用对比学习技术在大规模无标注数据上所构建的预训练模型得到了广泛的应用(如车道检测、人脸识别等)。然而,其面临的安全和隐私问题也引起学者的广泛关注。文章聚焦于针对多模态对比学习模型的投毒攻击,该攻击将精心构造的数据注入训练集,以改变模型在特定数据上的预测行为。针对现有投毒攻击主要针对文本或图像单模态模型,没有利用文本或者图像间的多模态信息的问题,文章提出一种同时对文本与图像编码器投毒的靶向投毒攻击。首先,基于Beta分布自动生成水印图像透明度;然后,根据透明度生成添加水印后的样本,并根据水印样本与目标样本之间的欧式距离得到该透明度下应当投毒的样本数;最后,通过特定的优化算法生成投毒数据集。与现有的投毒攻击相比,文章所提方法具有更低的投毒率,并能够保持目标模型的性能。  相似文献   

7.
针对自编码器网络(AE)需要正常数据进行训练的局限性,结合主成分分析方法,将AE的每次重建输出与输入数据进行求差,隔离出异常数据部分,即将输入数据分为正常与异常部分,正常部分由AE重建输出,异常部分由近端法进行优化输出,最后采用交替方向乘子法训练整个模型并达到预定训练次数再输出结果,实现了一种基于深度自编码网络(DAE)模型的无监督数据异常检测方法。在7个真实数据集与8种机器学习模型和AE模型进行了对比实验,结果表明,DAE模型无需输入正常数据就可以有效进行模型训练,且可以防止模型的过拟合,其综合表现高于传统机器学习模型和AE模型,AUC值在4个数据集中达到最优。在mnist数据集中,DAE模型的AUC值相比于孤立森林(IF)方法提高了10.93%。  相似文献   

8.
陈谦  柴政  王子龙  陈嘉伟 《计算机应用》2023,(12):3790-3798
联邦学习(FL)是一种新兴的隐私保护机器学习(ML)范式,然而它的分布式的训练结构更易受到投毒攻击的威胁:攻击者通过向中央服务器上传投毒模型以污染全局模型,减缓全局模型收敛并降低全局模型精确度。针对上述问题,提出一种基于生成对抗网络(GAN)的投毒攻击检测方案。首先,将良性本地模型输入GAN产生检测样本;其次,使用生成的检测样本检测客户端上传的本地模型;最后,根据检测指标剔除投毒模型。同时,所提方案定义了F1值损失和精确度损失这两项检测指标检测投毒模型,将检测范围从单一类型的投毒攻击扩展至全部两种类型的投毒攻击;设计阈值判定方法处理误判问题,确保误判鲁棒性。实验结果表明,在MNIST和Fashion-MNIST数据集上,所提方案能够生成高质量检测样本,并有效检测与剔除投毒模型;与使用收集测试数据和使用生成测试数据但仅使用精确度作为检测指标的两种检测方案相比,所提方案的全局模型精确度提升了2.7~12.2个百分点。  相似文献   

9.
传统的雷电数据预测方法往往采用单一最优机器学习算法,较少考虑气象数据的时空变化等现象。针对该现象,提出一种基于集成策略的多机器学习短时雷电预报算法。首先,对气象数据进行属性约简,降低数据维度;其次,在数据集上训练多种异构机器学习分类器,并基于预测质量筛选最优基分类器;最后,通过对最优基分类器训练权重,并结合集成策略产生最终分类器。实验表明,该方法优于传统单最优方法,其平均预测准确率提高了9.5%。  相似文献   

10.
目前客户流失预测任务中常用的模型集成方法采用传统机器学习模型作为基学习器。而传统机器学习模型相比于深度学习模型,存在无法对时序数据进行有效建模、特征工程对模型效果影响较大等缺点。针对这些问题,提出基于LSTM的模型集成方法。采用LSTM作为基学习器进行时序数据建模;改进snapshot模型集成方法,增加样本权重调整方法,在训练单个LSTM模型的过程中得到多个具有不同权值的模型;利用得到的多个模型构造新数据集,在新数据集上训练逻辑回归模型。实验结果表明,该方法相比于单模型LSTM,可以在仅花费其1.8倍训练时间的前提下,将查准率和PR-AUC分别提升4.67%和3.74%,显著提高了客户流失预测效果。  相似文献   

11.
针对传统病毒检测方法存在的更新速度慢、对未知病毒检测能力不足等问题,该文对主动学习理论在计算机病毒检测方面的应用进行了研究,提出了一种基于支持向量机主动学习的计算机病毒检测模型结构。此外,为了改进病毒检测的精度问题及主动学习过程的效率,利用相关n-gram方法实现了对样本文件的特征提取,并结合信任度测量理论实现了基于非确定抽样的询问功能。实验表明,该模型针对未知病毒具有较高的检测精度,并且能够极大地缩减训练时间及对训练数据的数量要求,提高系统的学习效率。  相似文献   

12.
王林  张鹤鹤 《计算机应用》2018,38(3):666-670
针对传统机器学习方法在车辆检测应用中易受光照、目标尺度和图像质量等因素影响,效率低下且泛化能力较差的问题,提出一种基于改进的较快的基于区域卷积神经网络(R-CNN)模型的车辆检测方法。该方法以Faster R-CNN模型为基础,通过对输入图像进行卷积和池化等操作提取车辆特征,结合多尺度训练和难负样本挖掘策略降低复杂环境的影响,利用KITTI数据集对深度神经网络模型进行训练,并采集实际场景中的图像进行测试。仿真实验中,在保证检测时间的情况下,相对原Faster R-CNN算法检测精确度提高了约8%。实验结果表明,所提方法能够自动地提取车辆特征,解决了传统方法提取特征费时费力的问题,同时提高了车辆检测精确度,具有良好的泛化能力和适用范围。  相似文献   

13.
利用支持向量回归机设计IDS的检测算法   总被引:6,自引:0,他引:6  
张家超 《计算机应用》2008,28(3):609-611
为提高网络入侵检测系统中检测算法的分类精度,降低训练样本及学习时间,提出一种新的基于支持向量回归机的检测算法。算法首先归一化处理训练样本数据,然后精确调节松弛惩罚因子,最后使用KDD CUP 1999数据集进行仿真实验,结果表明本算法可以提高入侵检测的准确性和有效性,并能够降低误报率。  相似文献   

14.
利用超声图像对甲状腺结节进行检测在医学诊断中具有至关重要的作用。针对传统机器学习方法处理过程中存在噪声复杂、特征提取困难等问题,提出一种基于中值滤波和深度学习残差网络的甲状腺超声图像结节检测方法。采用统计阈值中值滤波方法,提高结节边缘特征,实现超声图像自动增强;构建CNN6-Residual模型提取和筛选结节特征,使用跨层连接和残差学习降低网络训练难度。实验结果表明,该方法检测准确率达到97.03%,具有较高的临床应用价值。  相似文献   

15.
基于聚类的LS-SVM的入侵检测方法研究   总被引:1,自引:0,他引:1  
本文针对最小二乘法支持向量机在入侵检测中的训练效率低下的缺点,将聚类方法应用其中。该方法主要用来对数据集进行剪枝,有效地减少距离分类面较远的数据集合数量,而使用靠近聚类中心的数据集合作为有效的样本集合,减少样本的训练时间,提高训练效率。实验表明,使用聚类方法提高了最小二乘法支持向量机的训练效率,而且对入侵检测有很好的效果。  相似文献   

16.
传统的新奇检测算法,往往仅利用占样本大多数的正常实例来构造分类器,少量的负类样本基本不能发挥作用。针对此问题,本文提出一种基于少量负类样本的最大间隔方法,基本思想是:先构造一个超球面,让它包含尽可能多的正常实例,同时,球表面到正常实例之间的间隔越大越好,从而得到一个围绕正常实例的闭合而又紧贴异常实例的分类边界。去建立这样的超球面,我们只需要去解决一个凸的最优化问题,而这个最优化问题可以通过对传统支持向量机模型的稍加改变来实现。本文在机器故障检测,医疗诊断,阿拉伯数字识别等数据集上进行了仿真实验,实验结果表明该方法能够有效的提高检测率,降低误报率;同时五倍交叉验证训方法新提高了检测的稳定性。  相似文献   

17.
联邦学习是一种不通过中心化的数据训练就能获得机器学习模型的系统,源数据不出本地,降低了隐私泄露的风险,同时本地也获得优化训练模型。但是由于各节点之间的身份、行为、环境等不同,导致不平衡的数据分布可能引起模型在不同设备上的表现出现较大偏差,从而形成数据异构问题。针对上述问题,提出了基于节点优化的数据共享模型参数聚类算法,将聚类和数据共享同时应用到联邦学习系统中,该方法既能够有效地减少数据异构对联邦学习的影响,也加快了本地模型收敛的速度。同时,设计了一种评估全局共享模型收敛程度的方法,用于判断节点聚类的时机。最后,采用数据集EMNIST、CIFAR-10进行了实验和性能分析,验证了共享比例大小对各个节点收敛速度、准确率的影响,并进一步分析了当聚类与数据共享同时应用到联邦学习前后各个节点的准确率。实验结果表明,当引入数据共享后各节点的收敛速度以及准确率都有所提升,而当聚类与数据共享同时引入到联邦学习训练后,与FedAvg算法对比,其准确度提高10%~15%,表明了该方法针对联邦学习数据异构问题上有着良好的效果。  相似文献   

18.
基于支持向量机的复杂背景下的人体检测   总被引:8,自引:0,他引:8       下载免费PDF全文
常用的人体检测方法多是基于经验风险最小化原理的传统统计理论,其性能只有在样本趋于无穷大时才有理论上的保证,而在实际应用中,学习样本通常是有限的。针对传统统计理论在人体检测中存在的不足,提出了一种基于统计学习理论——支持向量机(SVM)的人体检测方法,利用彩色空间对背景进行自适应建模提取运动目标,然后使用训练好的SVM进行验证是否是人体。为了简化SVM分类器的设计及提高机器学习的效率,提出了一种星形向量表示法用于抽取目标的特征向量,并且用实验方法得到了这种表示法的最优表示。将SVM与ANN进行比较,并且对不同内积函数的SVM的性能也进行了比较。实验结果表明,SVM的性能要优于ANN,并且采用径向基函数的SVM性能最好。该方法鲁棒性强,正确率高,解决了复杂背景下运动人体实时检测的一些关键问题。  相似文献   

19.
裂缝作为桥梁最主要的病害之一,及时高效地发现和评估裂缝对保持桥梁的健康状况至关重要。针对裂缝标注数据集成本高、检测精度低等问题,提出了一种基于注意力机制和迁移学习的改进DeeplabV3+模型。该模型通过添加注意力机制来获取丰富上下文信息,提高裂缝特征通道的学习能力,降低背景噪声影响;通过公共数据集和小样本数据集组合建立源域数据集、目标域数据集以供迁移学习使用,以此来降低训练样本过少对检测性能的影响。实验结果表明,改进DeeplabV3+模型对桥梁裂缝检测获得了较好的检测效果,检测精度达到了93.3%,较原始模型提高了3个百分点;通过迁移学习训练模型在小样本数据上取得较高的检测精度,可节省大量标注成本。  相似文献   

20.
基于直推式方法的网络异常检测方法   总被引:1,自引:1,他引:0  
李洋  方滨兴  郭莉  陈友 《软件学报》2007,18(10):2595-2604
网络异常检测技术是入侵检测领域研究的热点和难点内容,目前仍然存在着误报率较高、对建立检测模型的数据要求过高、在复杂的网络环境中由于"噪音"的影响而导致检测率不高等问题.基于改进的TCM-KNN(transductive confidence machines for K-nearest neighbors)置信度机器学习算法,提出了一种网络异常检测的新方法,能够在高置信度的情况下,使用训练的正常样本有效地对异常进行检测.通过大量基于著名的KDD Cup 1999数据集的实验,表明其相对于传统的异常检测方法在保证较高检测率的前提下,有效地降低了误报率.另外,在训练集有少量"噪音"数据干扰的情况下,其仍能保证较高的检测性能;并且在采用"小样本"训练集以及为了避免"维灾难"而进行特征选取等优化处理后,其性能没有明显的削减.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号