期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张田杨奎武魏江宏刘扬宁原隆《计算机研究与发展》2022,59(6):1315-1328

对抗样本是当前深度学习神经网络研究的热点问题.目前,对抗样本技术的研究主要分为2方面：生成攻击、检测防御.在总结对抗样本生成攻击技术的基础上,面向图像数据的对抗样本检测与防御技术综述从对抗样本的检测与防御的角度对面向图像数据的对抗样本防御技术进行了总结.综述从特征学习、分布统计、输入解离、对抗训练、知识迁移及降噪6个方面将检测与防御技术进行归类,介绍检测与防御技术的演进,分析其特点、性能,对比不同技术的优缺点,给出了检测效果和防御效果的综合评价.最后对当前该领域的研究情况进行了总结与展望. 相似文献

2.

图像分类模型的对抗样本攻防研究综述

闫嘉乐徐洋张思聪李克资《计算机工程与应用》2022,58(23):24-41

深度学习模型在图像分类领域的能力已经超越了人类,但不幸的是,研究发现深度学习模型在对抗样本面前非常脆弱,这给它在安全敏感的系统中的应用带来了巨大挑战。图像分类领域对抗样本的研究工作被梳理和总结,以期为进一步地研究该领域建立基本的知识体系,介绍了对抗样本的形式化定义和相关术语,介绍了对抗样本的攻击和防御方法,特别是新兴的可验证鲁棒性的防御,并且讨论了对抗样本存在可能的原因。为了强调在现实世界中对抗攻击的可能性,回顾了相关的工作。在梳理和总结文献的基础上,分析了对抗样本的总体发展趋势和存在的挑战以及未来的研究展望。相似文献

3.

图像对抗样本检测与防御方法研究进展

秦书晨王娟《智能安全》2024,3(4):81-95

深度神经网络在图像识别等领域取得了显著成就,但其对对抗性攻击的脆弱性对模型的安全性和可靠性构成了严重威胁。为了应对这一挑战,研究者们提出了众多图像对抗样本的检测与防御方法。将现有的方法归纳为检测方法、防御方法及检测与防御结合方法三类,并从域分类视角出发,对各类方法进行了细致的子类划分。分析了这些方法的原理、优势及局限性,为相关领域的研究者提供了比较全面的技术概览。最后,总结了对抗样本检测与防御领域当前面临的挑战,并在跨域检测防御联合框架的构建、自动化技术的引入等方面提出了具体的建议与展望。相似文献

4.

图像分类中的白盒对抗攻击技术综述

魏佳璇杜世康于志轩张瑞生《计算机应用》2022,42(9):2732-2741

在深度学习中图像分类任务研究里发现,对抗攻击现象给深度学习模型的安全应用带来了严峻挑战,引发了研究人员的广泛关注。首先,围绕深度学习中用于生成对抗扰动的对抗攻击技术,对图像分类任务中重要的白盒对抗攻击算法进行了详细介绍,同时分析了各个攻击算法的优缺点;然后,分别从移动终端、人脸识别和自动驾驶三个现实中的应用场景出发,介绍了白盒对抗攻击技术的应用现状;此外,选择了一些典型的白盒对抗攻击算法针对不同的目标模型进行了对比实验并分析了实验结果;最后,对白盒对抗攻击技术进行了总结,并展望了其有价值的研究方向。相似文献

5.

图像对抗样本研究综述

陈梦轩张振永纪守领魏贵义邵俊《计算机科学》2022,49(2):92-106

随着深度学习理论的发展,深度神经网络取得了一系列突破性进展,相继在多个领域得到了应用.其中,尤其以图像领域中的应用(如图像分类)最为普及与深入.然而,研究表明深度神经网络存在着诸多安全隐患,尤其是来自对抗样本的威胁,严重影响了图像分类的应用效果.因此,图像对抗样本的研究近年来越来越受到重视,研究者们从不同的角度对其进行... 相似文献

6.

基于自适应噪声添加的防御对抗样本算法

《计算机应用研究》2021,(3)

相似文献

7.

面向深度学习的对抗样本差异性检测方法

王曙燕侯则昱孙家泽《计算机应用》2021,41(7):1849-1856

深度神经网络(DNN)在许多深度学习关键系统如人脸识别、智能驾驶中被证明容易受到对抗样本攻击,而对多种类对抗样本的检测还存在着检测不充分以及检测效率低的问题,为此,提出一种面向深度学习模型的对抗样本差异性检测方法.首先,构建工业化生产中常用的残差神经网络模型作为对抗样本生成与检测系统的模型;然后,利用多种对抗攻击攻击深... 相似文献

8.

面向自然语言处理的深度学习对抗样本综述

仝鑫王斌君王润正潘孝勤《计算机科学》2021,48(1):258-267

深度学习模型被证明存在脆弱性并容易遭到对抗样本的攻击,但目前对于对抗样本的研究主要集中在计算机视觉领域而忽略了自然语言处理模型的安全问题.针对自然语言处理领域同样面临对抗样本的风险,在阐明对抗样本相关概念的基础上,文中首先对基于深度学习的自然语言处理模型的复杂结构、难以探知的训练过程和朴素的基本原理等脆弱性成因进行分析... 相似文献

9.

基于自适应噪声添加的防御对抗样本的算法

刘野黄贤英刘文星朱小飞李昭平《计算机应用研究》2021,38(3):764-769

深度神经网络容易受到对抗样本的攻击。为了解决这个问题,一些工作通过向图像中添加高斯噪声来训练网络,从而提高网络防御对抗样本的能力,但是该方法在添加噪声时并没有考虑到神经网络对图像中不同区域的敏感性是不同的。针对这一问题,提出了梯度指导噪声添加的对抗训练算法。该算法在训练网络时,根据图像中不同区域的敏感性向其添加自适应噪声,在敏感性较大的区域上添加较大的噪声抑制网络对图像变化的敏感程度,在敏感性较小的区域上添加较小的噪声提高其分类精度。在Cifar-10数据集上与现有算法进行比较,实验结果表明,该方法有效地提高了神经网络在分类对抗样本时的准确率。相似文献

10.

物理对抗补丁攻击与防御技术研究综述

邓欢黄敏桓李虎王彤况晓辉《信息安全学报》2025,10(1):75-90

以深度神经网络为代表的人工智能技术在经济、社会各领域中的应用越来越广泛,但与之相伴的安全性问题也逐渐凸显。深度神经网络作为概率模型所具备的不确定性,以及参数量大所带来的黑盒性质,使其容易受到对抗样本的攻击,这给基于深度神经网络的现实世界应用带来了严重的安全威胁。因此,对抗样本研究成为人工智能安全领域的一个热门方向。其中,对抗样本攻击主要指对深度神经网络模型的输入数据添加一些微小的扰动,使得模型对输入数据的预测产生错误。而物理对抗补丁攻击则是一种在物理世界中添加对抗性图像贴纸的攻击方式,可以通过将物理对抗补丁手动贴在实际场景中的目标物体上,使得深度神经网络在图像识别、目标检测等计算机视觉任务中无法正确识别目标物体,出现错误判断。早期研究主要聚焦于数字空间中对抗样本的构造,通过对数字化样本特征的局部或全局修改来实现扰动的添加,后研究人员利用数字空间中生成的对抗样本映射到物理世界中进行攻击。随着人工智能技术在现实世界的广泛应用,物理空间中的对抗样本攻击与防御技术渐受关注。以计算机视觉任务为基础,聚焦物理空间,围绕对样本特征进行局部修改的物理对抗补丁生成技术,对物理对抗补丁攻击与防御技术进行综述。本文从不同维度梳理分析物理对抗补丁攻击的类型,详细对比分析物理对抗补丁在图像识别、目标检测和其他计算机视觉任务中的攻击方法,并总结了针对物理对抗补丁攻击的防御方法,后对未来的研究方向进行展望。相似文献

11.

基于可攻击空间假设的陷阱式集成对抗防御网络

下载免费PDF全文

孙家泽温苏雷郑炜陈翔《软件学报》2024,35(4):1861-1884

如今,深度神经网络在各个领域取得了广泛的应用.然而研究表明,深度神经网络容易受到对抗样本的攻击,严重威胁着深度神经网络的应用和发展.现有的对抗防御方法大多需要以牺牲部分原始分类精度为代价,且强依赖于已有生成的对抗样本所提供的信息,无法兼顾防御的效力与效率.因此基于流形学习,从特征空间的角度提出可攻击空间对抗样本成因假设,并据此提出一种陷阱式集成对抗防御网络Trap-Net. Trap-Net在原始模型的基础上向训练数据添加陷阱类数据,使用陷阱式平滑损失函数建立目标数据类别与陷阱数据类别间的诱导关系以生成陷阱式网络.针对原始分类精度损失问题,利用集成学习的方式集成多个陷阱式网络以在不损失原始分类精度的同时,扩大陷阱类标签于特征空间所定义的靶标可攻击空间.最终, Trap-Net通过探测输入数据是否命中靶标可攻击空间以判断数据是否为对抗样本.基于MNIST、K-MNIST、F-MNIST、CIFAR-10和CIFAR-100数据集的实验表明, Trap-Net可在不损失干净样本分类精确度的同时具有很强的对抗样本防御泛化性,且实验结果验证可攻击空间对抗成因假设.在低扰动的白盒攻击场景中, T... 相似文献

12.

基于掩码语言模型的中文BERT攻击方法

下载免费PDF全文

张云婷叶麟唐浩林张宏莉李尚《软件学报》2024,35(7):3392-3409

对抗文本是一种能够使深度学习分类器作出错误判断的恶意样本,敌手通过向原始文本中加入人类难以察觉的微小扰动制作出能欺骗目标模型的对抗文本.研究对抗文本生成方法,能对深度神经网络的鲁棒性进行评价,并助力于模型后续的鲁棒性提升工作.当前针对中文文本设计的对抗文本生成方法中,很少有方法将鲁棒性较强的中文BERT模型作为目标模型进行攻击.面向中文文本分类任务,提出一种针对中文BERT的攻击方法 Chinese BERT Tricker.该方法使用一种汉字级词语重要性打分方法——重要汉字定位法;同时基于掩码语言模型设计一种包含两类策略的适用于中文的词语级扰动方法实现对重要词语的替换.实验表明,针对文本分类任务,所提方法在两个真实数据集上均能使中文BERT模型的分类准确率大幅下降至40%以下,且其多种攻击性能明显强于其他基线方法. 相似文献

13.

Lili Zhang Xiaoping Wang Kai Lu Shaoliang Peng Xiaodong Wang 《国际智能系统杂志》2020,35(9):1433-1449

Recent studies show that deep neural networks (DNNs) suffer adversarial examples. That is, attackers can mislead the output of a DNN by adding subtle perturbation to a benign input image. In addition, researchers propose new generation of technologies to produce robust adversarial examples. Robust adversarial examples can consistently fool DNN models under predefined hyperparameter space, which can break through some defenses against adversarial examples or even generate physical adversarial examples against real-world applications. Behind these achievements, expectation over transformation (EOT) algorithm plays as the backbone framework for generating robust adversarial examples. Though EOT framework is powerful, we know little about why such a framework can generate robust adversarial examples. To address this issue, we do the first work to explain the principle behind robust adversarial examples. Then, based on the findings, we point out that traditional EOT framework has a performance problem and propose an adaptive sampling algorithm to overcome such a problem. By modeling the sampling process as classic Coupon Collector Problem, we prove that our new framework reduces the cost from

O ◂()▸ (n * \log (n))

to

O (n)

, where

n

denotes the number of sampling points. Under the view of computational complexity, the algorithm is optimal for this problem. The experimental results show that our algorithm can save up to 23% overhead in average. This is significant for black-box attack, where the cost is charged by the amount of queries. 相似文献

14.

基于多质量因子压缩误差的对抗样本攻击方法识别

下载免费PDF全文

赵俊杰王金伟吴俊凤《中国图象图形学报》2023,28(3):850-863

目的对抗样本严重干扰了深度神经网络的正常工作。现有的对抗样本检测方案虽然能准确区分正常样本与对抗样本,但是无法判断具体的对抗攻击方法。对此,提出一种基于多质量因子压缩误差的对抗样本攻击方法识别方案,利用对抗噪声对JPEG压缩的敏感性实现攻击方法的识别。方法首先使用卷积层模拟JPEG压缩、解压缩过程中的颜色转换和空频域变换,实现JPEG误差在图形处理器(graphic processing unit,GPU)上的并行提取。提出多因子误差注意力机制,在计算多个质量因子压缩误差的同时,依据样本差异自适应调整各质量因子误差分支的权重。以特征统计层为基础提出注意力特征统计层。多因子误差分支的输出经融合卷积后,获取卷积层多维特征的同时计算特征权重,从而形成高并行对抗攻击方法识别模型。结果本文以Image Net图像分类数据集为基础,使用8种攻击方法生成了15个子数据集,攻击方法识别率在91%以上;在快速梯度符号法(fast gradient sign method,FGSM)和基本迭代法(basic iterative method,BIM)数据集上,噪声强度识别成功率超过96%;在对抗样本... 相似文献

15.

安卓恶意软件对抗样本攻击技术综述

下载免费PDF全文

李珩吴棒龚柱高翠莹袁巍罗夏朴《软件学报》2025,36(6):2683-2712

面对Android恶意软件带来的严重的安全风险,如何有效检测Android恶意软件已成为工业界与学术界共同关注的焦点.然而随着Android对抗样本技术的出现,现有的恶意软件检测系统面临着前所未有的挑战.Android恶意软件对抗样本攻击通过对恶意软件的源码或特征进行扰动,使其在保持原始功能不受影响的条件下绕过恶意软件检测模型.尽管目前已有大量针对恶意软件的对抗样本攻击研究,但是现阶段仍缺乏针对Android系统对抗样本攻击的完备性综述,且并未研究Android系统中对抗样本设计的独特要求,因此首先介绍Android恶意软件检测的基本概念;然后从不同角度对现有的Android对抗样本技术进行分类,梳理Android对抗样本技术的发展脉络;随后综述近年来的Android对抗样本技术,介绍不同类别的代表性工作并分析其优缺点;之后,分类介绍常用的安卓对抗样本攻击所使用的代码扰动手段并分析其应用场景;最后讨论Android恶意软件对抗样本技术面临的挑战,展望该新兴领域的未来研究方向. 相似文献

16.

基于通用对抗扰动的图像验证码保护方法

舒乐戴佳筑《计算机工程与应用》2021,57(18):135-141

卷积神经网络的发展使得图像验证码已经不再安全.基于卷积神经网络中存在的通用对抗扰动,提出了一种图像验证码的保护方法.提出了一种快速生成通用对抗扰动的算法,将方向相似的对抗扰动向量进行叠加以加快生成通用对抗扰动的速度.基于此算法设计了图像验证码的保护方案,将通用对抗扰动加入到验证码的图像中使其无法被卷积神经网络模型识别.... 相似文献

17.

基于孪生结构的对抗样本攻击动态防御方法

熊夙凌捷《计算机工程与应用》2022,58(17):230-238

神经网络模型已被广泛应用于多个研究领域,但神经网络模型本身存在易受到对抗样本攻击的缺点,如在图像分类中,只需在原始图片中添加微小的对抗扰动生成对抗样本,就可以轻易欺骗神经网络分类模型,这给许多领域的应用安全带来严重的威胁。因此,研究如何提高神经网络分类模型对对抗样本攻击的防御能力成为深度学习安全领域的研究热点。目前常用的对抗样本攻击防御方法往往只侧重于提高模型对对抗样本分类的鲁棒性,或者只侧重于检测拦截对抗样本,而对抗训练需要收集大量对抗样本,且难以防御新类型的对抗样本攻击,对于使用额外的分类器去检测对抗样本的方法,则存在着易受到二次攻击等缺点。针对这些问题,提出一种基于孪生神经网络结构的对抗样本攻击动态防御方法,利用孪生结构可比较两个输入相似性的特点,从孪生神经网络两侧的预测差异着手,检测图片在动态滤波前后是否存在不同的攻击效果,从而筛选出带有动态扰动的对抗样本。实验结果表明,在没有收集特定种类的对抗样本进行训练的情况下,该方法对多种对抗样本攻击取得了良好的通用防御效果,其中在FGSM对抗样本测试集上的防御准确率达到95.35%,在DeepFool和JSMA对抗样本测试集上的防御准确... 相似文献