谛听: 面向鲁棒分布外样本检测的半监督对抗训练方法 DiTing: Semi-supervised Adversarial Training Approach for Robust Out-of-distribution Detection期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

谛听: 面向鲁棒分布外样本检测的半监督对抗训练方法

引用本文：	周志阳,窦文生,李硕,亢良伊,王帅,刘杰,叶丹.谛听: 面向鲁棒分布外样本检测的半监督对抗训练方法[J].软件学报,2024,35(6):2936-2950.

作者姓名：	周志阳窦文生李硕亢良伊王帅刘杰叶丹

作者单位：	中国科学院软件研究所, 北京 100190;中国科学院大学, 北京 100049;中国科学院软件研究所, 北京 100190;中国科学院大学, 北京 100049;计算机科学国家重点实验室 (中国科学院软件研究所), 北京 100190;中国科学院软件研究所, 北京 100190;中国科学院大学, 北京 100049;计算机科学国家重点实验室 (中国科学院软件研究所), 北京 100190;中国科学院大学南京学院, 江苏南京 211135

基金项目：	国家自然科学基金(61972386)

摘要：	检测训练集分布之外的分布外(out-of-distribution, OOD)样本对于深度神经网络(deep neural network, DNN)分类器在开放环境的部署至关重要. 检测OOD样本可以视为一种二分类问题, 即把输入样本分类为“分布内(in-distribution, ID)”类或“分布外”类. 进一步地, 检测器自身还可能遭受到恶意的对抗攻击而被再次绕过. 这些带有恶意扰动的OOD样本称为对抗OOD样本. 构建鲁棒的OOD检测器以检测对抗OOD样本是一项更具挑战性的任务. 为习得可分离且对恶意扰动鲁棒的表示, 现有方法往往利用辅助的干净OOD样本邻域内的对抗OOD样本来训练DNN. 然而, 由于辅助的OOD训练集与原ID训练集的分布差异, 训练对抗OOD样本无法足够有效地使分布内决策边界对对抗扰动真正鲁棒. 从ID样本的邻域内生成的对抗ID样本拥有与原ID样本近乎一样的语义信息, 是一种离分布内区域更近的OOD样本, 对提升分布内边界对对抗扰动的鲁棒性很有效. 基于此, 提出一种半监督的对抗训练方法——谛听, 来构建鲁棒的OOD检测器, 用以同时检测干净OOD样本和对抗OOD样本. 谛听将对抗ID样本视为一种辅助的“近OOD”样本, 并将其与其他辅助的干净OOD样本和对抗OOD样本联合训练DNN, 以提升OOD检测的鲁棒性. 实验结果表明, 谛听在检测由强攻击生成的对抗OOD样本上具有显著的优势, 同时在原分类主任务及检测干净OOD样本上保持先进的性能.
关键词：	分布外样本检测对抗鲁棒性对抗训练
收稿时间：	2022/10/19 0:00:00
修稿时间：	2023/1/15 0:00:00
DiTing: Semi-supervised Adversarial Training Approach for Robust Out-of-distribution Detection

ZHOU Zhi-Yang,DOU Wen-Sheng,LI Shuo,KANG Liang-Yi,WANG Shuai,LIU Jie,YE Dan.DiTing: Semi-supervised Adversarial Training Approach for Robust Out-of-distribution Detection[J].Journal of Software,2024,35(6):2936-2950.

Authors:	ZHOU Zhi-Yang DOU Wen-Sheng LI Shuo KANG Liang-Yi WANG Shuai LIU Jie YE Dan

Affiliation:	Institute of Software, Chinese Academy of Sciences, Beijing 100190, China;University of Chinese Academy of Sciences, Beijing 100049, China;Institute of Software, Chinese Academy of Sciences, Beijing 100190, China;University of Chinese Academy of Sciences, Beijing 100049, China;State Key Laboratory of Computer Science (Institute of Software, Chinese Academy of Sciences), Beijing 100190, China;Institute of Software, Chinese Academy of Sciences, Beijing 100190, China;University of Chinese Academy of Sciences, Beijing 100049, China;State Key Laboratory of Computer Science (Institute of Software, Chinese Academy of Sciences), Beijing 100190, China;University of Chinese Academy of Sciences, Nanjing, Nanjing 211135, China

Abstract:

Keywords:	out-of-distribution sample detection adversarial robustness adversarial training

	点击此处可从《软件学报》浏览原始摘要信息
	点击此处可从《软件学报》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏