数据受限条件下的多模态处理技术综述 Review of multimodal data processing techniques with limited data期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

数据受限条件下的多模态处理技术综述

引用本文：	王佩瑾,闫志远,容雪娥,李俊希,路晓男,胡会扬,严启炜,孙显. 数据受限条件下的多模态处理技术综述[J]. 中国图象图形学报, 2022, 27(10): 2803-2834

作者姓名：	王佩瑾闫志远容雪娥李俊希路晓男胡会扬严启炜孙显

作者单位：	1. 中国科学院空天信息创新研究院, 北京 100190;2. 中国科学院大学电子电气与通信工程学院, 北京 100049;3. 中国科学院空天信息创新研究院网络信息体系技术科技创新重点实验室, 北京 100190

基金项目：	国家自然科学基金项目（62171436）

摘要：	随着多媒体技术的发展,可获取的媒体数据在种类和量级上大幅提升。受人类感知方式的启发,多种媒体数据互相融合处理,促进了人工智能在计算机视觉领域的研究发展,在遥感图像解译、生物医学和深度估计等方面有广泛的应用。尽管多模态数据在描述事物特征时具有明显优势,但仍面临着较大的挑战。1)受到不同成像设备和传感器的限制,难以收集到大规模、高质量的多模态数据集;2)多模态数据需要匹配成对用于研究,任一模态的缺失都会造成可用数据的减少;3)图像、视频数据在处理和标注上需要耗费较多的时间和人力成本,这些问题使得目前本领域的技术尚待攻关。本文立足于数据受限条件下的多模态学习方法,根据样本数量、标注信息和样本质量等不同的维度,将计算机视觉领域中的多模态数据受限方法分为小样本学习、缺乏强监督标注信息、主动学习、数据去噪和数据增强5个方向,详细阐述了各类方法的样本特点和模型方法的最新进展。并介绍了数据受限前提下的多模态学习方法使用的数据集及其应用方向(包括人体姿态估计、行人重识别等),对比分析了现有算法的优缺点以及未来的发展方向,对该领域的发展具有积极的意义。
关键词：	多模态数据数据受限深度学习融合算法计算机视觉
收稿时间：	2022-01-19
修稿时间：	2022-04-22
Review of multimodal data processing techniques with limited data

Wang Peijin,Yan Zhiyuan,Rong Xuee,Li Junxi,Lu Xiaonan,Hu Huiyang,Yan Qiwei,Sun Xian. Review of multimodal data processing techniques with limited data[J]. Journal of Image and Graphics, 2022, 27(10): 2803-2834

Authors:	Wang Peijin Yan Zhiyuan Rong Xuee Li Junxi Lu Xiaonan Hu Huiyang Yan Qiwei Sun Xian

Affiliation:	1. Aerospace Information Research Institute, Chinese Academy of Sciences, Beijing 100190, China;2. School of Electronic, Electrical and Communication Engineering, University of Chinese Academy of Sciences, Beijing 100049, China;3. Key Laboratory of Network Information System Technology(NIST), Aerospace Information Research Institute, Chinese Academy of Sciences, Beijing 100190, China

Abstract:

Keywords:	multimodal data limited data deep learning fusion algorithms computer vision

	点击此处可从《中国图象图形学报》浏览原始摘要信息
	点击此处可从《中国图象图形学报》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏