平行视觉的基本框架与关键算法 The basic framework and key algorithms of parallel vision期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

平行视觉的基本框架与关键算法

引用本文：	张慧,李轩,王飞跃.平行视觉的基本框架与关键算法[J].中国图象图形学报,2021,26(1):82-92.

作者姓名：	张慧李轩王飞跃

作者单位：	中国科学院自动化研究所复杂系统管理与控制国家重点实验室, 北京 100190;腾讯科技(北京)有限公司, 北京 100080;鹏城实验室, 深圳 518055;北京理工大学, 北京 100081

基金项目：	国家自然科学基金项目（61876011，U1811463）

摘要：	目的随着计算机与人工智能的快速发展，视觉感知技术突飞猛进。然而，以深度学习为主的视觉感知方法依赖于大规模多样性的数据集，因此，本文提出了基于平行学习的视觉分析框架——平行视觉，它通过大量精细标注的人工图像来给视觉算法补充足够的图像数据，从而将计算机变成计算智能的“实验室”。方法首先人工图像系统模拟实际图像中可能出现的成像条件，利用系统内部参数自动得到标注信息，获取符合要求的人工图像数据；然后使用预测学习设计视觉感知模型，利用计算实验方法在人工图像系统生成的大量图像数据上进行各种实验，方便地研究复杂环境条件等困难场景对视觉感知模型的影响，使一些实际中的不可控因素转变为可控因素，增加视觉模型的可解释性；最后通过指示学习反馈优化模型参数，利用视觉感知模型在实际场景下存在的困难来指导其在人工场景的训练，以实际与人工虚实互动的方式，在线学习和优化视觉感知模型。由于已经有大量研究人员致力于构建人工场景并生成大量虚拟图像，因此本文采用已构建的这些人工场景图像，并对实际场景图像进行翻转、裁剪、缩放等数据扩充，然后以计算实验和预测学习为重点，开展了相关的应用实例研究。结果在SYNTHIA（synthetic collection of imagery and annotations），Virtual KITTI（Karlsruhe Institute of Technology and Toyota Technological Institute）和VIPER（visual perception benchmark）数据集上进行的大量实验表明，本文方法能够有效地克服数据集分布差异对模型泛化能力的影响，性能优于同期最好的方法，比如在SYNTHIA数据集上检测和分割性能分别提升了3.8%和2.7%。结论平行视觉是视觉计算领域的一个重要研究方向，通过与深度学习的结合，将推动越来越多的智能视觉系统发展成熟并走向应用。
关键词：	计算机视觉平行学习平行视觉视觉感知模型实例分割目标检测
收稿时间：	2020/7/20 0:00:00
修稿时间：	2020/10/22 0:00:00
The basic framework and key algorithms of parallel vision

Zhang Hui,Li Xuan,Wang Feiyue.The basic framework and key algorithms of parallel vision[J].Journal of Image and Graphics,2021,26(1):82-92.

Authors:	Zhang Hui Li Xuan Wang Feiyue

Affiliation:	The State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing 100190, China;Tencent Technology(Beijing) Company, Limited, Beijing 100080, China;Peng Cheng Laboratory, Shenzhen 518055, China;Beijing Institute of Technology, Beijing 100081, China

Abstract:

Keywords:	computer vision parallel learning parallel vision visual perception model instance segmentation object detection

	点击此处可从《中国图象图形学报》浏览原始摘要信息
	点击此处可从《中国图象图形学报》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏