首页 | 本学科首页   官方微博 | 高级检索  
     

平行视觉的基本框架与关键算法
引用本文:张慧,李轩,王飞跃.平行视觉的基本框架与关键算法[J].中国图象图形学报,2021,26(1):82-92.
作者姓名:张慧  李轩  王飞跃
作者单位:中国科学院自动化研究所复杂系统管理与控制国家重点实验室, 北京 100190;腾讯科技(北京)有限公司, 北京 100080;鹏城实验室, 深圳 518055;北京理工大学, 北京 100081
基金项目:国家自然科学基金项目(61876011,U1811463)
摘    要:目的 随着计算机与人工智能的快速发展,视觉感知技术突飞猛进。然而,以深度学习为主的视觉感知方法依赖于大规模多样性的数据集,因此,本文提出了基于平行学习的视觉分析框架——平行视觉,它通过大量精细标注的人工图像来给视觉算法补充足够的图像数据,从而将计算机变成计算智能的“实验室”。方法 首先人工图像系统模拟实际图像中可能出现的成像条件,利用系统内部参数自动得到标注信息,获取符合要求的人工图像数据;然后使用预测学习设计视觉感知模型,利用计算实验方法在人工图像系统生成的大量图像数据上进行各种实验,方便地研究复杂环境条件等困难场景对视觉感知模型的影响,使一些实际中的不可控因素转变为可控因素,增加视觉模型的可解释性;最后通过指示学习反馈优化模型参数,利用视觉感知模型在实际场景下存在的困难来指导其在人工场景的训练,以实际与人工虚实互动的方式,在线学习和优化视觉感知模型。由于已经有大量研究人员致力于构建人工场景并生成大量虚拟图像,因此本文采用已构建的这些人工场景图像,并对实际场景图像进行翻转、裁剪、缩放等数据扩充,然后以计算实验和预测学习为重点,开展了相关的应用实例研究。结果 在SYNTHIA(synthetic collection of imagery and annotations),Virtual KITTI(Karlsruhe Institute of Technology and Toyota Technological Institute)和VIPER(visual perception benchmark)数据集上进行的大量实验表明,本文方法能够有效地克服数据集分布差异对模型泛化能力的影响,性能优于同期最好的方法,比如在SYNTHIA数据集上检测和分割性能分别提升了3.8%和2.7%。结论 平行视觉是视觉计算领域的一个重要研究方向,通过与深度学习的结合,将推动越来越多的智能视觉系统发展成熟并走向应用。

关 键 词:计算机视觉  平行学习  平行视觉  视觉感知模型  实例分割  目标检测
收稿时间:2020/7/20 0:00:00
修稿时间:2020/10/22 0:00:00

The basic framework and key algorithms of parallel vision
Zhang Hui,Li Xuan,Wang Feiyue.The basic framework and key algorithms of parallel vision[J].Journal of Image and Graphics,2021,26(1):82-92.
Authors:Zhang Hui  Li Xuan  Wang Feiyue
Affiliation:The State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing 100190, China;Tencent Technology(Beijing) Company, Limited, Beijing 100080, China;Peng Cheng Laboratory, Shenzhen 518055, China;Beijing Institute of Technology, Beijing 100081, China
Abstract:
Keywords:computer vision  parallel learning  parallel vision  visual perception model  instance segmentation  object detection
点击此处可从《中国图象图形学报》浏览原始摘要信息
点击此处可从《中国图象图形学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号