首页 | 本学科首页   官方微博 | 高级检索  
     

自然场景文本检测与识别的深度学习方法
引用本文:刘崇宇,陈晓雪,罗灿杰,金连文,薛洋,刘禹良. 自然场景文本检测与识别的深度学习方法[J]. 中国图象图形学报, 2021, 26(6): 1330-1367
作者姓名:刘崇宇  陈晓雪  罗灿杰  金连文  薛洋  刘禹良
作者单位:华南理工大学电子与信息学院, 广州 510640
基金项目:国家自然科学基金项目(61936003,61771199);广东省自然科学基金项目(2017A030312006,2021A1515011870)
摘    要:许多自然场景图像中都包含丰富的文本,它们对于场景理解有着重要的作用。随着移动互联网技术的飞速发展,许多新的应用场景都需要利用这些文本信息,例如招牌识别和自动驾驶等。因此,自然场景文本的分析与处理也越来越成为计算机视觉领域的研究热点之一,该任务主要包括文本检测与识别。传统的文本检测和识别方法依赖于人工设计的特征和规则,且模型设计复杂、效率低、泛化性能差。随着深度学习的发展,自然场景文本检测、自然场景文本识别以及端到端的自然场景文本检测与识别都取得了突破性的进展,其性能和效率都得到了显著提高。本文介绍了该领域相关的研究背景,对基于深度学习的自然场景文本检测、识别以及端到端自然场景文本检测与识别的方法进行整理分类、归纳和总结,阐述了各类方法的基本思想和优缺点。并针对隶属于不同类别下的方法,进一步论述和分析这些主要模型的算法流程、适用场景和技术发展路线。此外,列举说明了部分主流公开数据集,对比了各个模型方法在代表性数据集上的性能情况。最后总结了目前不同场景数据下的自然场景文本检测、识别及端到端自然场景文本检测与识别算法的局限性以及未来的挑战和发展趋势。

关 键 词:自然场景文本检测  自然场景文本识别(STR)  端到端自然场景文本检测与识别  深度学习  光学字符识别(OCR)  综述
收稿时间:2021-01-21
修稿时间:2021-02-27

Deep learning methods for scene text detection and recognition
Liu Chongyu,Chen Xiaoxue,Luo Canjie,Jin Lianwen,Xue Yang,Liu Yuliang. Deep learning methods for scene text detection and recognition[J]. Journal of Image and Graphics, 2021, 26(6): 1330-1367
Authors:Liu Chongyu  Chen Xiaoxue  Luo Canjie  Jin Lianwen  Xue Yang  Liu Yuliang
Affiliation:School of Electronics and Information Engineering, South China University of Technology, Guangzhou 510640, China
Abstract:
Keywords:scene text detection  scene text recognition(STR)  end-to-end scene text spotting  deep learning  optical character recognition(OCR)  survey
点击此处可从《中国图象图形学报》浏览原始摘要信息
点击此处可从《中国图象图形学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号