首页 | 本学科首页   官方微博 | 高级检索  
     

基于深度学习的自然场景文本检测综述
引用本文:连哲,殷雁君,云飞,智敏.基于深度学习的自然场景文本检测综述[J].计算机工程,2024(3):16-27.
作者姓名:连哲  殷雁君  云飞  智敏
作者单位:内蒙古师范大学计算机科学技术学院
基金项目:内蒙古自治区自然科学基金(2021LHMS06009);;内蒙古自治区高等学校科学研究项目(NJZZ21004);
摘    要:基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向,不仅具有广泛的应用前景,而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先,介绍自然场景文本检测技术的相关概念、研究背景和发展现状。接着,分析近年来基于深度学习的文本检测方法并将其分为基于检测框、基于分割、基于两者混合、其他4类,阐述4类经典和主流方法的基本思路和主要算法流程,归纳总结不同方法的使用机制、适用场景、优劣点及仿真实验结果和环境设置,明确不同方法之间的关联关系。然后,介绍自然场景文本检测的常用公共数据集和文本检测性能评估方法。最后,指出基于深度学习的自然场景文本检测技术目前所面临的主要挑战并对其未来发展方向进行展望。

关 键 词:深度学习  计算机视觉  自然场景文本  文本检测  多方向文本检测  多尺度文本检测
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号