首页 | 本学科首页   官方微博 | 高级检索  
     

具有自校正与注意力机制相结合的场景文本检测北大核心CSCD
引用本文:孙鹏,刘粤,强观臣,熊炜,付尧,李利荣.具有自校正与注意力机制相结合的场景文本检测北大核心CSCD[J].光电子.激光,2022(12):1287-1295.
作者姓名:孙鹏  刘粤  强观臣  熊炜  付尧  李利荣
作者单位:湖北工业大学 电气与电子工程学院,湖北 武汉 430068,湖北工业大学 电气与电子工程学院,湖北 武汉 430068,湖北工业大学 电气与电子工程学院,湖北 武汉 430068,湖北工业大学 电气与电子工程学院,湖北 武汉 430068 ;襄阳湖北工业大学产业研究院,湖北 襄阳 441003 ;美国南卡罗来纳大学 计算机科学与工程系, 南卡罗来纳 哥伦比亚 29201,湖北工业大学 电气与电子工程学院,湖北 武汉 430068,湖北工业大学 电气与电子工程学院,湖北 武汉 430068 ;襄阳湖北工业大学产业研究院,湖北 襄阳 441003
基金项目:国家自然科学基金(61571182,61601177)、国家留学基金(201808420418)、 湖北省自然科学基金(2019CFB530)、湖北省科技厅重大专项(2019ZYYD020)和襄阳湖北工业大学产业研究院科研项目(XYYJ2022C05)资助项目
摘    要:在日常生活中,存在着丰富的文本信息,对这些信息的提取,能够极大地提高人们的生活品质。但自然场景中文本信息表达形式丰富多样,文本形状各异,在检测过程中存在误检、文本区域定位不准问题。针对以上不足,本文提出了一种具有自校正与注意力机制相结合的文本检测方法。首先,在ResNet50骨干网络中嵌入自校正卷积(self-calibrated convolution, SConv)及高效通道注意力(efficient channel attention, ECA),使网络能够校正全局无关信息的干扰,并集中关注于文本区域,提取更加丰富的语义信息;其次,在特征融合后加入协调注意力(coordinate attention, CA),纠正不同尺度的特征图在融合过程中产生的位置偏差。最后,通过修正后的特征图预测得到多个不同尺度的文本实例,采用渐进尺度扩展算法,求出最终检测到的文本实例。实验结果表明,在任意方向数据集ICDAR2015以及弯曲文本数据集Total-Text、SCUT-CTW1500上,相比于改进前的ResNet50综合指标F值分别提升了1.0%、5.2%、5.4%,证明了本方法具有良好的检测能力。

关 键 词:自校正卷积(SConv)  高效通道注意力(ECA)  协调注意力(CA)  渐进尺度扩展算法
收稿时间:2022/3/4 0:00:00
修稿时间:2022/4/11 0:00:00

Scene text detection with self-calibration and attention mechanism
SUN Peng,LIU Yue,QIANG Guanchen,XIONG Wei,FU Yao and LI Lirong.Scene text detection with self-calibration and attention mechanism[J].Journal of Optoelectronics·laser,2022(12):1287-1295.
Authors:SUN Peng  LIU Yue  QIANG Guanchen  XIONG Wei  FU Yao and LI Lirong
Affiliation:School of Electrical and Electronic Engineering,Hubei University of Technol ogy,Wuhan,Hubei 430068, China,School of Electrical and Electronic Engineering,Hubei University of Technol ogy,Wuhan,Hubei 430068, China,School of Electrical and Electronic Engineering,Hubei University of Technol ogy,Wuhan,Hubei 430068, China,School of Electrical and Electronic Engineering,Hubei University of Technol ogy,Wuhan,Hubei 430068, China;Xiangyang Industrial Research Institute, Hubei University of Technology, Xiangyang, Hubei 441003, China;Department of Computer Science and Engineering,University of South Carolina,Columbia,SC 29201, USA,School of Electrical and Electronic Engineering,Hubei University of Technol ogy,Wuhan,Hubei 430068, China and School of Electrical and Electronic Engineering,Hubei University of Technol ogy,Wuhan,Hubei 430068, China;Xiangyang Industrial Research Institute, Hubei University of Technology, Xiangyang, Hubei 441003, China
Abstract:
Keywords:self-calibrated convolutions (SConv)  efficient channel attention (ECA)  coordinate attention (CA)  progressive scale expansion algorithm
本文献已被 维普 等数据库收录!
点击此处可从《光电子.激光》浏览原始摘要信息
点击此处可从《光电子.激光》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号