首页 | 本学科首页   官方微博 | 高级检索  
     

基于注意力机制特征融合与增强的自然场景文本检测
引用本文:陈静娴,周全.基于注意力机制特征融合与增强的自然场景文本检测[J].无线电工程,2022(1):62-69.
作者姓名:陈静娴  周全
作者单位:;1.南京邮电大学通信与信息工程学院
基金项目:国家自然科学基金(61876093);江苏省自然科学基金资助项目(BK20181393)。
摘    要:为了解决自然场景文本检测中由于文本实例分布随机、形态与尺度多样造成的检测难题,设计了一种基于注意力机制特征融合与增强的自然场景文本检测算法。利用注意力机制对有效特征提取的优势,在模型的解码融合阶段设计并引入了一种基于注意力的特征融合模块(Attention-based Feature Fusion Module, AFFM),利用空间和通道注意力分别为高层特征和低层特征引入更丰富的细节和全局信息,进一步提高了检测的准确率;设计了联合注意力特征增强模块(Joint Attention Feature Enhancement Module, JAM),利用卷积对级联后的特征在不同通道之间、空间位置间的联系建模,并生成联合特征权重mask对级联特征做加权,从而提高信息的表征能力,有效减少误检与漏检。在Total-Text和ICDAR2015两个数据集上对模型做评估,测试结果表明,该方法的F1综合指标分别达到了85.1%和87.6%,均优于当前主流算法。

关 键 词:自然场景文本检测  注意力机制  特征融合  特征增强  深度学习

Natural Scene Text Detection Based on Attention Mechanism Feature Fusion and Enhancement
CHEN Jingxian,ZHOU Quan.Natural Scene Text Detection Based on Attention Mechanism Feature Fusion and Enhancement[J].Radio Engineering of China,2022(1):62-69.
Authors:CHEN Jingxian  ZHOU Quan
Affiliation:(School of Communication and Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)
Abstract:
Keywords:scene text detection  attention mechanism  feature fusion  feature enhancement  deep learning
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号