首页 | 本学科首页   官方微博 | 高级检索  
     

文本中心像素重建实现任意形状的文本检测
引用本文:雷小唐,胡靖.文本中心像素重建实现任意形状的文本检测[J].计算机工程与应用,2023(8):148-156.
作者姓名:雷小唐  胡靖
作者单位:成都信息工程大学计算机学院
基金项目:国家自然科学基金(61602065);
摘    要:针对自然场景文本检测算法未能高效、准确地实现端到端的任意形状文本检测,提出了轻量型像素聚类文本核重建的文本检测算法,针对轻量型网络特征信息弱和感受野小的问题,设计了图像级上下文信息模块(imagelevel context module)来捕获全局图像信息和语义级上下文信息模块(semantic-level context module)学习目标区域信息,两者信息融合增强网络特征信息保证检测的准确性,为了有效区分相邻文本和定位弯曲文本,基于文本核启发将文字实例中心视为聚类中心,从核中心经过一次像素聚类重建完整的文字实例实现对任意形状文本的检测。方法在弯曲文本数据集Total-Text和CTW1500综合评分达到了84.1%和84.6%超过了最好的CARFT方法,检测速度42帧/s超过最优EAST的,有效地解决了检测形状文本的高效和准确性,在应用层面更加友好。

关 键 词:图像级上下文  语义级上下文  像素聚类  任意形状文本  文本核
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号