首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 33 毫秒
1.
近年来,基于深度学习的场景文本检测算法层出不穷,对于EAST在自然场景中对长文本和较大文本检测不准确,存在容易出现误检漏检的问题.论文提出一种基于NLA-EAST网络(Non-Local Attention-An Efficient and Accurate Scene Text Detector)上的新颖的文本检测算法,通过ASPP空洞卷积来扩大感受野,来获得更大感受野的上下文信息.并且通过结合EAST和非局部注意力机制来精确定位文本边界,准确检测自然场景下的文本位置,克服了EAST对于较大文本和长文本的漏检和误检.对提出的方法进行了数据集测试,在文本定位精度方面由于竞争方法,在ICDAR 2015数据集中,F值达到了84.5%,在天池数据集上,F值达到了84.82%.  相似文献   

2.
近年来,基于深度学习的场景文本检测算法层出不穷,对于EAST在自然场景中对长文本和较大文本检测不准确,存在容易出现误检漏检的问题.论文提出一种基于NLA-EAST网络(Non-Local Attention-An Efficient and Accurate Scene Text Detector)上的新颖的文本检测算法,通过ASPP空洞卷积来扩大感受野,来获得更大感受野的上下文信息.并且通过结合EAST和非局部注意力机制来精确定位文本边界,准确检测自然场景下的文本位置,克服了EAST对于较大文本和长文本的漏检和误检.对提出的方法进行了数据集测试,在文本定位精度方面由于竞争方法,在ICDAR 2015数据集中,F值达到了84.5%,在天池数据集上,F值达到了84.82%.  相似文献   

3.
随着深度学习、神经网络的兴起与发展,对于图像中的目标检测已经取得了巨大的进展。但是自然场景下的文本信息具有多样的形式和复杂的特点,通用的目标检测算法无法取得理想的效果,因此自然场景下的文本检测在计算机视觉以及机器学习领域仍然是一项具有挑战性的问题和未来的热点研究方向。根据当前学术界针对自然场景下的文本检测问题所提出的算法和思路,在EAST算法的主干网络PVANet的基础上通过引入注意力机制模块,使得提取文本目标特征时更加关注有用信息和抑制无用信息,从而有效改善原算法在预测长文本方向信息时视野不足的问题。实验结果显示,该方法在没有损失检测效率的同时提高了原算法的检测精度,并在一定程度上优于当前针对自然场景下的文本检测算法。  相似文献   

4.
为了提高经典目标检测算法对自然场景文本定位的准确性,以及克服传统字符检测模型由于笔画间存在非连通性引起的汉字错误分割问题,提出了一种直接高效的自然场景汉字逼近定位方法。采用经典的EAST算法对场景图像中的文字进行检测。对初检的文字框进行调整使其更紧凑和更完整地包含文字,主要由提取各连通笔画成分、汉字分割和文字形状逼近三部分组成。矫正文字区域和识别文字内容。实验结果表明,提出的算法在保持平均帧率为3.1 帧/s的同时,对ICDAR2015、ICDAR2017-MLT和MSRA-TD500三个多方向数据集上文本定位任务中的F-score分别达到83.5%、72.8%和81.1%;消融实验验证了算法中各模块的有效性。在ICDAR2015数据集上的检测和识别综合评估任务中的性能也验证了该方法相比一些最新方法取得了更好的性能。  相似文献   

5.
自然场景乌金体藏文文本信息作为高度浓缩的高层语义信息,不仅具有较大的研究和实用价值,而且可以用于协助藏文场景文本理解领域的研究.目前针对自然场景下乌金体藏文的检测与识别的相关研究甚少,本文在人工收集的自然场景乌金体藏文图像数据集的基础上,对比了目前常见的文字检测算法在自然场景乌金体藏文上的检测性能以及在不同特征提取网络下基于序列的文字识别算法CRNN在自然场景乌金体藏文图像数据集上的识别准确率并分析了在314张真实自然场景下乌金体藏文识别出错的特殊例子.实验表明本文在文字检测阶段采用的可微分的二值化网络DBNet在测试集上具有更好的检测性能,该方法在测试集上的准确率、召回率、F1值分别达到了0.89、0.59、0.71;在文字识别阶段采用MobileNetV3 Large作为特征提取网络时,CRNN算法在测试集上的识别准确率最高,达到了0.4365.  相似文献   

6.
EAST算法是一种高效而准确的场景文本检测算法,但是由于受到感受野的限制,导致在检测小文本时容易出现误检、漏检现象,在检测较长文本时缺乏一定的完整性。针对以上问题,提出一种基于多分支特征融合的自然场景文本检测算法。该算法以EAST算法为基础,引入并改进了浅层特征增强模块(RFB-s),在避免小文本信息损失的前提下,增大浅层网络的感受野改善浅层特征语义信息不足的问题,增强对小文本定位的准确性。引入并改进了循环十字交叉注意力模块(RCCAM),使得特征图中的每个像素能够以非常有效的方式捕获全图像的上下文信息,提高对长文本的检测能力。同时针对回归任务,采用Dice Loss作为损失函数,解决正负样本占比不均衡问题。采用EIoU来提高回归的效果,得到更为精准的文本框。该算法在ICDAR2015和MSRA-TD500数据集上进行测试,均获得了不错的检测效果。表明了该算法能够有效地对自然场景文本进行检测,提高了检测的准确率。  相似文献   

7.
自然场景图像中的文字识别,不同于传统文本字符识别。自然场景图像中的文字经常面临着视角变化,多字体文本以及场景图像曝光严重等多种因素的影响,因此,难以准确地获取自然场景图像中字符信息。该文利用可微分二值化函数对自然场景图像进行处理,得到一张易处理二值化图像,并对二值化图像进行文本检测以便机器处理识别,最后利用卷积递归神经网络(CRNN);进行文本识别。该方法不仅提高了自然场景图像字符识别的准确度,而且解决了生活中多字体文字识别的难点。  相似文献   

8.
针对自然场景文本检测算法未能高效、准确地实现端到端的任意形状文本检测,提出了轻量型像素聚类文本核重建的文本检测算法,针对轻量型网络特征信息弱和感受野小的问题,设计了图像级上下文信息模块(imagelevel context module)来捕获全局图像信息和语义级上下文信息模块(semantic-level context module)学习目标区域信息,两者信息融合增强网络特征信息保证检测的准确性,为了有效区分相邻文本和定位弯曲文本,基于文本核启发将文字实例中心视为聚类中心,从核中心经过一次像素聚类重建完整的文字实例实现对任意形状文本的检测。方法在弯曲文本数据集Total-Text和CTW1500综合评分达到了84.1%和84.6%超过了最好的CARFT方法,检测速度42帧/s超过最优EAST的,有效地解决了检测形状文本的高效和准确性,在应用层面更加友好。  相似文献   

9.
目的 目前,基于MSERs(maximally stable extremal regions)的文本检测方法是自然场景图像文本检测的主流方法。但是自然场景图像中部分文本的背景复杂多变,MSERs算法无法将其准确提取出来,降低了该类方法的鲁棒性。本文针对自然场景图像文本背景复杂多变的特点,将MSCRs(maximally stable color regions)算法用于自然场景文本检测,提出一种结合MSCRs与MSERs的自然场景文本检测方法。方法 首先采用MSCRs算法与MSERs算法提取候选字符区域;然后利用候选字符区域的纹理特征训练随机森林字符分类器,对候选字符区域进行分类,从而得到字符区域;最后,依据字符区域的彩色一致性和几何邻接关系对字符进行合并,得到最终文本检测结果。结果 本文方法在ICDAR 2013上的召回率、准确率和F值分别为71.9%、84.1%和77.5%,相对于其他方法的召回率和F值均有所提高。结论 本文方法对自然场景图像文本检测具有较强的鲁棒性,实验结果验证了本文方法的有效性。  相似文献   

10.
根据对自然场景图像分割后具有标志牌和背景明显分开等特点,提出了一种基于边框删除的标志牌文本提取算法,首先在二值化图像中采用基于边缘检测和投影算法对标志牌区域进行定位,然后采用边框删除算法提取标志牌文本.大量实验结果表明该方法能够准确定位并提取非规则的标志牌文本.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号