首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
自然场景图像中的文本提供了重要的语意信息,它是图像内容的重要来源.针对当前的求解算法普遍存在提取文本精确度不高等缺点,提出了一种文本定位准确的文本提取算法.先将原始图片进行金字塔分解,然后进行彩色图像边缘提取和二值化,再形态学文本定位,最后文本区域字符提取.对ICDAR数据库图片的测试结果表明,该方法对文字颜色、大小字体以及排列方向具有较强的鲁棒性,同时也具有较高的精确度和提取率.  相似文献   

2.
场景图像中的文本提供了重要的语义信息,它是图像内容的重要来源。针对当前的求解算法普遍存在提取文本精确度不高等缺点,本文提出了一种有效的文本提取方法。首先对原始图片进行模糊化处理,然后进行Laplacian边缘提取和二值化,再形态学变化,最后进行连通域分析,实现了场景文本的提取。  相似文献   

3.
针对自然场景文本的背景多样性和文本的不规则性,基于分割的文本检测方法是最近非常流行的检测方法之一,分割结果更能直观的描述各种形状的场景文本.由于计算成本较大,分割算法的处理速度一直是需要克服的一个大问题.本文使用改进的MobileNetV3轻量化特征提取网络和简洁高效的后处理降低模型的计算成本,分割头由特征增强模块和自...  相似文献   

4.
针对复杂场景下文本识别流程复杂繁琐、适应性差、准确度低等缺点,本文提出一种复杂场景下文本检测和识别的新方法.该方法由文本区域检测网络及文本识别网络构成,文本区域检测网络为改进的PSENet,将PSENet的骨干网络改为ResNeXt-101,在特征提取过程中加入可微二值化操作来优化分割网络,不仅简化了后处理,而且提高了...  相似文献   

5.
从复杂的自然场景标志牌图像中提取和识别字符一直是数字图像处理领域的热点问题,目前的求解算法普遍存在提取文本精确度不高,提取率偏低,鲁棒性差等缺点。提出一种高效的文本提取算法,针对标志牌文本图像通常具有较复杂的自然背景等特征,首先对原始图片进行模糊化处理,然后进行Laplacian边缘提取,再对边缘图像进行非文本长边缘的删除,最后根据文本区域的特征进行边缘扫描和连通域分析实现标志牌文本的提取。通过对2003年国际自然场景文本识别竞赛(ICDAR’2003 Robust Reading Competition)中大量图片测试表明,该算法对背景的复杂度、文字语言、颜色、大小字体以及排列方向具有较强的鲁棒性,同时也具有较高的准确率(Precision)和提取率(Recall)。  相似文献   

6.
自然场景图像中的文字识别,不同于传统文本字符识别。自然场景图像中的文字经常面临着视角变化,多字体文本以及场景图像曝光严重等多种因素的影响,因此,难以准确地获取自然场景图像中字符信息。该文利用可微分二值化函数对自然场景图像进行处理,得到一张易处理二值化图像,并对二值化图像进行文本检测以便机器处理识别,最后利用卷积递归神经网络(CRNN);进行文本识别。该方法不仅提高了自然场景图像字符识别的准确度,而且解决了生活中多字体文字识别的难点。  相似文献   

7.
视频文本的自动提取方法   总被引:4,自引:0,他引:4  
提出一种基于彩色边缘检测和游程平滑的视频文本提取方法,首先用彩色边缘检测算子检测出图像中的边缘。然后用多次水平和垂直的游程平滑操作使得文字边缘形成连通区域,并去掉部分孤立的噪声,再通过对连通域的分析和分解定位出文本区域的边界,最后对文本区进行确认.实验表明,本文的视频文本自动提取方法具有较高的文本提取率和较准确的边界定位。  相似文献   

8.
基于文本图像的自适应补偿二值化处理算法   总被引:1,自引:0,他引:1  
研究图像去噪优化处理问题,文本图像要预处理.针对使用照相机拍摄的文本图像,如摄像头拍摄的车牌图像,由于其受到采光,相机成像蜕化等方面的约束,使图像分辨率低,图像灰度会分布不均匀或者前后背景灰度差过小.采用传统的图像二值化方法并不能满足识别准确性的需要.为解决上述问题,提出一种对文本图像自适应背景强度补偿的二值化算法.首先通过大模板均值滤波获得对背景强度的初始估计,再利用非线性自适应灰度调整,从而使得最终处理图像能使用简单的全局阈值二值化方法,获得较佳的效果.试验结果表明改进的方法效果明显优于传统算法,大大提高了图像的识别率和准确率.  相似文献   

9.
为了解决轨道障碍物识别中轨道边缘不易定位的问题,针对轨道图像的特征,文章提出了一种基于 Otsu 阈值改 进的轨道边缘提取方法。该方法先确定铁轨主体的灰度区域,再通过 Otsu 求出灰度阈值,然后利用二值图像中标记连通 区域,对轨道图像进行处理,得到清晰的轨道边缘提取图像。通过对几种已提出的并具有较好效果的边缘提取方法进行 分析,如边缘梯度算子 sobel、小波分割算法、Otsu 自适应阈值分割等,并将其应用在实时轨道图像中,与改进的 Otsu 方 法进行对比实验。结果表明,该方法实验效果准确、完整,并有效抑制了背景噪声。  相似文献   

10.
基于聚类与边缘检测的自然场景文本提取方法   总被引:1,自引:0,他引:1  
为了解决复杂自然场景、光照不均匀及背景纹理丰富图像中文本的有效提取,提出一种基于K-means聚类与边缘检测结合的自然场景文本提取方法.该方法通过改进K-means聚类算法,实现文本区域的分割;然后对分割后的图像进行二值子图分解,将分解后的各子图像的连通区域进行标记与分析,得到候选的字符区域;最后利用文本区域的边缘特征对候选字符区域过滤,实现文本字符的提取.实验结果表明,该方法能有效提取出复杂背景、光照影响及背景纹理丰富图像中的文本字符区域.  相似文献   

11.
面向彩色图像和视频的文本提取新方法   总被引:10,自引:1,他引:10  
随着基于内容检索技术的发展,人们逐渐意识到包含在彩色图像和视频中的文本具有重要的语义作用,并需要采用有效的方法来提取这些文本,文中提出一个全面作用在RGB颜色空间3个分量上的彩色图像边缘检测新算子和一种利用空间频率特征,结合彩色边缘检测与基于区域图像分割方法的彩色图像和视频文本提取新算法。实验表明在彩色图像和视频的文本提取中,文中算子形成的二值边缘图像的文本区域轮廓清晰完整,有利于下一步文本区域与背景的剥离,该算法具有较高的广西区域提取准确率和较好的对于文本字符在尺寸和颜色方面的适应性。  相似文献   

12.
对表格手写数字串的提取问题进行研究,提出一种基于混合二值化的单元格字符准确定位和完整提取方法,其核心是感兴趣单元格的定位与提取和断裂笔划的修复.该方法可克服书写时带来的各种常规影响,把表格中的手写数字完整提取出来.实验结果表明本文方法的有效性.  相似文献   

13.
视频和图像中的文本通常在基于内容的视频数据库检索、网络视频搜索,图像分割和图像修复等中起到重要作用,为了提高文本检测的效率,给出了一种基于多种特征自适应阈值的视频文本检测方法.方法是在Michael算法的基础上,利用文本边缘的强度,密度,水平竖直边缘比3个特征计算自适应局部阈值,用阈值能较好去除非文本区域,提取文本边缘,检测并定位文本,减少了Michael算法单一特征阈值的不利影响.在文本定位阶段引入了合并机制.减少了不完整区域的出现.实验结果表明有较高的精度和召回率,可用于视频搜索、图像分割和图像修复等.  相似文献   

14.
王举辉  刘晓红  王英永 《微计算机信息》2007,23(33):239-240,291
对当前存在的两种效果较好的二值化算法进行了分析和研究,提出了一种效果更好的融合算法。该算法既能有效地消除配饰物的影响,又能使二值化后的图像目标更加突出。实验表明,该算法具有较好的鲁棒性。  相似文献   

15.
表格文本图像中文字的提取算法   总被引:1,自引:0,他引:1  
提出了一种从含有表格的文本图像的页面中提取文字的算法。该算法通过模板扫描形成包围图像前景像素的矩形框。从而提取出前景像素,进而组合矩形框形成模式链。利用模式的最大黑游程、长、宽三个统计特征实现对模式的分类。实验结果表明,该算法不仅对普通的表格有效,而且还可以从倾斜的表格及流程图中成功地提取出文字。本算法只适用于二值图像。  相似文献   

16.
随着深度学习技术的发展,自然场景文本检测的性能获得了显著的提升.但目前仍然存在两个主要的挑战:一是速度和准确度之间的权衡,二是对任意形状的文本实例的检测.本文采用基于分割的方法高效准确的检测任意形状场景文本.具体来说,使用具有低计算成本的分割头和简洁高效的后处理,分割头由特征金字塔增强模块和特征融合模块组成,前者可以引入多层次的信息来指导更好的分割,后者可以将前者给出的不同深度的特征集合成最终的特征进行分割.本文采用可微二值化模块,自适应地设置二值化阈值,将分割方法产生的概率图转换为文本区域,从而提高文本检测的性能.在标准数据集ICDAR2015和Total-Text上,本文提出的方法使用轻量级主干网络如ResNet18在速度和准确度方面都达到了可比较的结果.  相似文献   

17.
针对光照不均的文本图像在二值化后文字识别率底下的问题,文章提出了一种针对光照不均图像进行二值化和图像增强的算法。针对图像进行分块处理,根据每块自身的平均灰度值和均方差以及全图的平均灰度值来进行算法的自适应变换,已达到对不同光照的区块进行不同处理的目的。实验结果表明本算法能够比较有效的完成对光照不均的文本图像的处理,比单纯的二值化处理方法有一定的提高。  相似文献   

18.
边缘与灰度检测相结合的场景图像文本定位   总被引:1,自引:0,他引:1       下载免费PDF全文
自然场景图像中包含大量的图像和文本信息,其文本字符能够提供重要的语义信息。利用计算机自动检测并识别自然场景中的文本信息,是模式识别和文字信息处理领域重要的研究内容。本文提出一种有效的从场景图像中定位文本的方法,其原理为:首先基于边缘检测进行文本区域粗定位,对定位到的区域进行灰度检测,来确定文本域中的字符位置,其后对所得到的检测区域进行筛选,去掉噪声区域,获取到目标文本域。实验结果表明,本文提出的方法对字体的大小、样式、颜色、以及排布方向具有较强的鲁棒性, 能够准确定位并提取自然场景下的文本信息。  相似文献   

19.
基于连通域提取的车牌字符分割算法   总被引:9,自引:0,他引:9  
车牌字符分割是车牌识别系统的三大关键技术之一.为了准确地进行字符分割,提高字符识别的准确率和识别的速度,提出了一种改进的连通域提取车牌字符分割算法,算法通过扫描目标像素的若干相邻像素后按照一定的准则确定目标像素与相邻像素之间的连通关系,可克服同类算法中像素重复标记和归并标记需大量运算的缺陷,最后得到正确的连通标记划分并能提取出各个分离的连通区域.实验表明算法能够准确快速地识别字符,且具有较好的稳健性.  相似文献   

20.
文本可见水印技术主要用于明确文本类数字媒体的版权标识,防止非法使用。现有文本可见水印算法的抗二值化攻击能力较差,为克服此缺陷,根据文本图像的灰度分布和纹理的特点,提出了一种基于灰度均匀分布的自适应文本可见水印算法。首先提取文本行轮廓,然后依据行轮廓自适应产生嵌入强度,再由嵌入强度对水印黑色像素进行筛选,最后将载体文本与筛选后的水印映射到同一灰度范围。该算法具有嵌入强度自适应、嵌入位置随机和抗二值化攻击等特点。实验结果显示,算法在不影响载体文本可读性的同时,具有良好的水印可视性和鲁棒性,适用于任何形式的二值文本和图形水印。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号