期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

针对复杂场景文本,提出了通过投影产生候选文本块的新算法和针对该算法的候选文本块分析方法.首先根据MLP网络的输出确定图像每个像素点是文本像素点还是非文本像素点,得到候选二值图像.然后根据候选二值图像使用投影法生成候选文本块,针对该投影法,本文提出了频率分析法剔除非文本块,有效的提高了定位准确率.实验表明,本文的方法实现简单,而且可以得到较好的文本定位效果. 相似文献

6.

自然场景文本定位 总被引：7，自引：0，他引：7

欧文武朱军民刘昌平《中文信息学报》2004,18(5):43-47,63

随着自然场景文本识别研究的不断深入,建立标准的场景文本图像库和了解该领域的研究现状变得越来越重要。为此,2003年国际文档分析和识别大会专门建立了一个这样的图像库,并组织了自然场景文本识别比赛,我们参加了其中的自然场景文本定位分赛。本文对我们参加这次比赛的算法做了介绍并给出了比赛结果,在文章最后,对参赛算法做了比较,指出了场景文本定位的发展现状。相似文献

7.

复杂背景下的图像文本区域定位方法研究

下载免费PDF全文

周翔陈会张锴宋怀波《计算机工程与应用》2013,49(12):101-105

提出了一种基于YUV颜色空间与支持向量机的复杂背景文本区域定位方法。算法将图像由RGB颜色空间转换至YUV颜色空间;利用最小二乘法对图像的色调直方图曲线进行拟合并确定最佳拟合阶次,利用拟合后的曲线对图像进行颜色分层聚类;对分解出的各颜色图层分别进行处理,得到备选文本连通域;提取备选文本连通域的小波纹理特征并利用SVM进行文本判别。实验结果表明,提出的方法定位准确率在65%以上,可以有效地实现复杂背景下图像文本区域的定位。相似文献

8.

基于多级文本检测的复杂文档图像扭曲矫正算法

寇喜超张鸿锐冯杰郑雅羽《计算机科学》2021,48(12):249-255

文档的扭曲矫正是进行文档OCR(Optical Character Recognition)的基础步骤,对提高OCR的准确率有重要作用.文档图像的扭曲矫正常常依赖于文本的提取,然而目前文档图像矫正算法大都无法对复杂文档中的文本进行准确定位和分析,导致其矫正效果不理想.针对此问题,提出了一种基于全卷积网络的文字检测框架,并使用合成文档对网络进行针对性训练,可实现对字符、词、文本行三级文本信息的准确获取,进而对文本进行自适应采样并利用三次函数对页面进行三维建模,将矫正问题转化为模型参数优化问题,达到矫正复杂文档图像的目的.使用合成扭曲文档以及真实测试数据进行矫正实验,结果表明,提出的矫正方法能够对复杂文档进行精确的文本提取,明显改善了复杂文档图像矫正后的视觉效果,相比于其他算法,该算法矫正后OCR的准确率得到显著提高. 相似文献

9.

基于颜色边缘与SVM的图像文本定位

许剑峰黎绍发《计算机应用研究》2006,23(3):155-157

提出了一种将颜色边缘与SVM相结合的文本定位与提取的方法。首先根据文本的颜色边缘特征进行粗筛选,获得文本候选区;然后使用SVM分类器进行文本与非文本分类,实现文本区域定位与提取。实验表明,该方法取得了良好的效果。相似文献

10.

视频文本定位

欧文武朱军民刘昌平《计算机工程与应用》2004,40(30):65-67

视频中的文字为视频的检索、编码、分类等提供了许多重要的信息。论文介绍了一种基于先验知识和机器学习的文本定位方法。利用彩色视频图像的边缘信息和先验知识得到备选文本区域;用多通道Gabor滤波器提取备选区域特征,通过BP网络验证备选文本区域。相似文献

11.

印刷体中文文档中数学公式字符的定位

王科俊陈卉刘维平李永华《自动化技术与应用》2008,27(11):71-73

数学公式字符的定位对整个印刷体中文文档识别系统而言是提高其识别率的重要内容之一。在介绍典型的数学公式字符定位技术的基础上,提出了一种新的两级公式字符定位方法。该方法是采用了印刷体中文文档中不同字符之间的投影分布特征的不同与汉字识别拒识公式字符的思想结合起来对公式字符进行定位。从实验结果可以看出该定位方法能够在公式字符定位的准确率和时间上有了较大的改进,为提高印刷体中文文档识别系统的识别率奠定了基础。相似文献

12.

一种视频中字符的集成型切分与识别算法 总被引：3，自引：0，他引：3

杨武夷张树武《自动化学报》2010,36(10):1468-1476

视频文本行图像识别的技术难点主要来源于两个方面: 1)粘连字符的切分与识别问题; 2)复杂背景中字符的切分与识别问题. 为了能够同时切分和识别这两种情况中的字符, 提出了一种集成型的字符切分与识别算法. 该集成型算法首先对文本行图像二值化, 基于二值化的文本行图像的水平投影估计文本行高度. 其次根据字符笔划粘连的程度, 基于图像分析或字符识别对二值图像中的宽连通域进行切分. 然后基于字符识别组合连通域得到候选识别结果, 最后根据候选识别结果构造词图, 基于语言模型从词图中选出字符识别结果. 实验表明该集成型算法大大降低了粘连字符及复杂背景中字符的识别错误率. 相似文献

13.

图像中多语种文本提取的高斯混合建模方法

付慧刘峡壁贾云得《计算机研究与发展》2007,44(11):1920-1926

建立了相邻字符区域的高斯混合模型,用于区分字符与非字符.在此基础上,提出了一种从图像中提取多语种文本的方法.首先对输入图像进行二值化,并执行形态学闭运算,使二值图像中每个字符成为一个单独的连通成分.然后根据各连通成分重心的Voronoi区域,形成连通成分之间的邻接关系;最后在贝叶斯框架下,基于相邻字符区域的高斯混合模型计算相应的伪概率,以此为判据将每个连通成分标注为字符或非字符.利用所提出的文本提取方法,进行了复杂中英文文本的提取实验,获得大于97%的准确率和大于80%的召回率,证实了方法的有效性. 相似文献

14.

电磁泄漏还原图像中的中文文本识别技术研究

下载免费PDF全文

吕志强张磊夏宇琦张宁《信息安全学报》2021,6(3):212-226

现代计算机的显示信号传输过程存在的电磁泄漏,从电磁泄漏还原得到的图像会受到噪声的严重污染,使得其中的文本内容难以识别.本文提出了一种新的模型,利用基于特征强化的神经网络(Feature Enhancement based Neural Network,FENN)对电磁泄漏还原图像中的中文文本进行识别.模型将去噪自编码器... 相似文献

15.

复杂车辆图像中的车牌快速形态定位算法

YANG Shu-bin ZHANG Yang 《微机发展》2008,(6)

针对复杂环境下的车牌定位问题,提出了一种基于形态学的快速车牌定位方法。该方法先对车牌图像进行预处理和二值化,然后用形态学方法对二值化后的图像进行系列形态运算,将车牌图像分割为一个个独立的小区域,根据车牌特性去掉较小的区域,并对保留的连通域进行标记,最后用车牌形状特性进行车牌快速定位。实验结果表明,该方法定位效果好,速度快,适于应用对现实的车牌图像进行定位。相似文献

16.

一种名片图像的文字区块分割方法

下载免费PDF全文

胡景锋吕岳《计算机工程》2008,34(21):169-171

(Department of Computer Science and Technology, East China Normal University, Shanghai 200062) 相似文献

17.

深度学习在场景文字识别技术中的应用综述

下载免费PDF全文

刘艳菊伊鑫海李炎阁张惠玉刘彦忠《计算机工程与应用》2022,58(4):52-63

随着深度学习技术在计算机视觉领域的发展,场景文本检测与文字识别技术也有了突破性的进展.受到自然场景下极端光照、遮挡、模糊、多方向多尺度等情况的影响,无约束的场景文本检测与识别仍然面临着巨大的挑战.从深度学习的角度对场景文本检测和文字识别技术进行深入研究,总结出在文本检测技术中将基于分割的方法与回归的方法优势相结合,可以... 相似文献

18.

基于梯度增强的新闻字幕分割算法 总被引：2，自引：0，他引：2

王一丁蒋小森《计算机辅助设计与图形学学报》2009,21(8)

新闻字幕的分割在基于语义的新闻视频检索系统中具有重要的意义,为此提出一种基于梯度增强的新闻字幕分割箅法.该算法使用图像多方向梯度的加权和代替图像的标准方差,通过各方向权值的调节加强某些方向的边缘信息,以提高分割效果.与一些经典的自适应阈值分割算法相比,该算法不仅能够保留大部分笔画,也能有效地减少断笔问题.基于光学文字识别的实验结果证明了文中算法的有效性. 相似文献