首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
针对OCR 在识别文本图像时,由于扭曲造成的中英文混排文本图像识别率不理想 的情况,提出一种快速扭曲校正方法。图像经过预处理后,首先利用形态学膨胀定位文本行, 得到各文本行上下边界;分别对每个文本行参考垂直投影信息进行文字切分,获得字符包围盒; 然后根据中英文的不同特点在每个文本行中逐个对字符位置进行校正,最终实现图像重构。实 验结果表明,该方法校正速度快、精度高,对于中英文混排扭曲文档图像有较好地校正效果, 校正后图像OCR 识别率有明显提高。  相似文献   

2.
图像和视频中包含着丰富的文本信息,提取和识别图像文本信息非常具有实际意义.传统的图像文本信息提取方法大多基于字符的代数和几何特征.作者从另一个角度出发,将彩色字符看成彩色图像的一部分,使类似字符的景物也可以被当作字符识别出来.提出一种基于Mean-Shift算法的图像文本信息提取方法,首先利用Mean-Shift算法对图像进行分割,然后对分割得到的文本区域进行投影分析从而将每个字符分割出来,最后将字符识别.  相似文献   

3.
针对在通过拍照采集图像的过程中由于光照不均而造成的文本图像的噪声问题,研究了文本图像区别于一般图像的结构特征和噪声特征,提出了一种基于文本图像的投影结合分块形态学的快速去噪方法.该方法对输入的文本图像进行二值化,对二值化后的文本图像进行投影处理,根据对投影结果进行分析来快速去除行列间噪声,根据行列间噪声的多少产生一个阈值,通过这个阈值来确定分块后的图像是否需要字符内去噪,字符内去噪则采用形态学滤波法.实验结果证明,该方法对于正常情况下光照不均的文本图像的去噪较传统的全局去噪算法的效率更高,效果更好.  相似文献   

4.
图像和视频中包含着丰富的文本信息,提取和识别图像文本信息非常具有实际意义。传统的图像文本信息提取方法大多基于字符的代数和几何特征。作者从另一个角度出发,将彩色字符看成彩色图像的一部分,使类似字符的景物也可以被当作字符识别出来。提出一种基于Mean-Shift算法的图像文本信息提取方法,首先利用Mean-Shift算法对图像进行分割,然后对分割得到的文本区域进行投影分析从而将每个字符分割出来,最后将字符识别。  相似文献   

5.
基于Mean-Shift的图像文本信息提取   总被引:1,自引:1,他引:0  
图像和视频中包含着丰富的文本信息,提取和识另4图像文本信息非常具有实际意义。传统的图像文本信息提取方法大多基于字符的代数和几何特征。作者从另一个角度出发,将彩色字符看成彩色图像的一部分,使类似字符的景物也可以被当作字符识别出来。文中提出一种基于Mean-Shift算法的图像文本信息提取方法,首先利用Mean-Shift算法对图像进行分割,然后对分割得到的文本区域进行投影分析从而将每个字符分割出来,最后将字符识别。  相似文献   

6.
针对扭曲中文文本图像文字识别率不理想这一问题,提出一种基于连通域的文本图像快速扭曲校正方法。根据汉字结构特征合并连通域,实现切分文字;利用就近聚合文字的方法定位文本行,按行垂直校正每个文字位置,获得被校正的图像。实验结果表明,该方法校正速度快,对严重扭曲的中文文本图像能取得较好的校正效果,校正后图像的OCR识别率明显提高。  相似文献   

7.
针对目前对文本图像倒置判断过分依赖文本标点的局限以及判断准确率不理想的问题,提出了一种新的中文文本图像倒置判断算法。算法运用投影法,对汉字进行定位,充分利用汉字笔画连续属性以及动态搜寻路径寻找撇笔迹,最后根据撇笔画的轮廓与走向特征运用特定的策略与算法判定出文本的方向。此法不仅很好地解决了上述问题,同时对扭曲的文本图像的倒置判断也有良好的效果。实验结果也验证了此法的可行性与有效性。通过实验结果与现有倒置判断算法相比,此法更具普遍适用性,在效率和准确率上也得到了较大的提高。  相似文献   

8.
目前,OCR技术对文本图像区域自动区分的效果还不够精确,进而影响了OCR技术在文献信息数字化过程中的工作效率.针对这一局限,提出了一种基于小波的文本图像区分方法.方法首先对扫描区域进行小波分解,然后使用分解系数构建分解能量,最后依据分解能量大小对文本图像进行自动区分.结果表明,该方法对文本图像的区分效果较好,减少了在使用OCR技术进行文献信息数字化时的人为干预,有利于提高文献信息数字化过程的自动化水平.最后通过实验仿真验证了该方法的有效性.  相似文献   

9.
图像中的文本字符存在于杂乱的背景之中,拍摄视角的不同使得文本具有较大的几何变形,再加上存在光照变化、字符颜色不统一等现象会导致背景分离和文本识别困难.为此提出一种基于图像文本区域的图像聚类方法.该方法首先对自然场景图像中已定位的文本区域提取局部特征描述,并使用随机投影方法将局部特征矢量集映射为固定维的特征向量,然后对包含图像文本区域的图像进行聚类.这种方法避免了由图像分割与字符识别带来的困难.实验结果表明,该方法可以对包含文字的自然场景图像有效地进行聚类,聚类的准确率能达到86.66%.  相似文献   

10.
文档的扭曲矫正是进行文档OCR(Optical Character Recognition)的基础步骤,对提高OCR的准确率有重要作用.文档图像的扭曲矫正常常依赖于文本的提取,然而目前文档图像矫正算法大都无法对复杂文档中的文本进行准确定位和分析,导致其矫正效果不理想.针对此问题,提出了一种基于全卷积网络的文字检测框架,并使用合成文档对网络进行针对性训练,可实现对字符、词、文本行三级文本信息的准确获取,进而对文本进行自适应采样并利用三次函数对页面进行三维建模,将矫正问题转化为模型参数优化问题,达到矫正复杂文档图像的目的.使用合成扭曲文档以及真实测试数据进行矫正实验,结果表明,提出的矫正方法能够对复杂文档进行精确的文本提取,明显改善了复杂文档图像矫正后的视觉效果,相比于其他算法,该算法矫正后OCR的准确率得到显著提高.  相似文献   

11.
李相葛  罗红  孙岩 《软件学报》2023,34(11):5143-5161
深度神经网络容易受到来自对抗样本的攻击,例如在文本分类任务中修改原始文本中的少量字、词、标点符号即可改变模型分类结果.目前NLP领域对中文对抗样本的研究较少且未充分结合汉语的语言特征.从中文情感分类场景入手,结合了汉语象形、表音等语言特征,提出一种字词级别的高质量的对抗样本生成方法 CWordCheater,涵盖字音、字形、标点符号等多个角度.针对形近字的替换方式,引入ConvAE网络完成汉字视觉向量的嵌入,进而生成形近字替换候选池.同时提出一种基于USE编码距离的语义约束方法避免对抗样本的语义偏移问题.构建一套多维度的对抗样本评估方法,从攻击效果和攻击代价两方面评估对抗样本的质量.实验结果表明, CWordAttacker在多个分类模型和多个数据集上能使分类准确率至少下降27.9%,同时拥有更小的基于视觉和语义的扰动代价.  相似文献   

12.
中文分词是中文自然语言处理的重要任务, 其目前存在的一个重大瓶颈是未登录词识别问题. 该文提出一种非监督的基于改进PMI和最小邻接熵结合策略的未登录词识别方法. 滤除文本中无关识别的标点符号和特殊字符后, 此方法先运用改进PMI算法识别出文本中凝聚程度较强的字符串, 并通过停用词词表和核心词库的筛选过滤, 得到候选未登录词; 然后, 计算候选未登录词的最小邻接熵, 并依据词频-最小邻接熵判定阈值, 确定出文本中的未登录词. 通过理论及实验分析, 此方法对不同的文本, 在不需要长时间学习训练调整参数的情况下, 即可生成个性化的未登录词词典, 应用于中文分词系统后, 其分词正确率、召回率分别达到81.49%、80.30%.  相似文献   

13.
针对实际应用场景中如何在大批量图像文件中快速找到中文印刷体文本图像文件进行OCR (Optical Character Recognition)识别的问题,本文在笔画宽度变换算法(SWT)的基础上,设计了针对中文文本固有特点的启发式规则,并将水平投影技术与离散傅里叶变换相结合,提出了一种适合倾斜角度在-90至90°之间的中文印刷体文本图像文件识别技术.实验结果显示,在1606张测试集图像文件的识别中,本文算法针对文本图像文件整体识别F值(F-Measure)为0.95,平均识别耗时为0.65 s.  相似文献   

14.
针对车辆牌照字符这一特殊场景文本的提取,提出一种压缩域文本提取算法,它集文本区域检测、定位、跟踪和字符识别等环节于统一的框架。直接利用DCT系数可以表征图像的纹理特征这一特性,建立加权频率分量和的自适应阈值判断规则初步检测车辆牌照区域,利用分块的DC+2AC纹理值投影特征进行文本定位;利用与定位得到的文本框相交面积高于预定阈值的宏块运动矢量均值实现跟踪;在OCR识别前采用OTSU算法把车辆牌照区域图像转换为黑白二值图像。实验表明了算法的有效性,召回率与准确率分别可达95%与96.2%,该算法也适用于其他类型文本的提取。  相似文献   

15.
一种新的彩色图象文字提取算法   总被引:3,自引:0,他引:3  
文字信息在描述图象内容时起着重要的作用,因此文字提取及识别是基于内容视频检索的关键技术。提出了一个从彩色图象背景中提取文字的快速而有效的算法。由于文本字符串的对比度较高,首先用一个改进的sobel算子将彩色图象变换为二值的边缘图象,再对该边缘图象进行涂抹处理,然后基于候选文本区的特征从不同复杂度的彩色图象中提取文本信息,最后将提取出的文本输入到文字识别(OCR)引擎,识别结果证明了此方法的有效性。  相似文献   

16.
Extraction and recognition of artificial text in multimedia documents   总被引:1,自引:0,他引:1  
Abstract The systems currently available for contentbased image and video retrieval work without semantic knowledge, i. e. they use image processing methods to extract low level features of the data. The similarity obtained by these approaches does not always correspond to the similarity a human user would expect. A way to include more semantic knowledge into the indexing process is to use the text included in the images and video sequences. It is rich in information but easy to use, e. g. by key word based queries. In this paper we present an algorithm to localise artificial text in images and videos using a measure of accumulated gradients and morphological processing. The quality of the localised text is improved by robust multiple frame integration. A new technique for the binarisation of the text boxes based on a criterion maximizing local contrast is proposed. Finally, detection and OCR results for a commercial OCR are presented, justifying the choice of the binarisation technique.An erratum to this article can be found at  相似文献   

17.
基于纹理梯度的文档图像的倾斜校正方法   总被引:3,自引:0,他引:3  
文档图像的倾斜校正在光学字符识别以及文档理解系统研究中有着重要的意义,国内外学者提出了很多实现方法,但各种方法都存在一定的局限性.通过对基于Hough变换和投影的倾斜校正方法的分析,提出了一种基于文档图像纹理方向的倾斜校正方法:文档图像中的文本纹理整体表现出一定的方向性,使文本图像能保持水平,通过纹理方向性分析,找出纹理的主要方向,进而求得文档的倾斜角度.通过一个复杂版面的二值文档图像的检测校正实验表明,方法提高了倾斜校正的校正范围,而且具有较好的有效性和鲁棒性.  相似文献   

18.
在中文文本特别是在社交媒体及问答领域文本中,存在非常多的标点符号错误或缺失的情况,这严重影响对文本进行语义分析及机器翻译等各项自然语言处理的效果。当前对标点符号进行预测的相关研究多集中于英文对话的语音转写文本,缺少对社交媒体及问答领域文本进行标点符号预测的相关研究,也没有这些领域公开的数据集。该文首次提出跨领域中文标点符号预测任务,该任务首先利用标点符号基本规范正确的大规模新闻领域文本,建立标点符号预测模型;然后在标点符号标注不规范的社交媒体及问答领域,进行跨领域标点符号预测。随后,构建了新闻、社交媒体及问答三个领域的相应数据集。最后还实现了一个基于BERT的标点符号预测基线模型并在该数据集上进行了实验与分析。实验结果表明,直接利用新闻领域训练的模型,在社交媒体及问答领域进行标点符号预测的性能均有所下降,在问答领域下降较小,在微博领域下降较大,超过20%,说明跨领域标点符号预测任务具有一定的挑战性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号