首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
票据图像中的格线检测与去除   总被引:1,自引:0,他引:1  
针对票据图像中手写体字符常常与格线交叠的情况,提出了一种直接利用图像灰度信息的格线检测与去除算法。利用字符和格线的边缘信息定位格线并检测字线的交点,然后根据笔画与格线的两种交叠方式(相割与相交)将格线上的像素划分为两个区域:保护区和擦除区,最后动态地选取填充色去除擦除区内的像素。该算法避免了二值化,对806张真实票据中的小写金额域的识别结果比较,显示了该算法的有效性和鲁棒性。  相似文献   

2.
表格型票据中框线检测与去除算法   总被引:1,自引:0,他引:1  
字符笔画与表格线的粘连或交叠是表格型票据中普遍存在的现象,严重影响了后期票据自动识别处理的性能.现有方法大多基于二值图像,未能充分利用灰度图中的框线特征.基于票据图像中的框线特征,提出一种表格型票据预处理中的框线检测与去除算法,首先充分利用票据灰度图像的特点准确地检测出框线,再采用一种连通链结构描述叠加后的框线区域,然后对交叠进行判断和标记,根据标记保留字符笔划去除框线干扰.经过实际银行支票图像测试证明了算法的有效性和鲁棒性.  相似文献   

3.
字线交叠是表格处理中经常遇到的问题,它严重干扰了字符识别.本文提出一种基于线宽信息的表格框线去除算法-线宽阈值法.字符内采用较小的阈值去除框线,字符间采用较大的阈值,使本方法具有很好的抗噪声能力.针对数字与框线交叠的特殊情况,本文提出并比较了两种利用先验知识的方法:启发式先验知识法和识别反馈法.增值税发票的识别实验结果表明,本算法能使字线交叠情况下数字的识别率与字线不交叠的情况相当.  相似文献   

4.
利用动态结构元素提取直线   总被引:1,自引:2,他引:1  
研究了灰度文档图像中提取直线的方法.首先将灰度文档图像利用半色调技术转换为二值图像,进行倾斜矫正后利用Hough变换动态构造结构元素(HTSEC);然后根据这些结构元素,利用数学形态学中的击中/击不中变换提取文档图像中的直线(MMLE)。  相似文献   

5.
一种导航线快速检测算法   总被引:1,自引:0,他引:1       下载免费PDF全文
导航线的宽度、灰度在图像中具有均匀一致性,根据这些特征,可以进行导航线的鲁棒检测。对图像上的一行,先进行水平方向上的边缘检测,对相邻的2个边缘点,如果其距离大于导航线宽度减2,而小于导航线宽度的2倍,并且这2点间像素灰度值的方差比较小,则这2点就可能是导航线的边界点。对图像的若干行进行处理得到这些点对后,利用快速哈夫变换去除非导航线边界点,再利用最小二乘法精确拟合得到导航线的直线方程。针对实际图像的检测实验表明,该算法能从复杂背景中快速鲁棒地检测出导航线。  相似文献   

6.
识别域图像的提取是文档自动处理系统中一个重要的预处理过程。在实际应用中,用户填写的信息常常与版面中的框线和背景字符存在交叠现象,严重影响了系统的性能。本文提出了基于点边距离分析的背景字符去除算法。首先通过灰度图像匹配的方法精定位背景字符子图像;然后利用形态学方法结合笔画的宽度信息对背景字符子图像进行二值化;最后分析像素点到边界距离的变化确定需要填充的像素位置,并通过形态学方法计算像素的填充值。实验采用了真实票据图像中的日期域,实验结果表明本文的方法获得了基本令人满意的效果,背景字符像素被成功去除。  相似文献   

7.
基于字线分离的表格识别预处理算法   总被引:1,自引:1,他引:0  
表格文本图像版面中存在的大量的非表格框线对象,干扰正确提取表格框架结构.提出了一种基于字线分离的预处理算法.该算法在不提取表格框线的前提下,采用图像分块和连通域分析,实现字线分离.实验结果表明,该算法能够滤除大部分文字像素,准确有效突出表格文本图像中的框线信息,达到了预处理目的,是后续表格特征提取和识别的有效预备步骤.  相似文献   

8.
一种直线提取的新方法   总被引:8,自引:0,他引:8  
直线提取是版面分析中的一个重要过程。该文提出了基于Hough变换的结构元素构造方法(HTSEC)以及基于数学形态学的直线提取方法(MMLE),即首先将灰度文档图像利用半色调技术转换为二值图像,利用Hough变换检测直线倾斜角度以动态构造结构元素,然后利用数学形态学方法提取文档图像中的直线。  相似文献   

9.
提出一种基于距离加权的自适应字线分离算法。应用一定的启发式规则,计算表格线上像素点的权值,将权值与阈值相比较来判断该点是否为字符上的点,其中权值和阈值根据具体表格自动确定。该算法与表格线检测方法无关,且易于实现。实验结果表明,可以很好地处理字线交叠问题,提高了表格识别的正确率。  相似文献   

10.
基于有向单连通链的表格框线检测算法   总被引:12,自引:0,他引:12  
表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息.提出了一种基于所定义的图像结构基元"有向单连通链"的自底向上表格框线检测算法.在此算法中,有向单连通链是一种黑像素游程序列,作为非常合适的矢量基元,在引入一定表格框线约束信息的条件下合并单连通链,有效地去除伪框线,补全断裂的框线,提高了算法的鲁棒性,可以准确而快速地提取表格框线.通过滤除噪声单连通链,加快单连通链的合并速度,算法速度提高了3~10倍,满足了实用要求.实验证明,该算法具有速度  相似文献   

11.
各种文档中经常包含有各种特殊作用的横线、手划线等,当这些文档通过扫描等数字化方式存入计算机并需要进一步识别处理成文字编码时,这些线条却成为OCR的干扰因素,降低了文档内容的识别率.为此,本文提出一种新的文档干扰线去除算法,先将文档图像二值化,二值化过程考虑了不均匀光照带来的影响;然后将前景细化为单像素,减少线条粗细造成的影响;接着通过一种改进的贪婪算法计算横、竖两个方向线段的权重,判断权重较高的线段为干扰线;最后通过与干扰线距离的大小判断图像中每个前景像素的归属,从而获得一个完整的文档恢复图.仿真实验表明,本文提出的算法能够有效去除干扰线,特别在干扰线与文字粘连的情况下,去除干扰线的同时较少地影响文档图像的质量,且具有较高的计算速度和较好的去除效果,为图像进一步OCR识别提供了良好的基础.  相似文献   

12.
文档处理中消除线噪声的研究   总被引:10,自引:2,他引:8  
文中讨论了在文档处理中对表格当图像处理的一种预处理方法。由于表格型文档的框线会和文档中字符粘连或交叠。这将会降低OCR系统识别模块的性能,从而影响系统整体性能。文中无针对这种情况提出了去除文档图像中线噪声的一个和基本模型,给出了该基本模型消除线噪声的具体算法。  相似文献   

13.
基于视窗的OCR页面图像倾斜检测方法   总被引:2,自引:0,他引:2       下载免费PDF全文
文档在扫描输入过程中,所生成的页面图像一般都存在一定的角度倾斜,当页面图像倾斜角度过大时,将对进一步的版面分析以及字符识别产生不良影响。为了快速准确地检测页面图像倾斜角度和降低计算量,提出了一种基于视窗变换的页面图像倾斜检测方法,该算法首先对视窗中的文字及图片的细节部分进行模糊,然后对其边沿进行直线拟合,以便快速检测页面图像倾斜角度。实验结果表明,该方法能快速准确地检测出各类页面图像的倾斜角度,并具有良好的适应性。  相似文献   

14.
This paper presents a methodology for document processing, by separating text paragraphs from images. The methodology is based on the recognition of text characters and words for the efficient separation text paragraphs from images by keeping their relationships for a possible reconstruction of the original page. The text separation and extraction is based on a hierarchical framing process. The process starts with the framing of a single character, after its recognition, continues with the recognition and framing of a word, and ends with the framing of all text lines. The text line form a natural language text which requires analysis.  相似文献   

15.
康厚良  杨玉婷 《图学学报》2022,43(5):865-874
以卷积神经网络(CNN)为代表的深度学习技术在图像分类和识别领域表现出了非常优异的性能。 但东巴象形文字未有标准、公开的数据集,无法借鉴或使用已有的深度学习算法。为了快速建立权威、有效的东 巴文字库,分析已出版东巴文档的版面结构,从文档中提取文本行、东巴字成为了当前的首要任务。因此,结合 东巴象形文字文档图像的结构特点,给出了东巴文档图像的文本行自动分割算法。首先利用基于密度和距离的 k均值聚类算法确定了文本行的分类数量和分类标准;然后,通过文字块的二次处理矫正了分割中的错误结果,提 高了算法的准确率。在充分利用东巴字文档结构特征的同时,保留了机器学习模型客观、无主观经验影响的优势。 通过实验表明,该算法可用于东巴文档图像、脱机手写汉字、东巴经的文本行分割,以及文本行中东巴字和汉字 的分割,具有实现简单、准确性高、适应性强的特点,从而为东巴文字库的建立奠定基础。  相似文献   

16.
A novel text line extraction technique is presented for multi-skewed document images of handwritten English or Bengali text. It assumes that hypothetical water flows, from both left and right sides of the image frame, face obstruction from characters of text lines. The stripes of areas left unwetted on the image frame are finally labelled for extraction of text lines. The success rate of the technique, as observed experimentally, are 90.34% and 91.44% for handwritten Bengali and English document images, respectively. The work may contribute significantly for the development of applications related to optical character recognition of Bengali/English text.  相似文献   

17.
在对文档图像进行光学字符识别时,由于书籍扭曲的存在,识别率会降低。对于 含有页眉页脚线的扭曲文档图像,提出一种快速校正方法。首先分别检测并定位图像中的页眉 线,保存页眉线的坐标信息。根据等比算法计算页眉线上各点在校正时所需向上或向下移动的 距离,然后以此距离为参数扫描图像,计算页眉页脚线之间的各个目标像素校正所需移动的距 离,同时进行像素点的移动重构图像,最终得到校正的图像。实验结果表明,该方法校正效果明显, 对于包含页眉页脚线的扭曲文档图像有较好的校正效果,校正后OCR 识别率大幅度提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号