共查询到19条相似文献,搜索用时 62 毫秒
1.
灰度图象的二值化与行列切分是预处理中的重要环节,对识别系统有很大的影响。针对带有框线的文稿图象,本文提出了双重阈值法的二值化方法,有效地去除了框线。在字符分割部分。本文提出了先三行后单行列切分的方法,准确地提取了字符。 相似文献
2.
手写文档图像中存在光照不均、笔墨浸染、纸张退化、阴影等复杂情况,针对文档图像在复杂背景下二值化后OCR效果不理想的问题,提出了一种对改进的背景估计和局部自适应集成的二值化方法。首先利用局部自适应方法得到具有高召回率的二值化图像,然后对背景估计的方法进行改进得到具有高精确率的二值化图像,最后基于连通域的方法将两种类型的图像集成得到结果。使用4种评价指标在DIBCO2013和DIBCO2016手写数据集上进行了对比实验,结果表明该方法整体性能优于Otsu, Wolf, Niblack, Sauvola, Singh和Howe等经典算法。 相似文献
3.
对表格手写数字串的提取问题进行研究,提出一种基于混合二值化的单元格字符准确定位和完整提取方法,其核心是感兴趣单元格的定位与提取和断裂笔划的修复.该方法可克服书写时带来的各种常规影响,把表格中的手写数字完整提取出来.实验结果表明本文方法的有效性. 相似文献
4.
5.
6.
7.
8.
胡超群 《计算机应用与软件》1998,15(1):29-32,36
本文提出了一种新的动态二值化算法,以实现从灰度点阵图象中提取其对象。通过分析象素和其所在的局部区和灰度值等数字特征,可以判断局部区的内是否存在对象,阈值和判断条件对应。 相似文献
9.
10.
粘连手写汉字的切分是手写汉字切分中亟待解决的问题之一。因此,针对粘连手写汉字提出一种新的切分算法。该算法首先通过寻找分界线的方法来提取粘连笔段,分界线的位置是通过粘连汉字骨架图像的聚类和笔段端点类属可信度的信息来确定的。然后提取粘连笔段并对其进行分析和类型(直线或曲线)判定,从而确定切分点及切分方向。最后利用背景细化算法找到分割曲线。该算法不仅能够很好地适用于两个粘连汉字宽窄不一、含有多个粘连点等粘连情况,而且具有良好的抗噪声效果。 相似文献
11.
汉字切分是汉字识别系统中必不可少的组成部分,但由于手写体汉字的书写多变而随意,极大地增加了汉字分割的难度。文中回顾了近十年来脱机手写体汉字分割的发展历程及在发展中涌现的一些主要类型的切分方法,分析了每一类方法的优缺点及其包含的各个分支。最后,参考各种方法的优缺点,对今后的手写体汉字分割发展方向进行了展望。 相似文献
12.
针对古籍古文献中部分汉字易发生粘连现象,提出一种古籍手写汉字多步分割方法.该方法继承了以往粗分割和细分割相结合的思想,首先采用投影进行粗分割,将手写汉字分为粘连字符和非粘连字符两类;然后针对粘连字符串抛弃常用的串行模式,直接采用粗分割的统计信息,设置初始分割路径,并基于最短分割路径的思想,在初始分割路径的局部邻域内基于最小权值搜索并修改分割路径,从而获得最佳的加权分割路径.实验证明该方法解决了字符分割不足和多处粘连字符的分割问题,有效的提高了分割的准确率,且算法的时间复杂度较低,算法效率较高. 相似文献
13.
一种手写体大写金额串的分割新方法 总被引:3,自引:0,他引:3
手写体大写金额串的分割将直接影响识别的准确率。为了提高分割的准确率,同时保证较快的分割速度,本文采用了由粗分割和细分割组成的两步分割方法。重点介绍交叉字符和相连字符的分割方法。对于交叉的字符提出了加窗处理的中点连线分割方法,它较其它方法具有简单准确的优点;对于单笔相连的字符,先在细化字符图象上找到候选笔划的候选分割点,然后用本文提出的简明的评价准则来确定最优分割点,提高了粗分割的精度。上述方法应用于银行支票手写体大写金额的分割,取得了很好的分割效果。 相似文献
14.
15.
在脱机手写汉字识别中,笔画形变是造成识别率下降的主要原因,减少笔画形变的影响是提高脱机手写汉字识别率的关键。针对上述问题,提出了最优采样特征。该特征以目前被广泛应用的方向线素特征为基础,在一定的约束条件下,通过移动采样点的位置,可以适应笔画的形变。从而减少特征的类内方差,提高特征的可分性,改进了识别性能。通过在THCHR样本集上进行实验,并对最优采样特征和方向线素特征的实验结果进行比较,验证了最优采样特征的识别率优于方向线索特征。 相似文献
16.
17.
多分类器集成是解决手写体汉字识别性能的重要方法之一,近年来受到了学术届的普遍关注。文章提出了一种基于单字单网的手写体汉字识别纯神经网络的多分类器集成方案,并通过实验证明该方案是行之有效的。 相似文献
18.
在字符识别系统中,字符的有效分割是识别的关键。针对手写汉字字间距及字内距无规则可循,字符间极易发生粘连、交错等现象,提出一种多步分割方法。该方法首先利用Viterbi算法将原字符串切分成互不连通的分割块,使非粘连汉字、交错汉字得到正确分割;对于其中宽度较大存在粘连字符的分割块,从候选分割点入手,用非线性分割路径将粘连部分分开;最后再应用A*算法找到全局最佳分割位置,使过分割的字符得到完整合并。实验结果表明,该方法对于手写汉字的分割是可行、有效的。 相似文献
19.
在手写体中文信封处理系统中,地址行字符切分是实现地址行识别的关键步骤。本文根据邮政信封地址行字符的特点,有针对性的提出了一种字符切分算法。首先对地址行图像利用投影、求连通区域、笔划穿越数分析等基于字符结构的方法进行初始切分,得到基本字段序列;然后通过对相邻的基本字段进行组合形成多条候选切分路径,再通过识别的可信度和邮政目标地址库的先验知识信息对路径进行评价分析,从而得到最优的切分路径。该算法经过邮政分拣机采集的实际信封图像测试,纯地址行识别正确率达到78.61%,地址行识别与邮政编码识别相结合的分拣正确率达到95.42%。 相似文献