首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
如何对急速增长的文档图像进行有效检索是文档图像管理系统的关键技术之一。提出了一种不需要识别文字的检索中文文档图像的方法,该方法在字符分割基础上采用基于粗外围特征粗匹配和基于改进Hausdorff距离相似度测量的两级匹配方法,以适应于时间、准确性的不同要求。同时用对200幅文档图像样本进行了实验,其结果表明,使用该方法对检索印刷体汉字的文档图像具有较高的检索效果,对于数字图书馆中文档图像检索系统的设计,有一定的参考价值。  相似文献   

2.
针对印刷体维吾尔文文字识别系统中的字符识别正确率较低这一难点问题,采用对字符图像进行横向扫描和纵向扫描生成行和列投影图, 结合三级分类,将目标字符与对应分类中的字符的双投影图逐一归一化并进行相关性均值计算的方法,取均值最大的字符作为最佳匹配识别结果,实现了对维文字符的识别。实验证明这种基于字符归一化双投影互相关性匹配识别算法方法抗干扰性强,简单易行,匹配精度高,使得印刷体维吾尔文字字符识别的正确率有了进一步提高。  相似文献   

3.
线性合成的双粒度 RNN 集成系统   总被引:1,自引:0,他引:1  
张亮  黄曙光  胡荣贵 《自动化学报》2011,37(11):1402-1406
针对脱机文字识别,提出了一种基于线性合成的双粒度递归神经网络(Recurrent neural net work, RNN)集成系统.首先,使用单词RNN对未知图 像进行识别;然后,依据识别结果进行字符分割,使用字符RNN对分割后的字符进行识别,并利用查表法计算字符的后验概率;最后,综合两个RNN的识别结果决定最终单词输出.在CAPTCHA识别 和手写识别上的实验结果证明了该系统的有效性.  相似文献   

4.
一类特殊印刷体字符的分割和识别方法   总被引:1,自引:0,他引:1  
针对一类工业场景下印刷体字符的特点.本文提出了一种基于方波参数求取进行字符分割的方法。首先.给定待分割字符串区域的二值化图像,预估字符串起始位置、字符宽度和字符间距,并作为基表参数生成单位方波函数.将方波函数以象素为单位离散化后看成一行向量、图像垂直扫描投影成一列向量,然后进行内积运算.在给定参数区间范围内搜索使得内积最大的一组作为精确分割参数;然后采用一种基于相似度匹配的字符识别方法完成字符识别。实验结果表明.该方法取得了满意的分割识别效果。  相似文献   

5.
在中国,彝文古籍文献日益流失而且损毁严重,由于通晓古彝文的研究人员缺乏,使得古籍恢复工作进展十分缓慢.人工智能在图像文本领域的应用,为古籍文献的自动修复提供可能.本文设计了一种双判别器生成对抗网络(Generative adversarial networks with dual discriminator,D2GAN),以还原古代彝族字符中的缺失部分.D2GAN是在深度卷积生成对抗网络的基础上,增加一个古彝文筛选判别器.通过三个阶段的训练来迭代地优化古彝文字符生成网络,以获得古彝文字符的文字生成器.根据筛选判别器的损失结果优化D2GAN模型,并使用生成的字符恢复古彝文中丢失的笔画.实验结果表明,在字符残缺低于1/3的情况下,本文提出的方法可使文字笔画的修复率达到77.3%,有效地加快了古彝文字符修复工作的进程.  相似文献   

6.
脱机自由手写英文单词的识别   总被引:1,自引:0,他引:1  
介绍了一个基于隐马尔科夫模型的、采用模糊分割方式的脱机手写英文单词识别系统。该系统由图像预处理、特征提取、基于HMM的训练和识别四个模块组成。图像预处理中包括二值化、平滑去噪、倾斜校正和参考线提取。然后通过宽度不固定的滑动窗提取特征,前两组特征是整体形状和象素分布特征,另外又引入了Sobel梯度特征。HMM模型采用嵌入式的Baum-Welch算法训练,这种训练方式无需分割单词。最后用Viterbi算法识别。对字典中的每个单词,采用字母模型线性连接成单词模型。  相似文献   

7.
一种快速有效的印刷体文字识别算法   总被引:8,自引:1,他引:7       下载免费PDF全文
为了利用低成本的硬件来实现对印刷体文字的快速识别,提出了一种基于多级分类的印刷体文字快速识别算法,该算法从预处理、特征提取,到模式匹配各个阶段,都对传统方法作了合理的改进.该算法首先是采用36×36,而不是传统的48×48点阵进行归一化,从而有效地减少了计算量和字典容量;其次是采用改进的粗外围特征,并进行二重分割,以提高特征的稳定性;最后在各级分类中采用了不同的判别准则,包括绝对值距离、欧氏距离及相似度准则,以适应于时间、准确性的不同要求.同时用该算法对一级汉字7000个样本进行了实验,其结果表明,实际正确识别率(正识率)达95%,前5位累积正识率可达98%,从而为“电子阅读笔”的开发与研制打下了坚实的理论基础.  相似文献   

8.
在全球信息化的今天,信息的获取和交流有着特殊的需求,这要求文字识别技术不断地向前发展。文字识别的任务是将人类能够阅读的字符(包括手写体和印刷体文本)图像转换成计算机能够识别的代码(对于拉丁文来说是ASCII码,对于阿拉伯文来说是ASMO码)。文字识别技术可以分联机(on—line)与脱机(off—line)两种方法,而脱机识别又分为印刷体识别(printed)和手写体识别(Handwritten)。  相似文献   

9.
基于自适应特征与多级反馈模型的中英文混排文档分割   总被引:2,自引:0,他引:2  
提出了一种基于自适应特征与多级反馈模型的新颖的字符分割方法,对文字图像质量与中英文混排格式有较好的自适应能力.该方法的主要思想就是将一个分割过程分成很多层,每层都会由一个主要特征来指导字符分割与中英文预分类,然后将分割层的结果反馈至当前分割层或前面的分割层,并指导下一层的分割.该方法将字符分割、中英文预分类和字符识别这三者进行了很好的融合,大大提高了字符分割与识别的正确率.  相似文献   

10.
最大类间方差车牌字符分割的模板匹配算法   总被引:4,自引:0,他引:4       下载免费PDF全文
王兴玲 《计算机工程》2006,32(19):193-195
提出一种基于模板匹配的最大类间方差车牌字符分割算法。根据字符串的结构和尺寸特征,设计了车牌字符串模板,该模板在车牌区域滑动匹配进行分类,并结合最大类间方差判决准则,确定最佳匹配位置,分割车牌字符。实验表明,该方法自适应性强,可以获得最优的分割效果。  相似文献   

11.
12.
13.
Analysis of stroke structures of handwritten Chinese characters   总被引:3,自引:0,他引:3  
Most handwritten Chinese character recognition systems suffer from the variations in geometrical features for different writing styles. The stroke structures of different styles have proved to be more consistent than geometrical features. In an on-line recognition system, the stroke structure can be obtained according to the sequences of writing via a pen-based input device such as a tablet. But in an off-line recognition system, the input characters are scanned optically and saved as raster images, so the stroke structure information is not available. In this paper, we propose a method to extract strokes from an off-line handwritten Chinese character. We have developed four new techniques: 1) a new thinning algorithm based on Euclidean distance transformation and gradient oriented tracing, 2) a new line approximation method based on curvature segmentation, 3) artifact removal strategies based on geometrical analysis, and 4) stroke segmentation rules based on splitting, merging and directional analysis. Using these techniques, we can extract and trace the strokes in an off-line handwritten Chinese character accurately and efficiently.  相似文献   

14.
基于组件合并的手写体汉字串分割   总被引:5,自引:0,他引:5  
吕岳  施鹏飞  张克华 《软件学报》2000,11(11):1554-1559
人们对孤立的手写体汉字字符的离线 识别做了大量的研究工作,而走向实用化的进展并不快.除了单字识别率不理想以外,从文本 中正确分割出单个汉字字符也是一个主要难题,因为字符的识别离不开正确分割.利用汉字的 基本结构特征,根据两个组件之间的上下、左右和包围关系,对组件进行合并形成完整的汉字 图像.对整个汉字字符串中组件的宽度和相邻组件的间距进行分析,有助于左右关系组件的合 并.实验结果表明,该方法对手写体汉字字符串具有理想的分割效果.  相似文献   

15.
在字符识别领域,对粘连字符的识别是一个被广泛关注的技术难点,而且粘连字符的分割更是产生识别错误的主要原因之一.为了快速准确地进行字符分割,在总结已有方法的特点及不足的基础上,针对电子阅读笔系统的工作特点和实时性要求,提出并实现了一种面向电子阅读笔系统的基于词片识别的分割算法.该方法由于通过对字母组合的识别,降低了传统的基于孤立字符识别方法对于字符切分的要求,而且以中心生长法和改进的峰谷函数为切分工具来进行字符分割,简单实用,因而其在减少因粘连字符切分错误引起的识别错误的同时,不仅降低了运算复杂度,而且适合在阅读笔等嵌入式设备上应用.实验证明,该算法不仅效率高,而且实现简单,还能够降低分割错误带来的识别错误.  相似文献   

16.
复杂场景下的高精度车牌识别仍然存在着许多挑战, 除了光照、分辨率不可控和运动模糊等因素导致的车牌图像质量低之外, 还包括车牌品类多样产生的行数不一和字数不一等困难, 以及因拍摄角度多样出现的大倾角等问题. 针对这些挑战, 提出了一种基于单字符注意力的场景鲁棒的高精度车牌识别算法, 在无单字符位置标签信息的情况下, 使用注意力机制对车牌全局特征图进行单字符级特征分割, 以处理多品类车牌和倾斜车牌中的二维字符布局问题. 另外, 该算法通过使用共享参数的多分支结构代替现有算法的串行解码结构, 降低了分类头参数量并实现了并行化推理. 实验结果表明, 该算法在公开车牌数据集上实现了超越现有算法的精度, 同时具有较快的识别速度.  相似文献   

17.
针对目前的打印文件识别方法受限于样本中必须有相同字符的问题,提出一种基于字符图像分割的打印文件识别方法。通过k-means算法对字符图像进行分割,分别对不同区域提取局部二值模式纹理特征,从而消除字符结构对识别结果的影响。研究了单一区域的特征集和组合特征集的分类识别效果,实验结果表明,该方法在样本中无相同字符的情况下,能够得到较高的识别准确率。  相似文献   

18.
基于单程分裂与归并图像分割的集装箱号识别   总被引:1,自引:0,他引:1       下载免费PDF全文
集装箱号自动识别在海关物流管理等领域有着重要的实用价值。为了快速准确的地进行集装箱号识别,提出了一种基于图像分割和区域特征分析的集装箱号字符定位和识别方法。该方法首先基于灰度相似性运用改进的单程分裂与归并算法对图像进行自适应阈值分割,同时统计各个区域的灰度、形状、边缘强度等特征;然后根据字符区域特征,利用一定规则来滤除非字符区域;最后,对于定位出的字符区域,再依据区域特征进行二值化,并采用神经网络与模板匹配相结合的方法进行识别。在包含1 804幅图像的集装箱号识别实验中,整箱号识别正确的为1 750幅,准确率为97.01%,这充分说明了算法的有效性。  相似文献   

19.
神经网络在车辆牌照字符识别中的应用   总被引:7,自引:0,他引:7  
在车辆牌照自动识别系统中,因自然因素或采用因素使得原本原则的印刷字符产生畸变,给字符识别带来了很大困难。本文在特征抽取的基础上,采用BP网络进行分类,并附加线性感知器来实现单字的有效识别。该方法算法简便,识别率高,可适用于多种高噪声环境中的印刷字体识别。  相似文献   

20.
A method is introduced to combine and jointly optimize recognition and image normalization in optical character recognition algorithms based on pseudo two-dimensional (2D) hidden Markov models (HMMs). The method can be combined with a previous method for joint segmentation and recognition of connected text. It also provides a maximum likelihood estimate of the transformation parameters (scaling factor, slant angle, etc.), that can be used by higher level modules in an intelligent document recognition system as an aid in the recognition process. The computational cost of this technique is modest. Experimental results on a data base of distorted printed characters are presented.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号