共查询到20条相似文献,搜索用时 156 毫秒
1.
韩晓琴 《数字社区&智能家居》2009,(26)
如何对急速增长的文档图像进行有效检索是文档图像管理系统的关键技术之一。提出了一种不需要识别文字的检索中文文档图像的方法,该方法在字符分割基础上采用基于粗外围特征粗匹配和基于改进Hausdorff距离相似度测量的两级匹配方法,以适应于时间、准确性的不同要求。同时用对200幅文档图像样本进行了实验,其结果表明,使用该方法对检索印刷体汉字的文档图像具有较高的检索效果,对于数字图书馆中文档图像检索系统的设计,有一定的参考价值。 相似文献
2.
针对印刷体维吾尔文文字识别系统中的字符识别正确率较低这一难点问题,采用对字符图像进行横向扫描和纵向扫描生成行和列投影图, 结合三级分类,将目标字符与对应分类中的字符的双投影图逐一归一化并进行相关性均值计算的方法,取均值最大的字符作为最佳匹配识别结果,实现了对维文字符的识别。实验证明这种基于字符归一化双投影互相关性匹配识别算法方法抗干扰性强,简单易行,匹配精度高,使得印刷体维吾尔文字字符识别的正确率有了进一步提高。 相似文献
3.
4.
一类特殊印刷体字符的分割和识别方法 总被引:1,自引:0,他引:1
针对一类工业场景下印刷体字符的特点.本文提出了一种基于方波参数求取进行字符分割的方法。首先.给定待分割字符串区域的二值化图像,预估字符串起始位置、字符宽度和字符间距,并作为基表参数生成单位方波函数.将方波函数以象素为单位离散化后看成一行向量、图像垂直扫描投影成一列向量,然后进行内积运算.在给定参数区间范围内搜索使得内积最大的一组作为精确分割参数;然后采用一种基于相似度匹配的字符识别方法完成字符识别。实验结果表明.该方法取得了满意的分割识别效果。 相似文献
5.
在中国,彝文古籍文献日益流失而且损毁严重,由于通晓古彝文的研究人员缺乏,使得古籍恢复工作进展十分缓慢.人工智能在图像文本领域的应用,为古籍文献的自动修复提供可能.本文设计了一种双判别器生成对抗网络(Generative adversarial networks with dual discriminator,D2GAN),以还原古代彝族字符中的缺失部分.D2GAN是在深度卷积生成对抗网络的基础上,增加一个古彝文筛选判别器.通过三个阶段的训练来迭代地优化古彝文字符生成网络,以获得古彝文字符的文字生成器.根据筛选判别器的损失结果优化D2GAN模型,并使用生成的字符恢复古彝文中丢失的笔画.实验结果表明,在字符残缺低于1/3的情况下,本文提出的方法可使文字笔画的修复率达到77.3%,有效地加快了古彝文字符修复工作的进程. 相似文献
6.
脱机自由手写英文单词的识别 总被引:1,自引:0,他引:1
介绍了一个基于隐马尔科夫模型的、采用模糊分割方式的脱机手写英文单词识别系统。该系统由图像预处理、特征提取、基于HMM的训练和识别四个模块组成。图像预处理中包括二值化、平滑去噪、倾斜校正和参考线提取。然后通过宽度不固定的滑动窗提取特征,前两组特征是整体形状和象素分布特征,另外又引入了Sobel梯度特征。HMM模型采用嵌入式的Baum-Welch算法训练,这种训练方式无需分割单词。最后用Viterbi算法识别。对字典中的每个单词,采用字母模型线性连接成单词模型。 相似文献
7.
为了利用低成本的硬件来实现对印刷体文字的快速识别,提出了一种基于多级分类的印刷体文字快速识别算法,该算法从预处理、特征提取,到模式匹配各个阶段,都对传统方法作了合理的改进.该算法首先是采用36×36,而不是传统的48×48点阵进行归一化,从而有效地减少了计算量和字典容量;其次是采用改进的粗外围特征,并进行二重分割,以提高特征的稳定性;最后在各级分类中采用了不同的判别准则,包括绝对值距离、欧氏距离及相似度准则,以适应于时间、准确性的不同要求.同时用该算法对一级汉字7000个样本进行了实验,其结果表明,实际正确识别率(正识率)达95%,前5位累积正识率可达98%,从而为“电子阅读笔”的开发与研制打下了坚实的理论基础. 相似文献
8.
AbbasH Xiang-LongTang Jia-FengLiu WeiZhao 《计算机科学技术学报》2004,19(C00):61-61
在全球信息化的今天,信息的获取和交流有着特殊的需求,这要求文字识别技术不断地向前发展。文字识别的任务是将人类能够阅读的字符(包括手写体和印刷体文本)图像转换成计算机能够识别的代码(对于拉丁文来说是ASCII码,对于阿拉伯文来说是ASMO码)。文字识别技术可以分联机(on—line)与脱机(off—line)两种方法,而脱机识别又分为印刷体识别(printed)和手写体识别(Handwritten)。 相似文献
9.
10.
提出一种基于模板匹配的最大类间方差车牌字符分割算法。根据字符串的结构和尺寸特征,设计了车牌字符串模板,该模板在车牌区域滑动匹配进行分类,并结合最大类间方差判决准则,确定最佳匹配位置,分割车牌字符。实验表明,该方法自适应性强,可以获得最优的分割效果。 相似文献
11.
12.
13.
Analysis of stroke structures of handwritten Chinese characters 总被引:3,自引:0,他引:3
Hung-Hsin Chang Hong Yan 《IEEE transactions on systems, man, and cybernetics. Part B, Cybernetics》1999,29(1):47-61
Most handwritten Chinese character recognition systems suffer from the variations in geometrical features for different writing styles. The stroke structures of different styles have proved to be more consistent than geometrical features. In an on-line recognition system, the stroke structure can be obtained according to the sequences of writing via a pen-based input device such as a tablet. But in an off-line recognition system, the input characters are scanned optically and saved as raster images, so the stroke structure information is not available. In this paper, we propose a method to extract strokes from an off-line handwritten Chinese character. We have developed four new techniques: 1) a new thinning algorithm based on Euclidean distance transformation and gradient oriented tracing, 2) a new line approximation method based on curvature segmentation, 3) artifact removal strategies based on geometrical analysis, and 4) stroke segmentation rules based on splitting, merging and directional analysis. Using these techniques, we can extract and trace the strokes in an off-line handwritten Chinese character accurately and efficiently. 相似文献
14.
15.
在字符识别领域,对粘连字符的识别是一个被广泛关注的技术难点,而且粘连字符的分割更是产生识别错误的主要原因之一.为了快速准确地进行字符分割,在总结已有方法的特点及不足的基础上,针对电子阅读笔系统的工作特点和实时性要求,提出并实现了一种面向电子阅读笔系统的基于词片识别的分割算法.该方法由于通过对字母组合的识别,降低了传统的基于孤立字符识别方法对于字符切分的要求,而且以中心生长法和改进的峰谷函数为切分工具来进行字符分割,简单实用,因而其在减少因粘连字符切分错误引起的识别错误的同时,不仅降低了运算复杂度,而且适合在阅读笔等嵌入式设备上应用.实验证明,该算法不仅效率高,而且实现简单,还能够降低分割错误带来的识别错误. 相似文献
16.
复杂场景下的高精度车牌识别仍然存在着许多挑战, 除了光照、分辨率不可控和运动模糊等因素导致的车牌图像质量低之外, 还包括车牌品类多样产生的行数不一和字数不一等困难, 以及因拍摄角度多样出现的大倾角等问题. 针对这些挑战, 提出了一种基于单字符注意力的场景鲁棒的高精度车牌识别算法, 在无单字符位置标签信息的情况下, 使用注意力机制对车牌全局特征图进行单字符级特征分割, 以处理多品类车牌和倾斜车牌中的二维字符布局问题. 另外, 该算法通过使用共享参数的多分支结构代替现有算法的串行解码结构, 降低了分类头参数量并实现了并行化推理. 实验结果表明, 该算法在公开车牌数据集上实现了超越现有算法的精度, 同时具有较快的识别速度. 相似文献
17.
针对目前的打印文件识别方法受限于样本中必须有相同字符的问题,提出一种基于字符图像分割的打印文件识别方法。通过k-means算法对字符图像进行分割,分别对不同区域提取局部二值模式纹理特征,从而消除字符结构对识别结果的影响。研究了单一区域的特征集和组合特征集的分类识别效果,实验结果表明,该方法在样本中无相同字符的情况下,能够得到较高的识别准确率。 相似文献
18.
集装箱号自动识别在海关物流管理等领域有着重要的实用价值。为了快速准确的地进行集装箱号识别,提出了一种基于图像分割和区域特征分析的集装箱号字符定位和识别方法。该方法首先基于灰度相似性运用改进的单程分裂与归并算法对图像进行自适应阈值分割,同时统计各个区域的灰度、形状、边缘强度等特征;然后根据字符区域特征,利用一定规则来滤除非字符区域;最后,对于定位出的字符区域,再依据区域特征进行二值化,并采用神经网络与模板匹配相结合的方法进行识别。在包含1 804幅图像的集装箱号识别实验中,整箱号识别正确的为1 750幅,准确率为97.01%,这充分说明了算法的有效性。 相似文献
19.
神经网络在车辆牌照字符识别中的应用 总被引:7,自引:0,他引:7
在车辆牌照自动识别系统中,因自然因素或采用因素使得原本原则的印刷字符产生畸变,给字符识别带来了很大困难。本文在特征抽取的基础上,采用BP网络进行分类,并附加线性感知器来实现单字的有效识别。该方法算法简便,识别率高,可适用于多种高噪声环境中的印刷字体识别。 相似文献
20.
Hidden markov model based optical character recognition in the presence of deterministic transformations 总被引:2,自引:0,他引:2
A method is introduced to combine and jointly optimize recognition and image normalization in optical character recognition algorithms based on pseudo two-dimensional (2D) hidden Markov models (HMMs). The method can be combined with a previous method for joint segmentation and recognition of connected text. It also provides a maximum likelihood estimate of the transformation parameters (scaling factor, slant angle, etc.), that can be used by higher level modules in an intelligent document recognition system as an aid in the recognition process. The computational cost of this technique is modest. Experimental results on a data base of distorted printed characters are presented. 相似文献