首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
传统的OCR技术在汉字识别领域趋于成熟,对背景清晰的正体汉字有很高的识别正确率,然而当汉字图片在复杂背景中或经旋转、加噪处理后,OCR软件的识别正确率大大下降.当今有关视频检索的研究正在快速发展中,其中一种行之有效的方法是通过提取模板视频的关键帧及其特征向量,应用聚类算法形成关键字,并通过快速的检索算法来实现匹配.创新性地将该模型应用到汉字识别研究中,通过大量实验数据的研究发现,该模型在上述情况中相对于传统的OCR技术优势明显,在未来实际应用中具有广阔的前景.  相似文献   

2.
基于D-S证据理论的城市航拍道路提取方法   总被引:6,自引:0,他引:6  
王莉莉  郝爱民  何兵  赵沁平 《软件学报》2005,16(9):1534-1541
针对有复杂场景的城市航拍图像,提出了一种基于D-S证据理论的道路提取方法.首先建立道路模型;然后将图像分块,建立灰度连通集,并选取子图像中较大的灰度连通集作为候选道路段;根据道路模型从候选道路段中提取特征来定义多个概率分配函数BPAF(basic probability assignment functions),并使用Dempster合成法则对其进行合成,识别出道路段;最后将已识别出的道路段进行合并,排除错误路段,形成道路.实验结果证明了这一方法的有效性.  相似文献   

3.
系统采用固定摄像机对CRH列车进站时的侧面进行图像采集,从图像上提取车牌信息并定位,根据图像分析算法拆分字符。使用OCR对提取出的字符图像进行识别,通过CRH列车车牌的命名规则,总结出一套可以用来自动进行字符识别结果校准的逻辑流程,从而达到精确识别的目的。  相似文献   

4.
在行人重识别问题中,为了减少因光线、摄像头角度、遮挡等因素对搜索结果带来的影响,需要通过拓展维度来丰富图像特征从而提高搜索精度。为此,本文提出了一种对行人重识别搜索结果进行重排序的方法。该方法首先通过行人的全局特征对行人图像进行搜索排序,然后提取行人属性特征,并利用属性特征训练一个二分类模型。通过模型对搜索结果进行重排序,并评估搜索精度。实验的结果表明,在加入属性特征之后,行人重识别算法搜索的Rank-1、mAP值均有提升。  相似文献   

5.
OCR是Optical Character Recognize(光学字符识别)的英文缩写。它的出现把人们从繁重的手工键入中解脱出来,你只需给计算机配上一台扫描仪加上OCR印刷汉字识别软件,就可以轻松完成长篇文字的录入工作。 一、汉字识别系统的构成 整个印刷汉字文本的识别过程包括: (1)原始文稿的扫描输入:一般图象扫描仪将文稿扫描输  相似文献   

6.
提出了一种基于广义Hough变换的手写汉字文档关键词提取技术.对于待提取的手写文档图像,采用字符像素逐点匹配和投票的方式进行广义Hough变换,在参数空间中定位出手写关键词图像的位置.本技术对传统的广义Hough变换进行了修改,突破了形状匹配需要完整轮廓信息的局限,简化了局部特征的计算,对手写汉字文档图像中具有局部形变、部分旋转和缩放的手写关键词能够有效提取.对于提取的相同关键词建立训练集,用签名识别的方法对书写者建模,能够达到书写者身份鉴别的目的.  相似文献   

7.
汉字笔段形成规律及其提取方法   总被引:8,自引:0,他引:8  
该文从点阵图像行(列)连通像素段出发,研究汉字图像的笔段构成,发现汉字点阵图像仅由阶梯型笔段和平行长笔段两种类型的笔段构成,并归纳出阶梯型笔段和平行长笔段的形成规律.以笔段形成规律为基础提出了汉字笔段的提取方法,该方法将像素级汉字图像转变为以笔段为单位的图像,有利于汉字识别、汉字细化及汉字字体的自动生成.最后该文给出了印刷体和手写体汉字笔段提取的实验结果.  相似文献   

8.
《软件世界》1996,(3):63-63
1.什么是OCR? OCR是Optical Character Recognize(光学字符识别)的英文缩写。印刷字符识别系统采用扫描仪扫描成图像文件,由计算机通过OCR软件自动辨认成文本文件,经过修改、编辑、排版,一篇符合您要求的文章就存在您的电脑中,以备您随时调用、输出。 OCR的出现把人们从繁重的手工键入中解脱出来,尤其是印刷资料的再录入,更能体现它的高效。所以OCR是一种全新的输入方法。 2.汉字识别系统的构成 整个印刷汉字文本的识别过程包括:  相似文献   

9.
基于贝叶斯网络的步态识别   总被引:2,自引:0,他引:2  
张磊  刘冀伟 《微计算机信息》2006,22(26):263-265
步态作为一种重要的生物特征由于其远距离身份识别能力而逐渐受到人们的重视。本文提出了一种基于贝叶斯网络的步态识别方法。首先应用背景差方法获得运动人体侧面二值图像,将侧面像分为七部分来提取特征,采用最大方差法对训练集进行离散化,对各部分分别建立贝叶斯网络,最后利用“投票”规则将网络推理结果进行组合。将该方法在Soton步态数据库上进行试验,取得了比较理想的识别效果。  相似文献   

10.
汉字是形、声、义有机组合的方块文字,其特点是数量浩大(常用汉字在4000到7000个)、结构繁杂、字体字形变化多端。要利用OCR技术来解决汉字的计算机自动输入问题面临着很大挑战。从80年代开始,我国国家863高技术发展计划、国家自然科学基金等对汉字自动识别输入的研究就给予了充分的重视,经过十多年的发展,印刷体汉字识别技术的进展及其应用,已受到世人瞩目。 一、中文OCR技术及其研究简介 中文OCR技术包括以下几个部分:  相似文献   

11.
基于PCA学习子空间算法的有限汉字识别   总被引:11,自引:0,他引:11       下载免费PDF全文
采用PCA学习子空间方法来进行灰度图象上字符的识别,不仅克服了传统的基于二值化字符特征提取和识别所带来的主要困难,还尽量多地保存了字符特征,该算法在PCA子空间的基础上,通过反馈监督学习的方法使子空间作旋转调整,从而获得了更好的分类效果,特别当字符类别数不是很大时,子空间的训练时间也将在可接受的范围之内,应用效果也表明,采用PCAA学习子空间算法对车牌汉字这一有限汉字集进行识别,取得了较好的效果,实用价值较高。  相似文献   

12.
中英文混合文章识别问题   总被引:11,自引:0,他引:11  
王恺  王庆人 《软件学报》2005,16(5):786-798
当前,已经有大量为单一字符集(或语种)而设计的OCR(optical character recognition)分类器.同时,随着全球一体化,多语文档的出现越来越普遍.因此,设计多语文档处理系统势在必行.提出了一般性的解决方案:两项OCR技术、一个系统和语言判断.为了使研究工作具体化,实现了一个中英文混合文章处理系统.其中主要涉及了3个关键问题:系统流程控制、汉英语言区域分离和英文字符切分.与以往的系统相比,该系统增加了汉英语言区域分离模块,并将基于等间距性的新方法应用于该模块.为了验证本系统的有效性,综合以往的方法实现了另一个系统.实验结果表明,该系统的性能明显优于另一个系统,在杂志样和书籍样上的识别率分别从98.48%和98.68%提高到99.13%和99.25%.  相似文献   

13.
在模式识别领域,投票策略是非常有效的,而且已被成功应用到人脸检测、识别等领域. 然而,在手写汉字识别 (Handwritten Chinese character recognition, HCCR)中,由于类别集很大、训练样本少等特点,现有的很多分类器集成方法方法都很难直接应用于此领域. 本文提出一种自产生式投票的方法,该方法通过事先学习得到的参数集产生一个测试集合,然后用一个分类器去识别 测试集合中的每个样本,得到属于各个类别的概率,最后通过加权投票得到识别结果. 实验结果表明,本文提出的方法是实用和有效的.  相似文献   

14.
李宇霞  孙永奇  闫茹  朱卫国 《计算机工程》2021,47(1):255-263,274
光学字符识别技术可有效提高票据应用中票据信息录入的工作效率。针对票据的复杂背景与不规范手写字符降低票据识别准确率的问题,结合卷积神经网络图像识别与语义可靠性,提出一种可靠性优先的路径搜索方法,以降低模糊字符对搜索路径的干扰。利用基于公司名结构特点的前后缀推断策略,有效解决公司名前后缀识别错误问题。采用结巴中文分词与字符位置信息检查识别结果中的错误,并将长短期记忆语言模型与在传统字形相似度基础上引入的汉字部件相似度相结合进行纠错。实验结果表明,通过将纠错策略与该方法相结合可有效提高公司名识别准确率至93.08%。  相似文献   

15.
16.
A full-fledged image-based car license plate recognition (CLPR) system is described in the paper. CLPR provides an inexpensive automatic solution for remote vehicle identification. Gray-level input images are assumed. The localization stage of the CLPR yields a plate clip followed by character segmentation and recognition. The recognition scheme combines adaptive iterative thresholding with a template-matching algorithm. The method is invariant to illumination and is robust to character size and thickness, skew and small character breaks. Promising results have been obtained in the experiments with Israeli and Bulgarian license plates including images of poor quality. Also, the possibility of using an “off-the-shelf” OCR has been explored.  相似文献   

17.
本文介绍了采用综合技术集成的方法,解决印刷汉字识别系统误识率太高的重大难题,并通过集成系统的实践,证实了其技术集成优势,由于识别方法的互补效应,不仅提高了识别的正确率,而且使误识率得到大幅度的降低,采用该集成办法研制的系统,经过100万字的实际文章的测试,系统的识别率超过98%,误识率小于0.2%,尤其是汉字的误识率小于0.1%。  相似文献   

18.
基于改进型CLAFIC学习子空间算法的有限汉字集识别   总被引:2,自引:0,他引:2  
采用改进型CLAFIC(Class-Featuring Information Compression)算法可以为学习子空间LSM(Learning Subspace Method)算法提供更好的初始向量子空间,并通过LSM算法对各类样本子空间按不同的旋转方式训练,来提高OCR的识别率,该文的特点在于首先采用了学习子空间算法来实现字符在灰度图像上的识别,它克服了传统的基于二值化图像进行特征提取和识  相似文献   

19.
Optical character recognition (OCR) refers to a process whereby printed documents are transformed into ASCII files for the purpose of compact storage, editing, fast retrieval, and other file manipulations through the use of a computer. The recognition stage of an OCR process is made difficult by added noise, image distortion, and the various character typefaces, sizes, and fonts that a document may have. In this study a neural network approach is introduced to perform high accuracy recognition on multi-size and multi-font characters; a novel centroid-dithering training process with a low noise-sensitivity normalization procedure is used to achieve high accuracy results. The study consists of two parts. The first part focuses on single size and single font characters, and a two-layered neural network is trained to recognize the full set of 94 ASCII character images in 12-pt Courier font. The second part trades accuracy for additional font and size capability, and a larger two-layered neural network is trained to recognize the full set of 94 ASCII character images for all point sizes from 8 to 32 and for 12 commonly used fonts. The performance of these two networks is evaluated based on a database of more than one million character images from the testing data set  相似文献   

20.
An optical character recognition (OCR) framework is developed and applied to handprinted numeric fields recognition. The numeric fields were extracted from binary images of VISA? credit card application forms. The images include personal identity numbers and telephone numbers. The proposed OCR framework is a cascaded neural networks. The first stage is a self-organizing feature map algorithm. The second stage maps distance values into allograph membership values using a gradient descent learning algorithm. The third stage is a multi-layer feedforward network. In this paper, we present experimental results which demonstrate the ability to read handprinted numeric fields. Experiments were performed on a test data set from the CCL/ITRI database which consists of over 90,390 handwritten numeric digits.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号