首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 203 毫秒
1.
基于ANN的哈萨克文手写文字识别系统的研究   总被引:2,自引:0,他引:2  
光学字符识别系统在自动处理,人机交互,办公自动化以及商业领域中有非常广泛的应用。论文主要讨论如何结合结构方法和神经网络的技术,来实现哈萨克语手写文字识别系统的实现。该方法有以下几个优点:方法使用了基于规则(结构)的方法和分类测试;方法更加适合于像哈萨克文字一样具有较大的字符集和字符尺寸不一致的字符集;特征提取的代价较低,运行时间主要由字符尺寸和字体决定。该系统使用一个五层的人工神经网络对字符进行分类,使用10个用户的不同的手写字体进行测试,正确识别率为91%。  相似文献   

2.
高歌  李旻 《计算机应用与软件》2012,29(4):242-245,271
传统的OCR技术在某些特定方面,如印刷体数学公式中特殊字符的识别存在困难和限制,其识别结果的准确率不尽如人意.为此,重点介绍基于向量线段的特殊字符识别算法规则和识别系统的设计.提出通过提取字符中的向量线段进行特征比较的分析方法,并将噪点去除算法融入其中.实验表明,该方法对于特殊字符的分析识别具有较好的准确性和应用前景.  相似文献   

3.
中英文混合文章识别问题   总被引:11,自引:0,他引:11       下载免费PDF全文
王恺  王庆人 《软件学报》2005,16(5):786-798
当前,已经有大量为单一字符集(或语种)而设计的OCR(optical character recognition)分类器.同时,随着全球一体化,多语文档的出现越来越普遍.因此,设计多语文档处理系统势在必行.提出了一般性的解决方案:两项OCR技术、一个系统和语言判断.为了使研究工作具体化,实现了一个中英文混合文章处理系统.其中主要涉及了3个关键问题:系统流程控制、汉英语言区域分离和英文字符切分.与以往的系统相比,该系统增加了汉英语言区域分离模块,并将基于等间距性的新方法应用于该模块.为了验证本系统的有效性,综合以往的方法实现了另一个系统.实验结果表明,该系统的性能明显优于另一个系统,在杂志样和书籍样上的识别率分别从98.48%和98.68%提高到99.13%和99.25%.  相似文献   

4.
基于MQDF的英文OCR多模板分类器   总被引:4,自引:0,他引:4  
针对进一步提高英文OCR分类器的鲁棒性进行了研究,结合传统的单模板MQDF分类器和多模板欧氏距离分类器各自的优点,提出了一种新的基于MQDF的多模板分类器设计方法。与传统分类器的对比测试证明,该文提出的这种新的分类器能够有效地提高多体英文OCR字符的单字首选正确率,并对低质量文本中的模糊和断裂字符也能保持很高的识别率。  相似文献   

5.
小字号英文印刷字符的分割依然是OCR领域中一个富于竞争力的问题.其主要困难在于字符能量小、字符之间存在粘连.本文重点分析衬线粘连的几种类型,并提出衬线去除算法.然后,在此基础上提出一种小字号印刷字符的分割算法.实验结果表明,该方法可以有效分割小字号英文印刷字符.此外,本文方法对大字号字符的分割也是有效的.  相似文献   

6.
OCR(Optical Character Recognition)的中文全称是光学字符识别,它的工作原理是通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中,实现文字的自动输入。目前市面是最为流行OCR软件为“尚书OCR文字识别系统”和“清华紫光OCR软件”,它们采用了同样的内核,在识别率和速度上几乎没有区别。它们都为32位系统,支持WINDOWS95/98/NT。在印刷文字识别上加入MMX优化,识别速度都比传统的OCR软件提高50%以上。两者在汉英双语同时混排时,识别率都  相似文献   

7.
OCR软件对图像背景的字符的处理能力有限,为了提高OCR的识别率必须对字符进行预处理。该文提出采用SUSAN拐角检测算法生成图像字符区域的拐角响应图,然后利用拐角过滤算法去除错误的拐角响应生成字符候选区域,最后应用了形态数学变换将字符笔画精确地分离出。经实验检验本算法较好地完成字符笔画提取,是一种提高OCR软件识别率的有效方法。  相似文献   

8.
汉字识别研究最早开始于六十年代中期,从那以后,世界上许多国家都做了大量的工作,目前,日本已研制出几种商品化的汉字阅读机,其中东芝公司研制的OCR光电字符阅读机,对单一印刷体的二千汉字字符集达到99%的识别率,识别速度为100字/秒,但他们使用的是大型计算机和专用集成电路、造价昂贵, 这种文字阅读机, 从它的使用普及性和我国目前的国情来看, 都是不合适的。我国目前把手写和印刷体汉字直接输人到计算机的研究工作还处于摸索阶段, 在微型机上实现汉字识别系统的研究起步更晚, 我们在印刷体汉字识别方面做了一些工作。本文将把作者的一些工作向读者做一介绍。  相似文献   

9.
粘连断裂字符行的切分识别,是很多OCR 实际应用中存在的主要困难之一. 本文针对粘连断裂的印刷体数字行,提出了一种基于Viterbi 算法的切分识别方案,该方案采用两次切分识别的层次型结构. 在第二次切分识别过程中,首先,在候选切分点区域,结合灰度图像与二值轮廓信息,采用基于Viterbi 算法搜索的非直线路径进行切分,得到有效的切分路径;然后,结合分类器输出的可信度,采用Viterbi 算法来合并前面得到的候选切分图像块,进行动态切分与识别. 实际的金融票据识别系统实验表明,本文提出的印刷体数字行切分识别方法能够较好的克服字符行的粘连与断裂情况,提高了识别系统的识别率和鲁棒性.  相似文献   

10.
基于卷积神经网络的车牌字符识别   总被引:1,自引:0,他引:1  
车牌字符识别是智能车牌识别系统中的重要组成部分。针对车牌字符类别多、背景复杂影响正确识别率的问题,提出了一种基于卷积神经网络(CNN)的车牌字符识别方法。首先对车牌字符图像进行大小归一化、去噪、二值化、细化、字符区域居中等预处理,去除复杂背景,得到简单的字符形状结构;然后,利用所提出的CNN模型对预处理后的车牌字符集进行训练、识别。实验结果表明,所提方法能够达到99.96%的正确识别率,优于其他三种对比方法。说明所提出的CNN方法对车牌字符具有很好的识别性能,能满足实际应用需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号