首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
在手写体中文信封处理系统中,地址行字符切分是实现地址行识别的关键步骤。本文根据邮政信封地址行字符的特点,有针对性的提出了一种字符切分算法。首先对地址行图像利用投影、求连通区域、笔划穿越数分析等基于字符结构的方法进行初始切分,得到基本字段序列;然后通过对相邻的基本字段进行组合形成多条候选切分路径,再通过识别的可信度和邮政目标地址库的先验知识信息对路径进行评价分析,从而得到最优的切分路径。该算法经过邮政分拣机采集的实际信封图像测试,纯地址行识别正确率达到78.61%,地址行识别与邮政编码识别相结合的分拣正确率达到95.42%。  相似文献   

2.
高阶N-gram语言模型在OCR后处理方面有着广泛的应用,但也面临着因模型复杂度大导致的数据稀疏,以及耗费较多的时空资源等问题。该文针对印刷体汉字识别的后处理,提出了一种基于字节的语言模型的后处理算法。通过采用字节作为语言模型的基本表示单位,模型的复杂度大大降低,从而数据稀疏问题得到很大程度上缓解。实验证明,采用基于字节的语言模型的后处理系统能够以极少的时空开销获取很好的识别性能。在有部分分割错误的测试集上,正确率从88.67%提高到了98.32%,错误率下降了85.18%,运行速度较基于字以及基于词的系统有了大幅的提升,提高了后处理系统的综合性能;与目前常用的基于词的语言模型后处理系统相比,新系统能够节省95%的运行时间和98%的内存资源,但系统识别率仅降低了1.11%。  相似文献   

3.
手写数字识别的原理及应用   总被引:5,自引:0,他引:5  
任丹  陈学峰 《计算机时代》2007,(3):17-18,21
随着信息技术的发展,信息建设在我国得到了迅猛的发展,手写数字识别的应用需求越来越广泛.文章从概念、研究背景、研究意义等方面介绍了手写数字识别的原理及实现方法,并介绍了手写数字识别的几个典型应用.  相似文献   

4.
本文提出了一种词间匹配的后处理方法,利用汉语上下文中词和词之间有一定的联系来对识别结果进行纠错,并综合词匹配、词间匹配和Markov语言模型使各环节之间形成反馈,相互补偿,形成一个较好的组合,以此来提高后处理部分的纠错能力以及稳定性。  相似文献   

5.
中国汉字博大精深,拥有着数千年的文化背景与历史积淀,是世界上使用人数最多的文字。汉字与其他文字不同,它具有自己的拼音化系统和独立文字结构,所以在目前以计算机信息技术化为主体的社会里,对印刷体汉字信息的处理也就成了信息化发展的关键。印刷体汉字识别后处理技术OCR的出现就解决了现如今海量文字信息所带来的处理难题,它提高了印刷体文字的处理效率,也推动了信息社会的不断发展。  相似文献   

6.
信函自动分拣系统在我国的一、二级邮区中心局普遍使用。系统采用先进的OCR技术识别和人工(单字)补码技术,对六位邮政编码进行识别,并按照不同的分拣方案.对邮件进行自动分拣,为大规模、高效率进行邮件处理提供了保证。计算机技术的迅猛发展,为信函分拣的自动化提供了技术支撑,如采用多种OCR识别模式对打印体的窗口信封、贴条信函等的识别,大大提高了信函分拣的处理率,降低了误识率。  相似文献   

7.
灰度图像中字符切分方法的研究   总被引:5,自引:1,他引:5  
字符切分目前已经成为限制OCR技术发展的瓶颈,对于图像质量较差、中英文混排和背景色变化的文本图像,传统切分方法造成的切分错误使得文字识别率大大降低。针对这些问题,本文提出了新型文字切分方法。该方法先将灰度图像的灰度值进行分级处理,再根据分级连通域的概念把整个图像构造成树状结构,然后确定主层次级别,根据一定的规则在部分节点上进行合并、分割等进一步处理,最后得到最优的切分结果。实验结果表明,该方法能够取得比常规切分方法更好的切分效果。  相似文献   

8.
在文字识别系统中,为了进一步提高文本识别率,后处理模块是很重要的环节。文章针对日文的语言特性,建立统计方法和规则相结合的混和语言模型,实现了一个日文识别后处理系统。该系统首先利用Viterbi算法得到统计模型输出的最优结果,通过与前端识别器输入的识别结果相比较,确定可疑字位置,再利用上下文词匹配方法和语法规则库的使用对可疑字进行检错和纠错处理。经实验验证,该后处理系统对识别日文印刷体文本错误率平均下降21.4%。  相似文献   

9.
用于脱机手写数字识别的隐马尔可夫模型   总被引:9,自引:0,他引:9  
将隐马尔可夫模型(HMM)用于脱机手写数字识别中,系统如何建模是一个值得研究的问题.在考虑手写数字自身特点及特征抽取的基础上,对HMM模型的训练方法及模型参数的选取进行了研究,以提高系统识别率.在银行票据OCR的应用中,与基于神经网络的方法结合使用,使得整张票据的拒识率降低了3%,明显提高了银行票据OCR系统的性能.  相似文献   

10.
K.  -  Y.  Hung  R.  W.  P.  Luk  D.S.  Yeung  K.  F.  L.  Chung  W.  Shu  范生淼 《图象识别与自动化》2005,(2):16-30
在很多领域中,识别错误的检测是一项重要的工作,比如进一步提高检测识别的性能,节约阅读校对和修改、编辑需要的人工劳动,以及在构造数字图书馆时为检索分配合适的权重等。本文提出一种用于多分类器检测识别错误的新方法。采用单一分类器和单一门限的检测方法,并不能提高检测识别错误的能力,因此需要使用多分类器。虽然一个分类器无法提高检测识别错误的能力,但它提供了比较的基线,相关的错误检测其有用特征的学习表明了可以提供三种不同的情况。在每一种情况中,多分类器分别分配一个分类器检测是否有错误,并且考虑每种情况的额外特征。实验结果表明,识别错误的回现率为70%-80%,识别错误的检测精确率为80%-90%,比使用单一分类器和单一门限检测方法具有更好的效果,能节省75%的人工劳动。  相似文献   

11.
网格方向特征在手写体汉字识别系统中得到广泛应用,被认为是目前较成熟的手写体汉字特征之一。网格技术是网格方向特征的关键技术之一。根据汉字笔画分布特点及拓扑结构的相关性,提出了一种新的基于弹性网格及其相关模糊特征的提取方法。该方法使特征向量的信息量增加,特征更加稳定。对银行支票图像大写金额的识别率达到97.64%,实验结果证明本文方法比其他网格方向特征更有效。  相似文献   

12.
一种识别手写汉字的多分类器集成方法   总被引:4,自引:1,他引:3  
根据多信源信息处理与字符识别的经验知识,提出了一个识别手写汉字的多分类器线性集成模型.这个模型不仅考虑到不同的分类器对不同字符识别能力的不同,而且还考虑了不同的分类器得出的输入字符与参考模板之间相似度的实际大小对判决的影响,及不同分类器提供的候选字符对判决的支持作用,更重要的是提供了一种通过监督学习,利用计算机程序自动计算模型参数的方法,因而实现了一个较好的集成系统.同时,本文还提供了三个用于集成的分类器,它们集成的结果充分显示了本方法的有效性.  相似文献   

13.
手写汉字的集群识别   总被引:3,自引:0,他引:3  
为了降低单个汉字的分辨率,论文分析了通用的汉字识别模型,并在此基础上建立了适于多字识别的集群识别模型。为了充分论证集群识别模型的观点,本文从理论证明和实验两方面获得支持根据。实验结果表明基于多字识别模型的集群识别能可靠提高对连续文字的识别效果,是手写汉字识别中很有希望的发展方向。  相似文献   

14.
张洪刚  刘刚  郭军 《计算机学报》2003,26(5):636-640
提出一种新的手写汉字识别结果可信度的测定方法.该方法将各种识别结果的正确率作为测定识别结果可信度的绝对尺度,以各候选字的相对邻近度为基础定义了测定可信度的一种新的相对尺度,并将这两个绝对尺度和相对尺度相结合来全面测定可信度.通过基于HCL2000数据库的测试和在银行票据OCR系统中的实际应用,证明了这种方法的有效性.  相似文献   

15.
本文面向手写字符序列输入信号连续识别研究,分析了汉字及联机手写文本的特点,提出并构建了手写汉字部件集。基于该部件集,完成了GB2312-80的6,763个汉字的部件拆分编码和部件集的测试。统计编码数据发现,汉字依手写部件数的分布规律呈对数正态分布。本文从统计学和字符识别技术的角度对手写部件的构字能力作了分析和讨论,部件集的设计方案在部件选择和汉字拆分上均满足设计要求。实验表明,基于手写部件构造的部件识别器对手写汉字和连续汉字的部件识别率分别达到70.21%和58.49%。  相似文献   

16.
一种手写体大写金额串的分割新方法   总被引:3,自引:0,他引:3  
手写体大写金额串的分割将直接影响识别的准确率。为了提高分割的准确率,同时保证较快的分割速度,本文采用了由粗分割和细分割组成的两步分割方法。重点介绍交叉字符和相连字符的分割方法。对于交叉的字符提出了加窗处理的中点连线分割方法,它较其它方法具有简单准确的优点;对于单笔相连的字符,先在细化字符图象上找到候选笔划的候选分割点,然后用本文提出的简明的评价准则来确定最优分割点,提高了粗分割的精度。上述方法应用于银行支票手写体大写金额的分割,取得了很好的分割效果。  相似文献   

17.
为了提高手写汉字的识别率和降低训练时间,提出了一种基于多通道PCA(Principal component analysis)模型的手写汉字识别方法.该方法首先根据汉字的结构特点,将手写汉字分解为“一”、“I”、“J”、“\”4种方向子模式,然后分别对每个子模式进行主分量分析,最后通过建立起每类汉字的多通道PCA模型来进行手写汉字的识别.该方法既兼顾了主分量对手写汉字的描述能力,又有效地降低了建立模型的训练时间.针对1034类别的手写汉字样本的实验结果表明,该汉字识别方法的识别率较欧氏距离分类器提高了4.4个百分点,而其训练时间则明显低于直接进行PCA重建的识别方法,由此可见,该方法是有效的。  相似文献   

18.
以往的手写汉字识别方法,无论应用何种特征提取方法,在生成标准模板时,一般都采用样本特征的算术平均值。文章提出了一种使用样本特征的分位数组合生成标准模板的方法,通过其在手写汉字识别中的应用表明,该方法比基于均值的标准模板有更好的鲁棒性,且在不增加任何计算量和算法复杂度的前提下,使系统的识别性能有所提高;同时该算法还有很好的推广性能,可以应用到各种特征提取算法中。  相似文献   

19.
语音识别使声音变得"可读",让计算机能够"听懂"人类的语言并做出反应,是人工智能实现人机交互的关键技术之一.本文介绍了语音识别的发展历程,阐述了语音识别的原理概念与基础框架,分析了语音识别领域的研究热点和难点,最后,对语音识别技术进行了总结并就其未来研究进行了展望.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号