首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对信函地址行中存在着大量的笔画交叉与粘连,采用了一种基于笔画提取合并的手写体汉字切分方法,并应用与地址解释相结合的动态规划得到最终切分结果,获得投递区域。用从邮政分拣机上获得的443个信函地址行二值图像样本进行测试,省市一级和市县一级投递地址的正确识别率已经达到了66%。  相似文献   

2.
在手写体中文信封处理系统中,地址行字符切分是实现地址行识别的关键步骤。本文根据邮政信封地址行字符的特点,有针对性的提出了一种字符切分算法。首先对地址行图像利用投影、求连通区域、笔划穿越数分析等基于字符结构的方法进行初始切分,得到基本字段序列;然后通过对相邻的基本字段进行组合形成多条候选切分路径,再通过识别的可信度和邮政目标地址库的先验知识信息对路径进行评价分析,从而得到最优的切分路径。该算法经过邮政分拣机采集的实际信封图像测试,纯地址行识别正确率达到78.61%,地址行识别与邮政编码识别相结合的分拣正确率达到95.42%。  相似文献   

3.
一种离线手写体汉字切分的自适应算法   总被引:2,自引:0,他引:2  
目前用于字符切分的算法主要有基于灰度直方图投影、字符连通域算法等,但这些算法不适用于相邻粘连汉字的切分。论文针对粘连汉字的切分,以邮件信函地址为对象,提出了一种离线手写体汉字切分的自适应算法。其基本步骤为:首先,基于灰值投影将手写汉字地址粗分为几个字段;其次,用傅立叶变换判断这些字段是否为粘连字段;再次,用汉字的字高和字宽的比值大小判断非粘连字是单字还是单字的部首;最后,以伸缩框法对粘连字分割,并对过分的部首进行合并。此算法的优势在于根据每个人书写的不同习惯,确定不同的伸缩框对汉字进行分割。  相似文献   

4.
在离线手写体字符识别中,正确切分字符是提高识别性能的关键步骤之一。本文针对离线手写体汉字,提出了一种基于垂直投影法和前景一背景细化的切分算法。首先,本算法利用垂直投影法和背景细化的方法对非粘连字符进行切分,根据周边特性取得代价函数,利用动态规划法合并字块。其次,对于粘连字符,根据背景和前景细化的结果,选取一系列的特征点形成切分路径,然后利用代价函数来选择合适的路径。实验结果表明,提出的切分算法对手写体汉字字符有较好的切分效果。  相似文献   

5.
无约束手写体汉字切分方法综述   总被引:6,自引:0,他引:6  
高彦宇  杨扬 《计算机工程》2004,30(5):144-146
汉字切分是手写体汉字识别预处理中的一个难点,切分的正确与否直接关系到汉字识别的准确度。该义对目前无约束手写体汉字识别在行字切分上主要采用的方法作了具体介绍,闸述了各种方法的优缺点,最后根据目前的研究状况,指出今后研究中心需要注意的问题和研究的发展方向。  相似文献   

6.
邵洁  成瑜 《微机发展》2006,16(6):184-186
汉字切分是汉字识别系统中必不可少的组成部分,但由于手写体汉字的书写多变而随意,极大地增加了汉字分割的难度。文中回顾了近十年来脱机手写体汉字分割的发展历程及在发展中涌现的一些主要类型的切分方法,分析了每一类方法的优缺点及其包含的各个分支。最后,参考各种方法的优缺点,对今后的手写体汉字分割发展方向进行了展望。  相似文献   

7.
一种用于脱机手写体女书字符切分的方法*   总被引:1,自引:0,他引:1  
针对目前国内文字切分主要应用于汉字、英文等,而对于濒危少数民族文字缺乏较为实用的切分工具的问题,提出了一种用于脱机手写体女书字符的切分方法。该方法结合投影法和连通域进行粗切分,对交叉字符采用曲线切分,对粘连字符采用改进的滴水算法切分,经实验证明该方法能够取得较好的切分效果。该方法为女书字符切分提供了新思路。  相似文献   

8.
关于手写汉字切分方法的思考   总被引:2,自引:0,他引:2  
汉字切分是汉字识别系统中必不可少的组成部分,但由于手写体汉字的书写多变而随意。极大地增加了汉字分割的难度。文中回顾了近十年来脱机手写体汉字分割的发展历程及在发展中涌现的一砦主要类型的切分方法,分析了每一类方法的优缺点及其包含的各个分支。最后,参考各种方法的优缺点,对今后的手写体汉字分割发展方向进行了展望。  相似文献   

9.
基于神经网络的手写体汉字识别是将汉字点阵图形转换成电信号,然后输入给数字信号处理器或计算机进行 处理,依据一定的分类算法在众多汉字字符中找出和它相互匹配的汉字字符。本文阐述了手写体汉字识别实验系统的设计目 标,分析了手写体汉字的预处理及其原理,详细介绍了手写汉字的特征提取。  相似文献   

10.
用于粘连手写体汉字切分的二次寻点算法   总被引:2,自引:0,他引:2  
离线手写体汉字的切分是离线汉字识别的基础,其中以粘连字体的切分最难。文章提出了一种对粘连手写体汉字粘连位置精确定位的算法。该算法包含两次寻点过程,第一步寻找波谷点,对粘连字的分割位置进行粗定位;第二步寻找理想切分点,即结合波谷点与波谷邻近特征点的综合位置,最终给出切分线定位,以实现粘连汉字的切分。  相似文献   

11.
刘阳兴 《计算机应用研究》2011,28(10):3998-4000
针对粘连和搭接字符切分算法的不足,提出一种基于折线切分路径的字符切分算法。该算法利用投影法将粘连搭接字符与非粘连搭接字符分离开,而后结合粘连搭接字符独有的外形特征,通过引入惩罚权重的路径搜索算法快速而准确地得到粘连搭接字符间的折线切分路径;为了避免一些字符在以上的切分过程中被误切碎,利用识别反馈信息对一些字符子图像进行合并。实验结果表明,该算法对印刷体日英混排字符切分有很强的适应性,取得了较理想的切分效果。  相似文献   

12.
基于组件合并的手写体汉字串分割   总被引:5,自引:0,他引:5  
吕岳  施鹏飞  张克华 《软件学报》2000,11(11):1554-1559
人们对孤立的手写体汉字字符的离线 识别做了大量的研究工作,而走向实用化的进展并不快.除了单字识别率不理想以外,从文本 中正确分割出单个汉字字符也是一个主要难题,因为字符的识别离不开正确分割.利用汉字的 基本结构特征,根据两个组件之间的上下、左右和包围关系,对组件进行合并形成完整的汉字 图像.对整个汉字字符串中组件的宽度和相邻组件的间距进行分析,有助于左右关系组件的合 并.实验结果表明,该方法对手写体汉字字符串具有理想的分割效果.  相似文献   

13.
在字符识别系统中,字符的有效分割是识别的关键。针对手写汉字字间距及字内距无规则可循,字符间极易发生粘连、交错等现象,提出一种多步分割方法。该方法首先利用Viterbi算法将原字符串切分成互不连通的分割块,使非粘连汉字、交错汉字得到正确分割;对于其中宽度较大存在粘连字符的分割块,从候选分割点入手,用非线性分割路径将粘连部分分开;最后再应用A*算法找到全局最佳分割位置,使过分割的字符得到完整合并。实验结果表明,该方法对于手写汉字的分割是可行、有效的。  相似文献   

14.
根据古文献和古代手写体汉字纵向书写,上下字多粘连、多重叠等特点,提出一种基于可变窗口的古代手写汉字多步切分方法。对古文献进行列切分,列切分采用投影过滤的方法,采用投影法对手写字进行粗切分,对存在粘连或重叠的字串采用可变窗口的方法进行细切分,确定字串中每一个单字的切分路径。实验结果表明,该方法能够有效应用于古文献中手写汉字的切分。  相似文献   

15.
基于凸包像素比特征的粘连汉字切分   总被引:4,自引:0,他引:4  
汉字切分正确与否直接影响了汉字识别系统的识别率,粘连汉字则是切分中的难点。本文将基于背景细化的切分方法应用于《四库全书》的两字符粘连汉字数据集,并针对其中切分路径选择问题,提出了一种新特征- 凸包像素比,反映了在不同切分路径下汉字结构变化的特性。实验结果表明该特征对多种分类器均能有效地提高切分路径选择的正确率。其中在使用基于高斯混合模型分类器时取得了8816 %正确率。  相似文献   

16.
运用像素水平投影与竖直投影的方法,结合车牌字符的先验信息可以准确地对车牌字符进行切割。同时,针对某些汉字易被错误分割或漏割的情况。对汉字左右边界的起始位置进行标记,利用此标记获得该汉字的原始灰度图像,对其单独进行分割及二值化.避免汉字笔画退化为噪声。实验表明,该方法能够准确分割字符。  相似文献   

17.
基于连通域的汉字切分技术研究   总被引:3,自引:0,他引:3  
字符切分技术已经成为汉字识别系统设计中的关键问题,对于质量较差的文本图像,用灰度图像取代传统的二值化黑白图像能够取得更好的切分效果,基于连通域的切分算法能够对灰度图像进行较好的切分,基于连通域的汉字切分算法能有效地对文本图像中汉字字符部件进行合并及对粘连字符进行分割。  相似文献   

18.
在连通域单元的基础上提出了一种手写体汉字切分的优化模型,该模型可以自适应的确定部件、单个字和粘连字的宽度。另外,对粘连字的切分采用了加权k的均值法。整个切分方法既提高了算法的自适应能力,又提高了切分的正确率。实验表明这种方法具有很好的切分效果。  相似文献   

19.
本文讨论手写体汉字的基本分割问题以及解决该问题需做的一些工作,并提出了一种新的分割方法,用于在线和离线系统识别自由格式手写体汉字的句子。该方法通过调整空间阈值和最小均方差判别以实现基本分割和精细分割,从中可得到五种最可能的分割方案,抽取所有可能的分段并进行识别。由分段建立起栅格点,利用基于Viterbi的算法搜索到最可能的字符序列。本算法对自由格式连续手体汉字的处理具有很强的适应性和灵活性。对自然  相似文献   

20.
特征提取是手写体汉字识别的关键环节.弹性网格特征是一种较好的手写体汉字特征,但是无法体现汉字的整体结构信息,为此提出了一种采用复合特征进行手写体汉字识别的方法.该方法采用霍夫变换提取汉字图像的全局特征,并把这些全局特征与用弹性网格方法提取出的局部特征联合起来,这样得到的混合特征完整地反映了汉字全局特征和局部特征.最后通过实验证明,在进行大类别手写体汉字识别时,在特征值维数相同的情况下,采用这种复合特征的识别率明显高于单一的弹性网格特征,因此该方法是行之有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号