共查询到19条相似文献,搜索用时 125 毫秒
1.
在离线手写体字符识别中,正确切分字符是提高识别性能的关键步骤之一。本文针对离线手写体汉字,提出了一种基于垂直投影法和前景一背景细化的切分算法。首先,本算法利用垂直投影法和背景细化的方法对非粘连字符进行切分,根据周边特性取得代价函数,利用动态规划法合并字块。其次,对于粘连字符,根据背景和前景细化的结果,选取一系列的特征点形成切分路径,然后利用代价函数来选择合适的路径。实验结果表明,提出的切分算法对手写体汉字字符有较好的切分效果。 相似文献
2.
用于粘连手写体汉字切分的二次寻点算法 总被引:2,自引:0,他引:2
离线手写体汉字的切分是离线汉字识别的基础,其中以粘连字体的切分最难。文章提出了一种对粘连手写体汉字粘连位置精确定位的算法。该算法包含两次寻点过程,第一步寻找波谷点,对粘连字的分割位置进行粗定位;第二步寻找理想切分点,即结合波谷点与波谷邻近特征点的综合位置,最终给出切分线定位,以实现粘连汉字的切分。 相似文献
3.
关于手写汉字切分方法的思考 总被引:2,自引:0,他引:2
汉字切分是汉字识别系统中必不可少的组成部分,但由于手写体汉字的书写多变而随意。极大地增加了汉字分割的难度。文中回顾了近十年来脱机手写体汉字分割的发展历程及在发展中涌现的一砦主要类型的切分方法,分析了每一类方法的优缺点及其包含的各个分支。最后,参考各种方法的优缺点,对今后的手写体汉字分割发展方向进行了展望。 相似文献
4.
5.
本文介绍了一个面向具体应用领域的集数据表格的扫描,识别,数据自动入库为一体的软件系统,研究了表格自动定位,汉字,数字的切分,快速识别等关键技术,提出了一种基于笔道方向的手写体数字识别方法。 相似文献
6.
基于笔划宽度提取的手写体汉字归一化方法 总被引:1,自引:0,他引:1
手写体汉字书写变形是手写体汉字识别预处理阶段的重要问题之一。为了有效地改善手写体汉字变形并识别手写体汉字,提出了手写体汉字笔划宽度提取,以及基于提取出的笔划宽度的手写体汉字归一化的方法。用上述方法在计算机上进行仿真实验,实验结果表明,手写体汉字归一化的方法既能保证原手写体汉字的形状结构特征不变,并可有效地改善手写体汉字变形差异。 相似文献
7.
汉字切分是汉字识别系统中必不可少的组成部分,但由于手写体汉字的书写多变而随意,极大地增加了汉字分割的难度。文中回顾了近十年来脱机手写体汉字分割的发展历程及在发展中涌现的一些主要类型的切分方法,分析了每一类方法的优缺点及其包含的各个分支。最后,参考各种方法的优缺点,对今后的手写体汉字分割发展方向进行了展望。 相似文献
8.
9.
脱机手写体汉字识别研究综述 总被引:7,自引:2,他引:7
脱机手写体汉字识别是汉字识别领域中最难的课题。该文对目前脱机手写体汉字识别在预处理、特征提取、分类识别及后处理四个阶段主要采用的方法做了简要介绍,阐述了各种方法的优缺点,并提出了一种将支持向量机有效地用于解决多分类问题的策略。最后根据目前的研究状况,指出今后研究中需要注意的问题和研究的发展方向。 相似文献
10.
基于笔划宽度提取的手写体汉字归一化方法 总被引:1,自引:0,他引:1
手写体汉字书写变形是手写体汉字识别预处理阶段的重要问题之一。为了有效地改善手写体汉字变形并识别手写体汉字,提出了手写体汉字笔划宽度提取,以及基于提取出的笔划宽度的手写体汉字归一化的方法。用上述方法在计算机上进行仿真实验,实验结果表明,手写体汉字归一化的方法既能保证原手写体汉字的形状结构特征不变,并可有效地改善手写体汉字变形差异。 相似文献
11.
基于决策树的汉语未登录词识别 总被引:13,自引:0,他引:13
未登录词识别是汉语分词处理中的一个难点。在大规模中文文本的自动分词处理中,未登录词是造成分词错识误的一个重要原因。本文首先把未登录词识别问题看成一种分类问题。即分词程序处理后产生的分词碎片分为‘合’(合成未登录词)和‘分’(分为两单字词)两类。然后用决策树的方法来解决这个分类的问题。从语料库及现代汉语语素数据库中共统计出六类知识:前字前位成词概率、后字后位成词概率、前字自由度、后字自由度、互信息、单字词共现概率。用这些知识作为属性构建了训练集。最后用C4.5算法生成了决策树。在分词程序已经识别出一定数量的未登录词而仍有分词碎片情况下使用该方法,开放测试的召回率:69.42%,正确率:40.41%。实验结果表明,基于决策树的未登录词识别是一种值得继续探讨的方法。 相似文献
12.
13.
非限定性手写汉字串的分割与识别是当前字符识别领域中的一个难点问题.针对手写日期的特点,提出了整词识别和定长汉字串分割识别相结合的组合识别方法.整词识别将字符串作为一个整体进行识别,无需复杂的字符串分割过程.在定长汉字串分割过程中,首先通过识别来预测汉字串的长度,然后通过投影和轮廓分析确定候选分割线,最后通过识别选取最优分割路径.这两种分割识别方法通过规则进行组合,大大提高了系统的性能.在真实票据图像上的实验表明了该方法的有效性,分割识别正确率达到了93.3%. 相似文献
14.
针对仪表标牌上一些字符间距较小,传统分割方法不准确,字符识别率不高的问题,提出了一种标牌粘连字符自适应定位分割重建识别算法。首先对标牌图像进行中值滤波、二值化等预处理;其次运用数学形态学方法对预处理后的图像进行开运算及腐蚀,将字符间一些无用的信息去掉,增大字符间距;继而通过形心算法找出每个字符的几何中心坐标,并通过Sobel边缘检测算子根据几何中心坐标获取每个字符边框,建立ROI,再返回标牌原图利用已经建立的ROI从中分割字符,在分割的每个字符后加5像素宽的矩形间隔条后重建字符图像,再进行OCR字符识别。经过对993块标牌进行字符识别实验,算法的识别率达到95.7%,表明文中算法是对标牌字符识别的一种有效算法。 相似文献
15.
针对车牌中汉字识别率低和识别速度慢问题,提出一种基于深度学习的车牌识别网络LeNet-5-L,该网络把车牌识别分为两个阶段,运用OpenCV库函数对车牌图像预处理,结合垂直投影分割方法将车牌分割为7个独立字符图像,降低了图像特征提取难度,从而提高车牌中各个的字符识别率和整个车牌识别速度;运用卷积神经网络解决车牌字符识别问题,基于LeNet-L设计一种车牌字符识别网络LeNet-5-L,有效提高车牌中首字符汉字识别率;实验结果表明,该网络对车牌中各个字符的识别准确率均高于99.97%,单个车牌识别时间仅需0.83 ms,该方法有效的提高车牌识别的正确率和识别速度. 相似文献
16.
多知识综合判决的字符切分算法 总被引:3,自引:0,他引:3
高性能的印刷体文字识别系统中,在单字识别技术比较成熟的条件下,字符切分成为比较关键的环节。字符切分可以看作是对字符边界正确切分位置的一个决策过程,该决策需要同时考虑字符局部的识别情况和全局的上下文关系。该文通过对中日韩三国文字字符切分的研究,提出一种基于多知识综合判决的字符切分算法。该算法成功应用于AsiaOCR项目,对于东方文字中常见的混排英文问题也能很好处理。实验结果表明,和以前的算法相比,新算法在中日韩三国文字识别系统中的切分错误率平均下降50%。 相似文献
17.
18.
汽车牌照识别技术研究 总被引:14,自引:0,他引:14
本文分析了汽车牌照的几何特征和成像特点,提出了一种基于边缘检测和Hough变换的汽车牌照定位方法和基于图像投影的车牌字符分割方法。通过分析车牌号码中的字符图像特点,提出了基于字符图像几何形态和笔画结构的字母和数字识别方法,以及基于汉字结构知识的汉字识别方法,从而实现了汽车牌照的自动识别。 相似文献
19.
基于遗传算法的汉语未登录词识别 总被引:1,自引:0,他引:1
针对汉语分词处理中未登录词识别这一难点,提出一种应用遗传算法识别的新方法.该方法扩大了分词碎片容量,将未登录词识别问题看成二值分类问题,即在预处理后产生的分词碎片中,单字存在"可组合"和"不可组合"两类,采用遗传算法先将分词碎片中的单字词确定下来,然后将其余相邻单字组合,完成未登录词识别.实验结果表明,该方法可有效地解决未登录词识别问题,提高未登录词识别的精确率和召回率. 相似文献