首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于笔划提取和合并的离线手写体汉字字符切分算法   总被引:7,自引:0,他引:7  
手写体汉字字符切分是离线汉字字符识别预处理中的一个重要问题,针对离线手写体汉字,提出一种基于笔划提取和合并的手写体汉字字符切分算法。该算法首先基于方向游程提取汉字的笔划,并建立笔划框,再根据汉字笔划的结构知识对笔划框进行合并,得到字符的切分结果。该算法能较好地解决粘连汉字字符的切分问题,对从现场随机采集的2500封手写体信函地址汉字进行切分,单字正确率可达91.5%。  相似文献   

2.
将手写单词分割成字符是一项艰巨的任务.本文提出一种基于局部轨迹信息的单词过切分方法.该方法中,在不预先对附加笔划进行分组,不确定基线位置和不做倾斜校正的情况下探索单词轨迹的局部信息进行过切分.利用的局部信息包括手写轨迹中的平直点、局部最大和最小、局部最右和最左.探索手写单词原轨迹点序列中的局部最大值和局部最小值的点,从中找出切分点.初步确定的切分块里找到最右边和最左边的点更新切分点.本文提出的方法在5个不同作者的500个无约束手写单词样本上进行测试.平均字符切分召回率和正确率分别为93.35%和69.97%.  相似文献   

3.
字符切分是藏文古籍文档图像分析与识别中重要的一环,针对乌金体藏文古籍文本行倾斜,字符之间笔画交叠、交叉、粘连以及不同程度的笔画断裂、噪声干扰等问题,提出了一种基于结构属性的乌金体藏文字符切分方法.首先,建立了乌金体藏文古籍字符区块库.然后,利用音节点位置信息或结合水平投影与直线检测的方法检测出字符区块的局部基线,并根据基线将字符区块切分为上下两部分;利用改进的模板匹配算法检测基线上方笔画的粘连及其类型,利用多方向、多路径粘连切分算法切分交叉、粘连笔画.最后,根据藏文结构属性对各笔画进行归属,完成字符切分.实验结果表明,本方法能有效解决字符切分中遇到的问题,字符切分的召回率、精确率以及F-Measure可分别达到96.52%、98.24%、97.37%.  相似文献   

4.
数学公式图像识别的难点之一是数学公式分割.数学公式通常是由特殊的字符、希腊字母、英文字母和一些数字组成的复杂的结构体,大大增加了图像分割的难度.本文将数学形态学的思想引入到公式图像分割的算法中,通过对数学公式图像的细化操作,然后递归水平、垂直投影进行公式字符分割.实验表明,该方法能够有效的对数学公式进行分割.  相似文献   

5.
基于连通域单元和穿越算法的汉字切分   总被引:4,自引:0,他引:4  
王琳琬  杨扬  颉斌  杨毅 《信息技术》2004,28(4):30-32,35
参考汉字的基本结构特征,以连通域单元为基本处理单元,根据各个连通域单元之间的位置关系对其进行合并。对合并后的结果中存在字符粘连的情况,采用一种改进的穿越算法,选取最佳切分位置对文本进行切分。实验结果表明,本算法对单行自由格式手写体汉字切分可取得较好的效果。  相似文献   

6.
付强  丁晓青  蒋焰 《电子与信息学报》2008,30(12):2916-2920
该文提出了一种有效的中文手写地址字符串的切分与识别方法。首先,利用笔划提取与笔划合并将字符串图像进行过切分,得到字根图像序列;然后综合利用几何信息、识别信息和语义信息挑选最优的字根合并路径,得到最优的切分结果及对应的最优识别结果。其中,几何信息是根据当前字符串自身的特点统计得到,因此可适应不同书写风格的字符串。识别信息由单字分类器给出,包括10个候选识别结果及其相应的置信度;单字分类器采用MQDF分类器。语义信息用基于字的bi-gram模型进行描述,模型参数是从包含18万条地址数据的数据库中统计得到的。用3000个实际的手写地址样本做试验,单字识别正确率达到88.28%。  相似文献   

7.
基于汉字结构特征的自由格式手写体汉字切分   总被引:9,自引:0,他引:9       下载免费PDF全文
吕岳  施鹏飞  张克华 《电子学报》2000,28(5):102-104
本文利用汉字的基本结构特征切分自由格式手写体汉字字符,以汉字部件作为基本要素,根据部件之间的位置关系进行合并形成完整的汉字图像.自由格式手写体汉字串常有两个字符粘连的情况,依据汉字的笔画特征可以切割粘连字符.实验结果表明,该方法对自由格式手写体汉字字符有较好的切分效果.  相似文献   

8.
消噪和数学形态学结合的字符图像预处理算法   总被引:1,自引:1,他引:0  
陈利娟  徐利华 《现代电子技术》2009,32(22):110-111,118
噪声污染字符图像的预处理是字符识别技术中一项关键技术,字符识别的准确度直接取决于字符图的质量。基于消噪和数学形态学的基本原理,提出了一种预处理算法。仿真实验验证了所提出新算法的有效性和可行性。这种算法不仅能消除图像中的噪声,而且还有效地修复了笔划断裂的字符。新算法解决了识别笔划缺损字符的识别难点,从而间接地提高了字符识别技术的准确度。  相似文献   

9.
维、汉、英是特点完全不同的文字。该文依据多层次语言判断和适当干预的多语言字符识别系统设计原则首次实现了维、汉、英混排文本识别系统。识别系统首先根据维、汉、英文字的各自特点实现字符块语言属性的初步判断,然后针对每种文字设计不同的字符切割算法。字符识别可信度用来判断字符语言属性和字符切分结果是否正确。实验结果表明,各种维、汉、英混排文本识别率达到96.4%以上。  相似文献   

10.
亓文法  李晓龙  杨斌  程道放 《通信学报》2008,29(10):183-190
提出了一种用于二值文本图像的数字水印算法.该方法首先对文本图像进行字符切分,然后在乘性变换模型的假设之下,通过翻转字符图像的边界像素点来实现水印嵌入.同时,提出了一种完善的边界点翻转策略,使得嵌入水印的图像很难发现被修改的痕迹.实验表明,该算法可以有效抵抗打印和复印攻击,从而达到对于纸质文本文件的信息隐藏的目的,可以用于纸质文本文件的消息源头追踪.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号