首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 781 毫秒
1.
字符切分是藏文古籍文档图像分析与识别中重要的一环,针对乌金体藏文古籍文本行倾斜,字符之间笔画交叠、交叉、粘连以及不同程度的笔画断裂、噪声干扰等问题,提出了一种基于结构属性的乌金体藏文字符切分方法.首先,建立了乌金体藏文古籍字符区块库.然后,利用音节点位置信息或结合水平投影与直线检测的方法检测出字符区块的局部基线,并根据基线将字符区块切分为上下两部分;利用改进的模板匹配算法检测基线上方笔画的粘连及其类型,利用多方向、多路径粘连切分算法切分交叉、粘连笔画.最后,根据藏文结构属性对各笔画进行归属,完成字符切分.实验结果表明,本方法能有效解决字符切分中遇到的问题,字符切分的召回率、精确率以及F-Measure可分别达到96.52%、98.24%、97.37%.  相似文献   

2.
虞瑾  丁晓青 《电视技术》2007,31(Z1):148-150
提出了联机手写字符切分算法.通过基于规则的笔划合并和笔划块切分将笔划合并成字符块,在此基础上,采用动态规划算法,利用字符块的间距、外接框重叠信息、笔划复杂度以及字符识别信息,寻找出最优的切分路径.实验证明,算法对于一维简单数学公式和二维复杂数学公式的切分都有着比较好的效果.  相似文献   

3.
手写字符由于书写风格和习惯的不同,造成字符模式的不稳定。针对这一问题,本文首先对字符图像进行图像预处理,统一字符笔画的粗细,改善局部特征,随后利用二维主分量分析法(2DPCA)直接对字符图像矩阵进行变换,抽取字符特征,建立字符的特征矩阵及重构模型,利用最邻近方法和重构误差法进行字符识别。最后通过美国国家邮政局MINIST手写数字库中进行识别实验,验证了算法的准确性和鲁棒性。  相似文献   

4.
在大篇幅的手写维吾尔文文本图像中,往往会出现粘连字符这一现象。这一现象会对文本行分析和笔迹鉴别等研究工作造成影响,同时所处环境为大篇幅手写图像,在对粘连字符切分时会受到其余非粘连字符的较大干扰。针对上述问题,本文提出了对手写文本图像定位线的正确提取方案,以连通域特性为基础,通过定位线与文本图像融合,使行间粘连字符所在文本行为同一连通域想法,可自动提取出粘连文本行,再根据粘连字符所占宽度和高度大于非粘连字符,从而自动提取出粘连字符。对提取出的粘连字符通过定位线可确定出粘连区域,对粘连点所处位置进行统计分析后在该位置处添加一条与背景同色细线从而达到分割效果,最后对分割后的粘连文本行通过着色方法逐行提取。实验表明,上述问题通过我们的方法得到了很好的解决。在实验结果分析中,本文给出了每个算法的性能指标数据,并与其它文献进行了对比分析,论证了本文研究方法的可行性及存在的一些主要问题。  相似文献   

5.
杨晓敏  吴炜  何小海  陈默  薛磊 《光电子.激光》2007,18(12):1478-1481
针对手写字符识别中由于书写习惯和风格不同造成字符模式不稳定的问题,提出了一种基于流形学习的手写体数字识别方法。算法首先利用局部线性嵌入(LLE)对手写体数字图像进行字符特征的降维,然后再对降维后的特征进行分类识别。通过对MINST库中手写体数字数据库上的实验结果表明,利用LLE降维后的特征能够有效地区分字符,识别率达到91.7%,并能够发现高维空间的低维嵌入流形。  相似文献   

6.
基于笔划提取和合并的离线手写体汉字字符切分算法   总被引:7,自引:0,他引:7  
手写体汉字字符切分是离线汉字字符识别预处理中的一个重要问题,针对离线手写体汉字,提出一种基于笔划提取和合并的手写体汉字字符切分算法。该算法首先基于方向游程提取汉字的笔划,并建立笔划框,再根据汉字笔划的结构知识对笔划框进行合并,得到字符的切分结果。该算法能较好地解决粘连汉字字符的切分问题,对从现场随机采集的2500封手写体信函地址汉字进行切分,单字正确率可达91.5%。  相似文献   

7.
付强  丁晓青  蒋焰 《电子与信息学报》2008,30(12):2916-2920
该文提出了一种有效的中文手写地址字符串的切分与识别方法。首先,利用笔划提取与笔划合并将字符串图像进行过切分,得到字根图像序列;然后综合利用几何信息、识别信息和语义信息挑选最优的字根合并路径,得到最优的切分结果及对应的最优识别结果。其中,几何信息是根据当前字符串自身的特点统计得到,因此可适应不同书写风格的字符串。识别信息由单字分类器给出,包括10个候选识别结果及其相应的置信度;单字分类器采用MQDF分类器。语义信息用基于字的bi-gram模型进行描述,模型参数是从包含18万条地址数据的数据库中统计得到的。用3000个实际的手写地址样本做试验,单字识别正确率达到88.28%。  相似文献   

8.
吴延年  梁维谦 《电声技术》2009,33(11):64-67
基于HMM后验概率分数的自动发音评测方法中,强制匹配获得语音的音素级切分信息是重要的一步。切分结果是否准确直接影响到后验概率分数的可靠性。通过对单词发音网络增加可跨越分支,实现单删除错误检测功能,可降低说话人删除错误对前后单词切分准确性的影响。实验结果显示,单词删除错误检出率达到87.8%。  相似文献   

9.
基于Gabor变换的高鲁棒汉字识别新方法   总被引:28,自引:3,他引:25       下载免费PDF全文
王学文  丁晓青  刘长松 《电子学报》2002,30(9):1317-1322
本文提出了针对字符图像的基于Gabor变换的汉字识别新方法.在对Gabor变换深入分析的基础上,本文针对汉字图像的统计信息,提出了一种有效的Gabor滤波器组参数优化方法;同时,对Gabor滤波器组的输出进行非线性变换,使其适应不同亮度和低质量灰度字符图像的识别.本文还改进了分块特征的抽取算法,提高了对字符细节的分辨能力.实验表明,这种特征抽取方法大大加强了识别系统抵御图像噪声、干扰、亮度变化、笔画模糊、笔画断裂以及字符形变的能力,在应用于各种低质量的二值或者灰度的印刷和脱机手写字符图像识别时,能获得较其他算法更良好的识别性能.  相似文献   

10.
本文针对手写文字转换成二值字符图形后出现的噪声现象和识别方法对二值字符图形的要求,提出了一种处理字符噪声的算法。文中介绍了算法的软硬件实现,给出了实验结果。文中提出的算法不限于手写文字场合,凡属文中类型的噪声,都可用本算法处理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号