首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
印刷体藏文文字识别技术研究   总被引:2,自引:0,他引:2       下载免费PDF全文
藏文字因其结构的特殊性,在应用传统文字识别方法进行识别时正确识别率较低,识别效果较差。在深入分析以印刷体藏文文字特征的基础上,提出了一系列可以在干扰情况下提高识别率的方法,包括局部自适应二值化算法、基于连通域的切分、基于网格的模糊笔划特征提取等。实验结果说明,这些方法可提高印刷体藏文文字识别系统的正确识别率和抗干扰能力。  相似文献   

2.
3.
4.
基于多特征的印刷体数字识别   总被引:1,自引:0,他引:1  
采用特征识别的方法,提取数字的区域像素、水平过线、垂直过线三大方面的17个特征值对印刷体数字进行识别.利用MATLAB进行仿真实验,实验结果表明该识别方法简单,识别率高,速度快,抗干扰性强,对于不同字体、字形、字号的印刷体数字,能够快速准确识别,具有广泛的用途.  相似文献   

5.
6.
藏文识别的预处理   总被引:9,自引:2,他引:7  
预处理是整个文字识别系统的重要组成部分,预处理性能的优劣将直接影响整个识别系统的性能,根据藏文字在字形和书写方式上的特点,实现了一种适用于藏文识别的预处理技术,整个预处理过程包括二值化、版面分析、倾斜校正、字符切和归一化,在预处理过程中还提取了一此圾关字丁的基本特征,这些特征充分反映了藏文的特点,具有良好的稳定性,可以用于识别系统的粗分类和后处理。  相似文献   

7.
一种快速有效的印刷体文字识别算法   总被引:8,自引:1,他引:7       下载免费PDF全文
为了利用低成本的硬件来实现对印刷体文字的快速识别,提出了一种基于多级分类的印刷体文字快速识别算法,该算法从预处理、特征提取,到模式匹配各个阶段,都对传统方法作了合理的改进.该算法首先是采用36×36,而不是传统的48×48点阵进行归一化,从而有效地减少了计算量和字典容量;其次是采用改进的粗外围特征,并进行二重分割,以提高特征的稳定性;最后在各级分类中采用了不同的判别准则,包括绝对值距离、欧氏距离及相似度准则,以适应于时间、准确性的不同要求.同时用该算法对一级汉字7000个样本进行了实验,其结果表明,实际正确识别率(正识率)达95%,前5位累积正识率可达98%,从而为“电子阅读笔”的开发与研制打下了坚实的理论基础.  相似文献   

8.
一个印刷体汉字识别系统的设计   总被引:1,自引:1,他引:1  
给出一个印刷全汉字识别系统的设计方案,它主要包括扫描输入,模糊增强与聚类分割 ,图象数据二值比,通过并行神经网络进行汉字匹配等四个步骤。  相似文献   

9.
藏文识别中相似字丁的区分研究   总被引:7,自引:0,他引:7  
相似字丁多是藏文识别中的一大难点。本文通过对相似字丁类型的研究,以及印刷体藏文识别结果的统计分析,得到图形结构的分析与识别结果相吻合的结论。说明必须根据藏文字丁的结构特点,在字符归一化、特征选择方面进行特殊的处理,以实现藏文识别中相似字丁的区分。  相似文献   

10.
本文在充分考察了手写汉字和中国大汉字集特点的基础上, 提出了一组用于手写印刷体汉字识利的分类特征, 它们是长笔划分布类型、各类笔划的数目、交叉点数目和折点数目。利用这组特征进行匹配就可直接识别出GB2312-80汉字集中的绝大部分汉字, 再通过一个基于知识的推理过程即可进一步识别出已被分成类组的少数剩余汉字, 这种将统计分类与基于知识的推理识别相结合的两级识别方法具有较高的效率。一个适应性较强的汉字笔划和特征点抽取方法也被设计, 它是SLSA方法的改进, 与机器学习功能相配合, 大大提高了特征抽取的正确率。我们根据上述思想建立了一个手写印刷体汉字识别实验系统, 并获得了较好的实验结果。  相似文献   

11.
娄震  陆建峰 《计算机工程》2003,29(9):134-136
和通常文档中的打印体字符分割和识别问题相比,支票图像中的打印体字符的分割和识别有其一定的特殊性。针对这种特殊性,该文提出了一套简单实用的算法。对于分割问题,主要是采用投影的方法解决印章、边框和底纹的干扰问题,对于字符识别,主要是采用了基于模板和融合的方法,从而有效地解决了上述问题,取得了比较满意的分割效果和较高的识别率。  相似文献   

12.
西夏文字识别中的图像预处理   总被引:5,自引:0,他引:5  
西夏文字的预处理是其识别过程的第一步,它的好坏直接影响西夏文字识别的效果。文章用图像分析及处理技术研究西夏文字的预处理,就西夏文字识别预处理中的每个过程进行了详细的研究,提出的方法和处理技术在实验中收到了良好效果。  相似文献   

13.
多字体印刷藏文字符识别   总被引:5,自引:1,他引:5  
藏文字符识别系统是中文多文种信息处理系统的重要组成部分,但至今国内外的研究基本处于空白。本文提出了一种基于统计模式识别的多字体印刷藏文字符识别方法:从字符轮廓中抽取方向线素特征,利用线性鉴别分析(LDA)压缩降维后得到紧凑的字符特征向量。采用基于置信度分析的两级分类策略,设计了带偏差欧氏距离分类器(EDD)完成高效的粗分类,细分类采用修正二次鉴别函数(MQDF)。通过实验选取恰当的分类器参数后,在容量为177,600字符(300样本/字符类)的测试集上的识别率达到99.79%,证明了该方法的有效性。  相似文献   

14.
光字符识别对人类是很简单的,但对计算机来说显得非常困难。自动字符识别在银行、航运、商业、通信、车牌识别等重要领域应用相当广泛。该文的主要任务是开发一个能识别机器印刷英文字符的系统,该系统采用基于反向传播的多层神经网络监督训练算法。通过系统进行多次测试和调试,不断优化网络参数并取得最佳结果,使得构建的新系统能够识别多种字体的字符。实验结果表明,该系统具有较高的识别率和优越的性能。  相似文献   

15.
基于BP神经网络的印刷字符识别系统   总被引:1,自引:0,他引:1  
光字符识别对人类是很简单的,但对计算机来说显得非常困难。自动字符识别在银行、航运、商业、通信、车牌识别等重要领域应用相当广泛。该文的主要任务是开发一个能识别机器印刷英文字符的系统,该系统采用基于反向传播的多层神经网络监督训练算法。通过系统进行多次测试和调试,不断优化网络参数并取得最佳结果,使得构建的新系统能够识别多种字体的字符。实验结果表明,该系统具有较高的识别率和优越的性能。  相似文献   

16.
多字体印刷维吾尔文字符识别系统的研究与开发   总被引:2,自引:0,他引:2  
该文介绍了维吾尔文的特点及维吾尔文字符识别系统.针对维吾尔文的连体结构.重点讨论了解决过程中的技术难点.其中利用投影分离出连体段中的字母.采用边切分边识别的方法,对文本图像进行了切分.分类.提取外围特征,并通过样张的训练.使维吾尔文字符的识别获得了较满意的结果.  相似文献   

17.
印刷体蒙古文文字识别中常用特征的获取   总被引:2,自引:1,他引:2  
李振宏  高光来 《微机发展》2003,13(11):117-119
蒙古文印刷体识别技术和蒙古文印刷体识别软件的研究与开发对少数民族地区信息化的发展有着很重要的作用。基于这种需求,文中讨论和分析了蒙古文印刷体识别中常用的特征,并且讨论了这些特征的提取方法。文中所述特征已应用于蒙古文印刷体文字识别软件的设计。结果证明这些特征是可行的、高效的,可以应用于识别软件的设计。蒙古文文字识别的研究将会推动少数民族地区信息化的进程。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号