首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文介绍了一种利用线段特征矩阵进行匹配的手写汉字识别方法。对输入文字图像测定其笔划宽度,抽取四个方向子图像。然后,利用文字图像重心分割图像成若干区域,按分割的区域,求各子图像区域的线段特征矩阵,与样本字库比较识别,进行手写汉字识别分类。实验表明本方法是有效的。  相似文献   

2.
本文介绍一种通过抽取符号的几何特征来识别手写文字的方法。针对手写的字形变化大的特点,这种方法所抽取的特征受位置挪动、字形变化的影响较小。文中还提出了一种对几何特征进行位置分区的规则。在计算机上所做的识别试验证明此法比较灵活,所需硬件简单,对手写文字有较高的识别性能。  相似文献   

3.
本文提出了一种用计算机从手写汉字中抽提出三角号码基本特征的方法,并对抽出的汉字三只角上的特征进行编码,以达到识别分类的目的。从信息论的观点进行研究已经知道,汉字图像的四周对于文字识别的信息量是相对集中的,如果能正确地抽取这些特征,识别就成为可能。具体方法如下:(1)将手写汉字正规化,除去噪音,抽出方向线段,提取特征点的座标及接续关系矩阵。(2)在汉字图像上找出右上、左下、右下三个角上的基本特征点,根据特征点矩阵对每一个字生成三个笔形图像。(3)将笔形图像与三角号码笔形辞典比较,识别抽出三角号码笔形,并加以编码。用计算机模拟实验表明,本方法是有效的。  相似文献   

4.
一种基于数学形态学的手写汉字方向特征提取方法   总被引:6,自引:0,他引:6  
提出了一种新的基于数学形态学的手写体汉字方向特征提取的方法。该方法首先提出了一种利用数学形态学对手写汉字做笔划宽度归一化的方法,然后应用数学形态学的方向模板提取汉字在横、竖、撇、捺4个方向上的模式图像,最后,将弹性网格作用在4幅方向模式图像中,统计每个网格中的黑像素分布密度,得到汉字的方向特征。使用简单的距离分类器对120套3775个汉字手写体汉字进行识别实验,识别率达到8547%。  相似文献   

5.
为了更有效地提取手写汉字的特征,提高识别精度,本文提出了一种利用非线性归一化过程产生的坐标变换信息来提取手写汉字有效特征的方法。该方法通过非线性归一化获得各有效像素点在原汉字图像及规整后汉字图像中的坐标变换关系,在原图像上抽取各点特征,在归一化图像上进行网格的均匀划分和特征统计并形成用于分类的特征向量。该方法有效克服了以往先进行归一化预处理方法和动态网格方法的一些不足,兼顾了与传统结构特征提取方法的有效结合。针对HCL2000脱机手写汉字库大字符集样本的实验结果表明,该特征提取方法可有效提高识别精度和特征抽取速度。  相似文献   

6.
卢达  浦炜  陈琦玮  谢铭培 《计算机应用》2005,25(10):2418-2421
对手写汉字识别问题,提出了一种在识别之前对手写汉字预分类的新方法,该方法用Neocognitron网提取字符笔画特征,然后采用有监督的扩展ART神经网络(SEART)产生一定数量的预分类组并通过基于模糊相似测量的匹配算法进行预分类。实验表明,该方法用于手写汉字分类效果良好,预分类正确率达到98.22%。  相似文献   

7.
一、汉字识别 汉字识别就是利用计算机抽取汉字字形特征、实现汉字自动输入的一项技术。简单地讲,就是计算机认字。汉字识别是文字识别技术中的顶峰,又是一种高速的汉字输入技术。汉字识别的实现会极大地提高中文信息处理的速度。  相似文献   

8.
脱机手写体汉字识别的改进算法   总被引:1,自引:0,他引:1  
特征点抽取是脱机手本汉字识别中特征抽取的一种常用方法,目前的一些算法都存在一一的,因此本文给出两种改进算法,并经实验证明具有良好的效果。  相似文献   

9.
文本是计算机视觉的许多应用中的一项重要特征,图像中的文本往往包含着比较丰富的信息,将文本图像信息里的文字进行提取和识别,对于图像内容的分析、理解、信息检索等方面具有重要的意义。文本图像的识别分为预处理,文字的切分,细化,特征选择与提取,最后对候选文字进行识别。在文字的切分方面提出了一种改进的投影算法,该算法能在很大程度上提高文字切分的准确度,采用基于数学形态学算法对文字进行细化处理,并在特征选择方面引用了多级分类的算法。  相似文献   

10.
汉字图像预处理算法的研究及实现   总被引:8,自引:2,他引:8  
张世辉 《微机发展》2003,13(4):53-55,58
汉字图像处理技术在汉字识别过程中占有重要地位,文中研究了汉字图像预处理的几个算法,特别是对大小归一化算法进行了深入研究,并给出了实验结果,实验结果表明,这些算法有效可行,为汉字图像后续处理打下了坚实基础。  相似文献   

11.
杨明 《微机发展》1998,8(3):60-62
本文提出一种图形、图像特征的抽取方法。通过图形、图像特征的拓扑变换,非常容易实现图形、图像的放大及缩小;同时,通过相应的图形或图像特征的比较,方便地进行图形、图像的查找。作为一个特例,本文的方法容易实现点阵汉字到矢量汉字的转化,因而具有较高的使用价值。  相似文献   

12.
印刷体数字快速识别算法在身份证编号数字识别中的应用   总被引:16,自引:1,他引:16  
探讨了一种印刷体数字快速识别的算法及该算法在身份证图像编号数字识别中的应用,该算法根据印刷体数字字符结构,抽取数字特征;然后根据这些特征构造编码器,进行编码识别。实验表明该算法速度快,精度高,抗干扰性强。  相似文献   

13.
多文种环境下汉字内码识别算法的研究   总被引:9,自引:4,他引:9  
汉字内码向ISO/IEC 10646过渡是实现计算机用文字编码统一的必然趋势,但目前在一段时间内仍将存在多种汉字内码并存的情况,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中实现汉字内码自动识别的问题,并提供了多种汉字内码识别算法,包括基于内码分布、标点符号特征、字频特征和语义特征的识别算法等。在此基础上,本文对不同的识别算法进行分析和评估。在对目标样本的测试中,以上算法的识别率最高可以达到99.9%以上。  相似文献   

14.
本文对多体字印刷汉字识别问题, 从文字输入、予处理、分割、特征抽取直至分类识别等几个方面进行了全面的讨论。并在此基础上, 建立了多体字印刷汉字识别系统。在该系统中, 充分考虑到多字体印刷汉字的特点, 使用了改进的笔划穿越特征, 汉字外部和内部面积等特征, 在克服噪声、字位移及异体同字的分类一致性等方面都取得了较好的效果。利用该识别软件和同一个字典, 可以识别混合在一篇文稿中的黑、宋两种字体的印别汉字。经多次试验, 平均识别率大于99%。  相似文献   

15.
基于DCT变换的虹膜识别算法   总被引:2,自引:0,他引:2  
吴叶清  冯桂 《微计算机信息》2007,23(25):270-271,208
虹膜识别是一种新的生物识别技术。本文主要研究虹膜图像预处理、特征提取和匹配几个部分的优化,在特征提取阶段,采用基于一维DCT变换的虹膜特征优选算法。其基本思想是:对预处理后的虹膜图像进行一维的DCT变换,在速度和准确率约束的条件下,对变换后得到的系数进行抽取作为特征矩阵,通过计算虹膜特征矩阵的相似度进行虹膜识别。实验结果表明;该算法速度比较快,准确率也比较高。  相似文献   

16.
手写体汉字识别中小波分形分解特征的研究   总被引:4,自引:4,他引:0  
研究了手写体汉字识别中的一种新的特征提取方法——小波分形分解特征。对手写汉字分别采用小波和分形的方法提取其结构特征和统计特征,并将提取的结构特征和统计特征组合后作为识别器的输入进行识别。实验结果表明,对训练样本可以达到98.71%识别率,对测试样本可以达到91.37%识别率。  相似文献   

17.
侯艳平  王正群  邹军  沈杰 《计算机应用》2007,27(6):1500-1501
针对手写体汉字识别过程中的特征抽取,提出了一种改进的抽取笔画平面的方法。首先,将手写汉字图像进行非线性规一化;然后,利用弹性笔画长度,根据汉字的横竖撇捺四种笔画分别抽取出四种笔画的平面;最后,将四个笔画平面分别均匀划分成S×S个小网格,在每个小格内计算其笔画交叉数目,便得到了一个4S2维的特征向量。实验利用基于最小距离的分类器对含有7600(19类)个汉字的测试集进行了分类,取得了较好的识别效果。  相似文献   

18.
利用笔划密度函数等特征的手写汉字识别的讨论   总被引:1,自引:0,他引:1  
为了对手写汉字的识别分类的方法进行探讨, 本文提出了一种分类处理能力强, 速度比较快, 算法上能尽量克服手写变形影响的手写汉字的识别分类方法。一般要求正介文字在候补文字上进行选择, 候补文字的数额要小。我们利用手写汉字笔划密度函数特征、粗网格特征、粗外围特征以及几个特征的拜用来对文字进行识别和分类, 用计算机进行模拟和验证。由实验可以知道利用各自的每一个特征, 分别有其相应的分类能力, 差不多到第五位或第七位分类能力可达到100%,如果将三个特征并用, 正如所予期的, 分类能力可以提高, 到第三位就可达到100%,这是因为各个特征分别从不同的方面吸收了手写的变形。  相似文献   

19.
在光照不均匀,存在阴影以及存在背景小杂色块干扰的图像中准确辨识出叶片图像,并将其显著特征抽取出来是叶片图像特征的研究重点。对实际叶片图像的处理,提出了先综合利用图像边界探测算法以及连接线、连通域抽取及变形算法确认叶边缘和叶脉图像,去除了光影,杂色轮廓的干扰,接着综合利用Hough变换、角点检测等算法来抽取树叶叶形,叶脉特征。实验中利用SVM(Support Vector Machine,支持向量机)算法对抽取特征进行分类测试,分类正确率超过了90%。  相似文献   

20.
基于经验模式分解的汉字字体识别方法   总被引:7,自引:0,他引:7  
提出了一种基于经验模式分解(empirical mode decomposition,简称EMD)的汉字字体识别方法.通过对大量汉字字体的研究比较,选取了能反映汉字字体基本特征的8种基本笔画.以这8种汉字笔画为模板,在汉字文档图像块中随机地抽取笔画信息,形成笔画特征序列.通过对笔画特征序列作EMD分解,提取每个笔画特征序列的高频能量,并结合汉字文档图像块的平均灰度,形成字体识别的一个9维特征.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号