首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
多字体多字号印刷汉字识别方法的研究   总被引:2,自引:0,他引:2  
本文对多体多字号印别汉字识别的方法进行了研究, 本文提出的方法是首先对不同字号印刷 汉字进行归一化处理, 再抽取汉字四周笔端数特征、改进粗外围特征、笔划穿插次数特征和投影变换特征, 然后对组合特征进行多级分类识别。实验在IBM一PC AT 微型机上进行, 结果表明, 实验系统在识别实际印别文本时识别率大于98%。  相似文献   

2.
国际图像系统(I^2S)上手写汉字识别研究   总被引:2,自引:0,他引:2  
提出一种用Rapid算法对手写汉字进行识别。它是在国际图像系统上实现的。文字图像经摄像机输入,预处理时采用锐化边界,使图像边界清晰,文字图像经正规化后,进行Rapid变换,抽取识别特征,特征抽取能比较好地吸收手写汉字变形和扭曲,提高识别率,计算机实验表明,本算法对手写汉字识别是比较有效的。  相似文献   

3.
本文提出了用改进的粗外围法和对汉字点阵在水平和垂直方向上投影进行WALSH变换以抽取汉字特征的方法。研究表明, 这种方法的处理速度快, 具有较强的抗干扰能力和较高的识别率。利用这种方法, 在由理光FX-120型传真机和IBM PC/XT微机组成的印刷汉字识别系统上, 对二级国标6763个二号印刷体汉字进行多次识别验证, 取得了很好的结果。  相似文献   

4.
本文在充分考察了手写汉字和中国大汉字集特点的基础上, 提出了一组用于手写印刷体汉字识利的分类特征, 它们是长笔划分布类型、各类笔划的数目、交叉点数目和折点数目。利用这组特征进行匹配就可直接识别出GB2312-80汉字集中的绝大部分汉字, 再通过一个基于知识的推理过程即可进一步识别出已被分成类组的少数剩余汉字, 这种将统计分类与基于知识的推理识别相结合的两级识别方法具有较高的效率。一个适应性较强的汉字笔划和特征点抽取方法也被设计, 它是SLSA方法的改进, 与机器学习功能相配合, 大大提高了特征抽取的正确率。我们根据上述思想建立了一个手写印刷体汉字识别实验系统, 并获得了较好的实验结果。  相似文献   

5.
为了更有效地提取手写汉字的特征,提高识别精度,本文提出了一种利用非线性归一化过程产生的坐标变换信息来提取手写汉字有效特征的方法。该方法通过非线性归一化获得各有效像素点在原汉字图像及规整后汉字图像中的坐标变换关系,在原图像上抽取各点特征,在归一化图像上进行网格的均匀划分和特征统计并形成用于分类的特征向量。该方法有效克服了以往先进行归一化预处理方法和动态网格方法的一些不足,兼顾了与传统结构特征提取方法的有效结合。针对HCL2000脱机手写汉字库大字符集样本的实验结果表明,该特征提取方法可有效提高识别精度和特征抽取速度。  相似文献   

6.
汉字信息处理领域中急待解决汉字自动阅读技术的开发。在实现结构分析法识别多字体印刷汉字时, 笔划抽取是关健所在。本文提出了从汉字点阵中直接抽取笔划特征的新算法, 省去了细化过程。与国外同类研究相比, 处理速度和正确率均有较大提高。对国标一级汉字的抽取结果是令人满意的。  相似文献   

7.
文章提出了一种新的基于细化的汉字笔画抽取方法,并把笔画统计特征用于汉字的识别。实验结果表明,该方法可有效地抽取出汉字的笔画并可成功地用于汉字的识别。  相似文献   

8.
本文提出了一种用计算机从手写汉字中抽提出三角号码基本特征的方法,并对抽出的汉字三只角上的特征进行编码,以达到识别分类的目的。从信息论的观点进行研究已经知道,汉字图像的四周对于文字识别的信息量是相对集中的,如果能正确地抽取这些特征,识别就成为可能。具体方法如下:(1)将手写汉字正规化,除去噪音,抽出方向线段,提取特征点的座标及接续关系矩阵。(2)在汉字图像上找出右上、左下、右下三个角上的基本特征点,根据特征点矩阵对每一个字生成三个笔形图像。(3)将笔形图像与三角号码笔形辞典比较,识别抽出三角号码笔形,并加以编码。用计算机模拟实验表明,本方法是有效的。  相似文献   

9.
脱机手写汉字机器识别方法的研究是人机接口自然化和智能化进程中的一个重要课题。目前,对于印刷体汉字的识别已取得了满意效果,出现了“读”书的机器,但对于脱机手写汉字的识别,还需要进一步探索和研究。本文就将探讨针对这一难题的各种研究方法。◆ 结构模式识别方法结构模式识别是早期脱机手写汉字识别研究的主要方法。集中在如何准确地抽取基元、轮廓、特征点等能够反映汉字结构信息的特征上。通常,抽取笔画需要进行细化处理,但是细化算法不仅速度慢,且易产生伪笔画段,单纯采用结构模式识别方法已不能满足脱机手写汉字识别系统…  相似文献   

10.
本文对多体字印刷汉字识别问题, 从文字输入、予处理、分割、特征抽取直至分类识别等几个方面进行了全面的讨论。并在此基础上, 建立了多体字印刷汉字识别系统。在该系统中, 充分考虑到多字体印刷汉字的特点, 使用了改进的笔划穿越特征, 汉字外部和内部面积等特征, 在克服噪声、字位移及异体同字的分类一致性等方面都取得了较好的效果。利用该识别软件和同一个字典, 可以识别混合在一篇文稿中的黑、宋两种字体的印别汉字。经多次试验, 平均识别率大于99%。  相似文献   

11.
本文应用非常适合军用多功能外设汉字识别的Melin变换方法进行特征抽取,并针对目前普遍采用的汉字识别中可分性准则函数的局限性,提出了一种适合军用多功能外设中印刷体汉字识别特点的可分性准则函数。使用此函数进行汉字特征选择能保证不同汉字的分类特征距离大且同一汉字的聚类性较好。实验证明,选用此可分性准则函数可以选择较少的汉字特征,并使识别率有较大地提高。  相似文献   

12.
基于N元汉字串模型的文本表示和实时分类的研究与实现   总被引:4,自引:0,他引:4  
该文提出了一种基于N元汉字串特征的文本向量空间表示模型,用这个表示模型实现了一个文本实时分类系统。对比使用词语做为特征的文本向量空间模型,这种新的模型由于使用快速的多关键词匹配技术,不使用分词等复杂计算,可以实现实时文本分类。由于N元汉字串的文本表示模型中的特征抽取中不需要使用词典分词,从而可以提取出一些非词的短语结构,在特殊的应用背景,如网络有害信息判别中,能自动提取某些更好的特征项。实验结果表明,使用简单的多关键词匹配和使用复杂的分词,对分类系统的效果影响是很小的。该文的研究表明N元汉字串特征和词特征的表示能力在分类问题上基本是相同的,但是N元汉字串特征的分类系统可以比分词系统的性能高出好几倍。该文还描述了使用这种模型的自动文本分类系统,包括分类系统的结构,特征提取,文本相似度计算公式,并给出了评估方法和实验结果。  相似文献   

13.
李玉凤  吴塞 《微计算机信息》2007,23(33):226-227,214
本研究以手写汉字的基本笔画为对象,确定反映书写特征的相对幅度和相对斜率为时域特征,并对时域特征进行Fourier变换,抽取变换实系数形成特征空间,实现笔迹鉴定。本研究采用10位书写者,各书写70个汉字,提取5种基本笔画,进行笔迹鉴定的实验,实验取得了满意的结果。  相似文献   

14.
本研究以手写汉字的基本笔划为对象,确定反映书写特征的笔压为时域特征,并对时域特征进行Fourier变换,抽取变换实系数形成特征空间,实现笔迹鉴定.本研究采用10位书写者,各书写70个汉字,提取4种基本笔划的笔压特征,进行笔迹鉴定的实验,取得了满意的实验结果.  相似文献   

15.
离线手写汉字的识别仍然是模式识别中的一个最困难的问题,而特征提取是解决这个问题的关键.本文提出一种基于多尺度小波分解的离线手写汉字的特征提取方法.通过表示为灰度图像的手写汉字的多尺度小波分解,能在不同尺度下抽取字符的特征.在较大的尺度下,抽取字符少量的结构特征,可用于在巨大的汉字候选类集合中进行字符的粗归类;在较小的尺度下,抽取字符的细节特征,可用于在较小的汉字候选类集合中进行字符的细归类(识别).这样一种从粗到细的策略,既减少了匹配的时间,又保持了识别的精度.  相似文献   

16.
手写印刷体汉字的笔段抽取及偏旁识别   总被引:1,自引:1,他引:0  
本文采用对汉字点阵图象进行方向变换的方法抽取汉字的笔段, 采用结构分析的方法识别分布于汉字四周的偏旁, 对国标一级汉字中的99类偏旁计一万余字进行了偏旁抽取试验, 当侯选偏旁数<5时, 累计正确侯补率>96%。  相似文献   

17.
结合距离分类器的神经网络手写体汉字识别   总被引:1,自引:1,他引:1  
手写体汉字识别技术中如何解决复杂的大类别识别问题,是汉字识别中的一个难点。该文介绍了基于笔划的手写体汉字特征抽取方法,提出了一种基于预分类的神经网络汉字识别方法,该方法用一个传统的距离分类器先对汉字进行预分类,神经网络根据预分类结果进行有选择的训练和识别,能有效解决神经网络大类别模式识别中的训练和分类问题,学习时间很短,识别效果较理想。  相似文献   

18.
自动识别手写印刷体汉字系统中的部件分离问题   总被引:1,自引:0,他引:1  
在用抽取笔划有序列法自动识别手写印刷体汉字的系统中,分离出汉字“部件”是很必要的,这里所说的“部件”是指汉字中一些能分离的笔划组合,主要是汉字的偏旁部首(或字根),由计算机自动识别汉字的需要而定。 在以笔划为基元,用句法结构法识别汉字的系统中分离部件是为了恢复部件的有序性,本文提出了一种适合于分离手写印刷体汉字部件的方法,给出这种分离部件方法的框图和在PDP-11/23计算机上进行模拟试验所得到的结果。  相似文献   

19.
侯艳平  王正群  邹军  沈杰 《计算机应用》2007,27(6):1500-1501
针对手写体汉字识别过程中的特征抽取,提出了一种改进的抽取笔画平面的方法。首先,将手写汉字图像进行非线性规一化;然后,利用弹性笔画长度,根据汉字的横竖撇捺四种笔画分别抽取出四种笔画的平面;最后,将四个笔画平面分别均匀划分成S×S个小网格,在每个小格内计算其笔画交叉数目,便得到了一个4S2维的特征向量。实验利用基于最小距离的分类器对含有7600(19类)个汉字的测试集进行了分类,取得了较好的识别效果。  相似文献   

20.
针对目前汉字鉴别效率低、容易造成几何性质丢失的现状,提出了一种利用小渡分解与重构的技术对汉字签字进行特征抽取和压缩的方法.首先对整个签字的每一笔划进行通过多分辨率分析的小波分解公式进行复信号小波变换,这样可以得到每一个笔划的小波分解值,然后利用一组新的小波重构公式,对各个笔划的特征进行有机的整合,最后使用K-L变换对签字特征值进行了特征维数的压缩,从而大大提高了汉字鉴别鉴别的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号