共查询到20条相似文献,搜索用时 296 毫秒
1.
为了提高手写汉字的识别率和降低训练时间,提出了一种基于多通道PCA(Principal component analysis)模型的手写汉字识别方法.该方法首先根据汉字的结构特点,将手写汉字分解为“一”、“I”、“J”、“\”4种方向子模式,然后分别对每个子模式进行主分量分析,最后通过建立起每类汉字的多通道PCA模型来进行手写汉字的识别.该方法既兼顾了主分量对手写汉字的描述能力,又有效地降低了建立模型的训练时间.针对1034类别的手写汉字样本的实验结果表明,该汉字识别方法的识别率较欧氏距离分类器提高了4.4个百分点,而其训练时间则明显低于直接进行PCA重建的识别方法,由此可见,该方法是有效的。 相似文献
2.
本文介绍了一种利用线段特征矩阵进行匹配的手写汉字识别方法。对输入文字图像测定其笔划宽度,抽取四个方向子图像。然后,利用文字图像重心分割图像成若干区域,按分割的区域,求各子图像区域的线段特征矩阵,与样本字库比较识别,进行手写汉字识别分类。实验表明本方法是有效的。 相似文献
3.
胡家忠 《计算机研究与发展》1985,(5)
一、前言在进行计算机自动识别手写汉字方法研究的时候,其方法的有效性受到输入的手写汉字数据的很大影响.在进行各种识别方法的有效性比较的时候,如果不使用共同的手写汉字数据,那将是毫无意义的.笔者利用在日本进修的机会,把从国内收集的20人手写汉字4000字种,做成中国手写汉字数据库8万字,现予公开,愿与国内同行一起进行计算机自动识别手写汉字的方法研究. 相似文献
4.
本文对印刷体和手写印刷体汉字的组成结构进行了较为详细的研究,以人脑识别机制为出发点,提出一种既适用于印刷体汉字,亦适用于手写印刷体汉字的树状结构识别方法。初步的实验结果表明:此种方法为汉字的识别提供了一个可取的解决途径。 相似文献
5.
基于可伸缩矢量图SVG的在线手写汉字是以SVG图像作为汉字图像格式、以SVG的path对象作为笔画的基本存储单元来对汉字进行显示和存储的,笔画的轮廓是以手写过程中记录的坐标值作为特征数值加以确定的。基于此种SVG手写汉字存储和表示形式,本文提出一种基于图论的在线连续手写汉字多步分割方法。该方法根据汉字笔画间的坐标位置关系对手写笔画序列构建无向图模型,并利用图的广度优先搜索将原笔画序列分割为互不连通的笔画部件,使偏旁部首分离较远、非粘连汉字得到正确分割;然后利用改进的tarjan算法对部件中的粘连字符进行分割,最后基于笔画部件间距,利用二分类迭代算法对间距进行分类,找出全局最佳分割位置,对过分割的部件进行重组合并。实验结果表明,该方法对于在线手写汉字的分割是有效可行的。 相似文献
6.
脱机手写汉字机器识别方法的研究是人机接口自然化和智能化进程中的一个重要课题。目前,对于印刷体汉字的识别已取得了满意效果,出现了“读”书的机器,但对于脱机手写汉字的识别,还需要进一步探索和研究。本文就将探讨针对这一难题的各种研究方法。◆ 结构模式识别方法结构模式识别是早期脱机手写汉字识别研究的主要方法。集中在如何准确地抽取基元、轮廓、特征点等能够反映汉字结构信息的特征上。通常,抽取笔画需要进行细化处理,但是细化算法不仅速度慢,且易产生伪笔画段,单纯采用结构模式识别方法已不能满足脱机手写汉字识别系统… 相似文献
7.
本文在充分考察了手写汉字和中国大汉字集特点的基础上, 提出了一组用于手写印刷体汉字识利的分类特征, 它们是长笔划分布类型、各类笔划的数目、交叉点数目和折点数目。利用这组特征进行匹配就可直接识别出GB2312-80汉字集中的绝大部分汉字, 再通过一个基于知识的推理过程即可进一步识别出已被分成类组的少数剩余汉字, 这种将统计分类与基于知识的推理识别相结合的两级识别方法具有较高的效率。一个适应性较强的汉字笔划和特征点抽取方法也被设计, 它是SLSA方法的改进, 与机器学习功能相配合, 大大提高了特征抽取的正确率。我们根据上述思想建立了一个手写印刷体汉字识别实验系统, 并获得了较好的实验结果。 相似文献
8.
在脱机手写汉字识别系统中,采用汉字图像的整形变换,可以提高手写汉字的识别率,特别是对于从网络中提取识别特征的识别方法,其识别率的提高是显著的,本文在研究现有汉字图像整形变换的基础上,提出了对汉字外缘流畅笔划的修整算法,提出了有引导的整形变换的基础上,提出了对汉字外缘流畅笔划的修整算法,提出了有引导的整形变换算法;即在整形变换之前,先对汉字图像的畸变形态及畸变程度进行预测及预处理,以便引导整形变换的 相似文献
9.
10.
序列相似性描述是序列分类的关键,根据序列产生的背景和机理,融合利用具有不同物理意义的特征子模式集合进行序列相似性描述可以改进序列分类的效果.对于在多个特征子模式集合的核变换空间上进行的相似性描述,可利用半定规划方法,在使得分类边界距离最大的意义下对核矩阵相似性描述结果进行优化,从而建立起一种能够融合利用多种意义特征子模式集合的序列分类方法.该方法用于手写签名序列的识别实验,在基准签名数据集上取得了较好的实验结果. 相似文献
11.
本文提出了实现微机手写汉字联机识别系统的完整方案,并在国产LS-83型微机上实现,取得了接近实用的效果.文中提出的笔划坐标预处理、笔划特征抽取、笔划序列匹配等算法对于指导设计和编制各个环节的程序模块并最终构成具有多种实用功能的手写汉字联机识别系统是有效的. 相似文献
12.
介绍了一个实用的手写成绩单识别系统,它既可以识别手写的数字成绩单,也可以识别手写的汉字成绩单。对脱机手写汉字的识别,提出了一种基于隐马尔可夫模型的识别方法。 相似文献
13.
为将统计决策方法和句法方法有机结合起来, 本文提出了以部件为基元的基于假设检验的手写印, 体汉字识别方法由统计方法得到候补字集, 利用部件特征的先验知识抽取待识字可能包含的部件并对假设进行验证, 从而不断缩小候补字集, 并逐步完善汉字的结构描述。初步实验表明其分类效果明显。 相似文献
14.
小类别数手写汉字识别 总被引:5,自引:0,他引:5
针对小类别数手写汉字,在骨架图形的基础上,把手写汉字看作孤枝、孤环和部件的集合,并定义三者之间的方位关系,从而建立手写汉字的数学模型.基于迷种模型,进一步探讨一种新的识别方法以及新方法所使用的知识库的构造方法.实验表明,所提出的模型及识别方法对于小类数的手写汉字识别行之有效。 相似文献
15.
手写汉字中笔划,部件及其位置关系均产生较大变化,这种变化是引起手写汉字特征不稳定的主要因素。为了减小上述不利影响,使手写汉字特征的描述趋于稳定,本文给出了一种基于汉字基元之间的模糊关系识别手写汉字的方法。 相似文献
16.
为了有效地进行手写体汉字的分割与识别,提出了一种基于假设-证实的离线手写体汉字分割与识别方法,即首先用一个假设分割边界的集合将手写汉字串图象分割成一个顺序排列的段序列;然后对顺序上连续的段被合并后,进行不相似度评价,其正确的分割由不相似度评价结果来证实.具体做法是,首先根据像素及笔划的分布特征,将汉字串分割成一个段序列,然后对分割与识别的决策由最优的相邻段合并后的不相似度评价结果得到.实验证明,该方法对于粘连、交叠、断裂和在书写方向上呈松散结构的汉字的分割与识别是非常有效的. 相似文献
17.
本文介绍了一个用特征向量元素模糊分类的手写汉字识别系统,系统在预处理时采用字心中心法,一级分类用笔道密度函数特征的向量元素模糊方法分类,详细识别用外廓方向贡献度特征,系统实验表明本识别方法是有效的。 相似文献
18.
以往的手写汉字识别方法,无论应用何种特征提取方法,在生成标准模板时,一般都采用样本特征的算术平均值。文章提出了一种使用样本特征的分位数组合生成标准模板的方法,通过其在手写汉字识别中的应用表明,该方法比基于均值的标准模板有更好的鲁棒性,且在不增加任何计算量和算法复杂度的前提下,使系统的识别性能有所提高;同时该算法还有很好的推广性能,可以应用到各种特征提取算法中。 相似文献
19.
本文面向手写字符序列输入信号连续识别研究,分析了汉字及联机手写文本的特点,提出并构建了手写汉字部件集。基于该部件集,完成了GB2312-80的6,763个汉字的部件拆分编码和部件集的测试。统计编码数据发现,汉字依手写部件数的分布规律呈对数正态分布。本文从统计学和字符识别技术的角度对手写部件的构字能力作了分析和讨论,部件集的设计方案在部件选择和汉字拆分上均满足设计要求。实验表明,基于手写部件构造的部件识别器对手写汉字和连续汉字的部件识别率分别达到70.21%和58.49%。 相似文献
20.
本文介绍手写印刷体汉字识别方法2-D EAG。主要的工作为:提出了二维扩展属性文法模式识别方法,可实现自底向上归约和自顶向下推导双向信息传递和控制;提出了一种直接利用二维信息进行识别的方式,可避免特征线性化造成的信息丢失;提出了多义文法、共生文法和结构推断三种在文法之间建立联系,利用结构类比区分极相似字的 识别算法;提出了多冗余归约机制,双边缘弹性跟踪笔段抽取算法,多冗余有引导部件抽取算法。用2-D EAG方法对100字种实际手写汉字进行了识别实验,在识别大畸变汉字(包括部分连笔字)方面得到了很好的结果。 相似文献