共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
本文提出了一种印刷体汉字计算机自动识别的方案.从EIT-PS简易图文扫描器输入一页印刷体汉字,经前处理程序切割出每一个字并将其正规化;利用网格单元特征进出该输入文字的候补文字;再计算输入文字与候补文字的复合类似度,复合类似度最高的候补文字被认为是输入文字.本识别方法具有抗噪声干扰,抗连笔、断笔等变形的能力.对任选的一万字进行识别试验的结果,取得了积累识别率98.6%的良好成绩. 相似文献
3.
本文为手写印刷体汉字识别提供了一种新的解决方法。在研究过程中, 从汉字图象的输入到识别结果的获取, 建立了一整套基本完整的识别实验系统。系统选择四边形状特征作为粗分类的基本特征, 提出汉字最稳定的结构是笔划段之间相对位置关系的思想。在粗分类时引入集合运算, 提高了粗分类的正确率和分类能力, 在细分时用快速合并笔划段的方法获取汉字笔划段作为细分特征。最后对于关系结构图的匹配提出了一种新的匹配方法一相关属性关系图启发式匹配,这种方法利用了汉字样本知识, 建立具有相关属性的关系图, 在其指导下, 完成非精确的结构匹配, 该系统在386微机上用汇编语言实现, 对1千个手写常用汉字识别率达百90%以上, 速度是每字2秒。 相似文献
4.
本文介绍了一种利用线段特征矩阵进行匹配的手写汉字识别方法。对输入文字图像测定其笔划宽度,抽取四个方向子图像。然后,利用文字图像重心分割图像成若干区域,按分割的区域,求各子图像区域的线段特征矩阵,与样本字库比较识别,进行手写汉字识别分类。实验表明本方法是有效的。 相似文献
5.
机器汉字识别中的特征选定以后,匹配方式也就随之确定了。文献[1]中曾提出了一种称为结构格式的粗特征,它具有特殊的表示形式。针对这一特点,从整体角度出发,本文提出了一种可不断学习的识别器设计方法。理论分析表明所设计的识别器能够根据需要以任意的正确率同时识别多种印刷体汉字和限制性手写汉字;对753字种915样本的限制性手写汉字图象数据进行试验的结果,不仅表明结构格式粗特征分类能力很强,而且在一定程度上证明了所提识别器设计方法是实际可行的,可望使汉字识别问题得到较好的解决。 相似文献
6.
本文提出了一种用计算机从手写汉字中抽提出三角号码基本特征的方法,并对抽出的汉字三只角上的特征进行编码,以达到识别分类的目的。从信息论的观点进行研究已经知道,汉字图像的四周对于文字识别的信息量是相对集中的,如果能正确地抽取这些特征,识别就成为可能。具体方法如下:(1)将手写汉字正规化,除去噪音,抽出方向线段,提取特征点的座标及接续关系矩阵。(2)在汉字图像上找出右上、左下、右下三个角上的基本特征点,根据特征点矩阵对每一个字生成三个笔形图像。(3)将笔形图像与三角号码笔形辞典比较,识别抽出三角号码笔形,并加以编码。用计算机模拟实验表明,本方法是有效的。 相似文献
7.
手写体汉字变形规律的机器发现 总被引:1,自引:0,他引:1
手写汉字的不规整是手写汉字的一个主要特点,也是影响识别率的一个重要因素。利用机器发现的方法,从大量手写体汉字样本中寻求手写汉字变形的一般规律,并将变形规律应用手汉字识别的过程之中,可以大大提高分类的准确性,并可以压缩样本字典的容量,提高匹配速度。 相似文献
8.
在汉字书写场景中,我们可以通过实时捕捉手写者的手写轨迹数据,并可以通过笔画类型、空间关系等构字要素逻辑地位等评价策略,实现汉字书写质量智能测评,以达到指导学习书写的目的。其中笔画分类是手写字体评估中的重要任务。然而,现有笔画级标注的汉字数据集很少,并缺少轻量化并可以应用于嵌入式设备的笔画分类方案,难以工程化落地。在不同设备上采集用户的手写笔画数据(如会议平板、电子白板、学习机等),并使用特征工程,采用一维深度可分离卷积构建轻量化的快速汉字笔画分类模型,并把模型进行量化部署到嵌入式设备中。模型量化后的tflite格式文件大小仅为11kb,而在数据集上达到了97%的精确度。把量化后的模型部署到嵌入式设备中并进行了商业化上线。 相似文献
9.
国际图像系统(I^2S)上手写汉字识别研究 总被引:2,自引:0,他引:2
提出一种用Rapid算法对手写汉字进行识别。它是在国际图像系统上实现的。文字图像经摄像机输入,预处理时采用锐化边界,使图像边界清晰,文字图像经正规化后,进行Rapid变换,抽取识别特征,特征抽取能比较好地吸收手写汉字变形和扭曲,提高识别率,计算机实验表明,本算法对手写汉字识别是比较有效的。 相似文献
10.
11.
离线手写汉字的识别仍然是模式识别中的一个最困难的问题,而特征提取是解决这个问题的关键.本文提出一种基于多尺度小波分解的离线手写汉字的特征提取方法.通过表示为灰度图像的手写汉字的多尺度小波分解,能在不同尺度下抽取字符的特征.在较大的尺度下,抽取字符少量的结构特征,可用于在巨大的汉字候选类集合中进行字符的粗归类;在较小的尺度下,抽取字符的细节特征,可用于在较小的汉字候选类集合中进行字符的细归类(识别).这样一种从粗到细的策略,既减少了匹配的时间,又保持了识别的精度. 相似文献
12.
励平 《图象识别与自动化》1995,(2):13-26
本文介绍一种以结构特征为基础的粗分类装置,对联机手写体汉字进行分类。粗分类的主要目的是,分别把联机汉字引入六种结构特征类型中的一种,并在可以分割的情况下将其分割成各个部分。本文提出的粗分类装置可用于对下列三种不同书写风格的汉字类目进行分类:正楷体手写字符、部分相连的字符和草写体字符。本文提出两种粗分类的结构分类法;一种是线段次序分类法,另一种是法。 相似文献
13.
多分类器集成是手写体汉字识别领域的新方向。本文提出的多分类器集成方法通过改进的欧氏距离分类器将待识别汉字分类到某个粗分结果集中,然后根据粗分结果集选择1-N(one-against-rest)的SVM分类器对待识别汉字进行细分,最后用贝叶斯集成两级分类器。实验对国标一级汉字中的1034个手写汉字进行识别,证明了方案的有效性。 相似文献
14.
为将统计决策方法和句法方法有机结合起来, 本文提出了以部件为基元的基于假设检验的手写印, 体汉字识别方法由统计方法得到候补字集, 利用部件特征的先验知识抽取待识字可能包含的部件并对假设进行验证, 从而不断缩小候补字集, 并逐步完善汉字的结构描述。初步实验表明其分类效果明显。 相似文献
15.
16.
一个基于神经网络的手写文字分类/识别模型 总被引:1,自引:0,他引:1
本文设计了一个基于神经网络的手写文字(汉字、数字、字母等)分类/识别模型,给出了该模型的预处理方法、神经网络结构、工作算法和学习算法, 并进行了手写数字识别和手写汉字分类实验。实验结果表明我们所设计的网络结构是较合理的, 所采用的预处理方法是有效的, 能够取得较高的分类/识别效率。 相似文献
17.
以HCL2000手写汉字库为基础,构建了一个实验系统,对一级汉字库3 755个汉字,使用不同的汉字特征和不同的分类距离,进行了一系列比较实验,探讨了大字符集脱机手写体汉字识别的粗分类问题,得到了一些有用的结论. 相似文献
18.
本文提出了一种在隐含马尔可夫模型(HMM)框架下建立的识别脱机手写汉字的方法,介绍了以HMM对脱机手写汉字进行建模、识别的整个过程,并给出了实验结果对国标一级3755个汉字的识别率,在两种测试集上分别达到96.4%和91.5%. 相似文献
19.
本文在充分考察了手写汉字和中国大汉字集特点的基础上, 提出了一组用于手写印刷体汉字识利的分类特征, 它们是长笔划分布类型、各类笔划的数目、交叉点数目和折点数目。利用这组特征进行匹配就可直接识别出GB2312-80汉字集中的绝大部分汉字, 再通过一个基于知识的推理过程即可进一步识别出已被分成类组的少数剩余汉字, 这种将统计分类与基于知识的推理识别相结合的两级识别方法具有较高的效率。一个适应性较强的汉字笔划和特征点抽取方法也被设计, 它是SLSA方法的改进, 与机器学习功能相配合, 大大提高了特征抽取的正确率。我们根据上述思想建立了一个手写印刷体汉字识别实验系统, 并获得了较好的实验结果。 相似文献
20.
基于主曲线的脱机手写数字结构特征分析及选取 总被引:8,自引:0,他引:8
要提高脱机手写数字识别的识别率,关键是特征的提取与选择.主曲线是主成分分析的非线性推广,它是通过数据分布“中间”并满足“自相合”的光滑曲线.它较好地反映了数据分布的结构特征.在数字特征选取中,首先将主曲线用于训练数据的特征提取;其次在详细分析数字主曲线的结构特点的基础上,选择出用于数字识别的粗分类、细分类特征;最后在对手写数字进行识别时,先进行粗分类再进行细分类.所提方法在Concordia大学的CENPARMI手写体数字数据库上的实验结果表明:利用这些特征能有效区分相似字符,提高了手写数字的识别率,为脱机手写数字识别的研究提供了一条新途径。 相似文献