共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
小类别数手写汉字识别 总被引:5,自引:0,他引:5
针对小类别数手写汉字,在骨架图形的基础上,把手写汉字看作孤枝、孤环和部件的集合,并定义三者之间的方位关系,从而建立手写汉字的数学模型.基于迷种模型,进一步探讨一种新的识别方法以及新方法所使用的知识库的构造方法.实验表明,所提出的模型及识别方法对于小类数的手写汉字识别行之有效。 相似文献
3.
4.
5.
6.
在汉字识别预处理的基础上,本文提出了一种基于概率神经网络的高级分类系统。分类器的训练从使用四种字体的失真模型化字符开始,将失真字符在计算中得到的特征集进行统计测试。在基础上,为得到最邻近分类器,将特征向量以合适的识别空间,并在此空间中对概率神经网络进行训练。分类方面,对传统方法提出了一咎改进、并应用概率神经网络结构例提到显著提高。最后,将这种方法与采用识别分析的方法及Geva、Sitte的表达决策 相似文献
7.
本文阐述了识别过程中的模糊表示,并介绍了以隶属度为启发函数的搜索过程.试验表明此方法较好地解决了汉字识别速度低的问题. 相似文献
8.
本文基于汉字财务发票的特征,论述了设计财务发票识别系统的方法。在垂直分割中,采用了线性整块移动的方式。一种新的算法采用检测和校正后续的倾斜图像。通过半自动装置的研究方式来区分不同的类别(建立局部区域、线段过滤等),探讨几种形式特征的表示以及构建发票类型特征库。发票类型的识别依据发票的特征,实际的发票形式可与预先印制的空白样张相对照,它需要解决字符和线段类型的粘连问题以及字符的分割和识别问题。基于汉字财务发票图像的特征,本文提出了以识别财务发票的大写数字(汉字)和阿拉伯数字字符的结果为依据的互校装置,以提高识别率。最后为实验结果和结论. 相似文献
9.
10.
基于汉字原型的手写汉字识别 总被引:7,自引:1,他引:6
姜珊 《计算机研究与发展》1996,33(8):634-640
本文以现存三种汉字的计算机表示和两种传统的汉字结构分析方法进行评述,应用拓扑和几何的基本原理,分析了汉字结构及其制约关系,确定了四类组成汉字的基本关系,在此基础上实现了汉字原型,最后给出了汉字原型应用手写汉字识别的实例。 相似文献
11.
12.
一种手写体汉字识别的神经网络多分类器集成方案 总被引:1,自引:1,他引:1
提出了一种基于单字单网的手写体汉字识别纯神经网络的多分类器集成方案,并通过实验证明用该方案实现的神经网络集成系统性能均比任一个神经网络单分类器都好,对1 000种不同的手写体汉字的1 000×10个字进行测试,集成后的识别率最高达到95.22%,比单分类器的识别率高出5.0%-8.7%。 相似文献
13.
14.
中文搜索引擎的自动分词算法 总被引:2,自引:0,他引:2
提出了基于关键词搜索的两种自动分词算法。均以双词及三词作为搜索的最小单位 (或基本单位 )。一种以栈实现 ,一种不借助栈且动态匹配实现。通过此两种算法均可进行发布网站、网页前网名入数据库的关键词标识提取及实现匹配后有效性的确认 ,以提高中文搜索引擎的搜索准确率及获得由网名入数据库前后同步性决定的快速响应 相似文献
15.
多知识综合判决的字符切分算法 总被引:3,自引:0,他引:3
高性能的印刷体文字识别系统中,在单字识别技术比较成熟的条件下,字符切分成为比较关键的环节。字符切分可以看作是对字符边界正确切分位置的一个决策过程,该决策需要同时考虑字符局部的识别情况和全局的上下文关系。该文通过对中日韩三国文字字符切分的研究,提出一种基于多知识综合判决的字符切分算法。该算法成功应用于AsiaOCR项目,对于东方文字中常见的混排英文问题也能很好处理。实验结果表明,和以前的算法相比,新算法在中日韩三国文字识别系统中的切分错误率平均下降50%。 相似文献
16.
多字体多字号印刷汉字识别方法的研究 总被引:2,自引:0,他引:2
本文对多体多字号印别汉字识别的方法进行了研究, 本文提出的方法是首先对不同字号印刷 汉字进行归一化处理, 再抽取汉字四周笔端数特征、改进粗外围特征、笔划穿插次数特征和投影变换特征, 然后对组合特征进行多级分类识别。实验在IBM一PC AT 微型机上进行, 结果表明, 实验系统在识别实际印别文本时识别率大于98%。 相似文献
17.
在采用最近邻法进行模式识别时,减小搜索的计算量是一个重要的问题,对于在线识别尤为重要,解决的途径之一是采用快速搜索近邻法。快速近邻法在将样本集分级后,若采用样本均值作为子集圆心,则求取所得的样本子集半径将大于其实际半径。该文介绍了一种高维特征情况下的样本子集圆心的求取方法,根据该方法求得的样本子集圆心与样本均值存在一定的距离,且求得的样本子集半径较小。将这两个圆心以及子集中特征累加值最大和最小的样本作为定位点,应用于基于三角不等式的搜索算法的样本排除规则,大大减少了搜索的计算量。在手写汉字识别实验中,基于该方法的快速近邻法识别速度更快。 相似文献
18.
为了提高手写汉字的识别率和降低训练时间,提出了一种基于多通道PCA(Principal component analysis)模型的手写汉字识别方法.该方法首先根据汉字的结构特点,将手写汉字分解为“一”、“I”、“J”、“\”4种方向子模式,然后分别对每个子模式进行主分量分析,最后通过建立起每类汉字的多通道PCA模型来进行手写汉字的识别.该方法既兼顾了主分量对手写汉字的描述能力,又有效地降低了建立模型的训练时间.针对1034类别的手写汉字样本的实验结果表明,该汉字识别方法的识别率较欧氏距离分类器提高了4.4个百分点,而其训练时间则明显低于直接进行PCA重建的识别方法,由此可见,该方法是有效的。 相似文献