首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
小类别数手写汉字识别   总被引:5,自引:0,他引:5  
针对小类别数手写汉字,在骨架图形的基础上,把手写汉字看作孤枝、孤环和部件的集合,并定义三者之间的方位关系,从而建立手写汉字的数学模型.基于迷种模型,进一步探讨一种新的识别方法以及新方法所使用的知识库的构造方法.实验表明,所提出的模型及识别方法对于小类数的手写汉字识别行之有效。  相似文献   

3.
4.
自然手写汉字FS识别法   总被引:3,自引:0,他引:3  
提出联机识别自然手写汉字的FS识别法。在剖析五笔字根结构和编码原则基础上,对五笔字根作适应性改造,将键盘输入技术与联机识别技术有机融合的一种识别体系。在多库识别体系中首次采用层间分级技术。分析和实验表明:充分考虑了自然手写汉字书写习惯和结构特征,系统有较高稳定性。  相似文献   

5.
6.
在汉字识别预处理的基础上,本文提出了一种基于概率神经网络的高级分类系统。分类器的训练从使用四种字体的失真模型化字符开始,将失真字符在计算中得到的特征集进行统计测试。在基础上,为得到最邻近分类器,将特征向量以合适的识别空间,并在此空间中对概率神经网络进行训练。分类方面,对传统方法提出了一咎改进、并应用概率神经网络结构例提到显著提高。最后,将这种方法与采用识别分析的方法及Geva、Sitte的表达决策  相似文献   

7.
崔国伟 《自动化学报》1993,19(1):126-128
本文阐述了识别过程中的模糊表示,并介绍了以隶属度为启发函数的搜索过程.试验表明此方法较好地解决了汉字识别速度低的问题.  相似文献   

8.
本文基于汉字财务发票的特征,论述了设计财务发票识别系统的方法。在垂直分割中,采用了线性整块移动的方式。一种新的算法采用检测和校正后续的倾斜图像。通过半自动装置的研究方式来区分不同的类别(建立局部区域、线段过滤等),探讨几种形式特征的表示以及构建发票类型特征库。发票类型的识别依据发票的特征,实际的发票形式可与预先印制的空白样张相对照,它需要解决字符和线段类型的粘连问题以及字符的分割和识别问题。基于汉字财务发票图像的特征,本文提出了以识别财务发票的大写数字(汉字)和阿拉伯数字字符的结果为依据的互校装置,以提高识别率。最后为实验结果和结论.  相似文献   

9.
交替运用两种信源模型的汉字识别法张彩录,郭宝兰,张宇桐,韩勇,张宇铮(河北大学汉字信息处理研究室保定071002)关键词汉字识别,相关处理,信源模型1对现有汉字OCR的分析如果用C.E.Slhannon信息论的观点,对当前各种汉字OCR的识别方法进行...  相似文献   

10.
基于汉字原型的手写汉字识别   总被引:7,自引:1,他引:6  
本文以现存三种汉字的计算机表示和两种传统的汉字结构分析方法进行评述,应用拓扑和几何的基本原理,分析了汉字结构及其制约关系,确定了四类组成汉字的基本关系,在此基础上实现了汉字原型,最后给出了汉字原型应用手写汉字识别的实例。  相似文献   

11.
一种用于手写体汉字识别的候选字加权多分类器集成方法   总被引:3,自引:0,他引:3  
提出了一种基于候选字加权的多分类器集成方法,并将其应用于手写体汉字的识别研究中。利用4种不同的特征提取方法构造了4个独立的分类器;利用不同分类器各候选字加权处理得到的置信度函数来构造集成函数,从而将4个独立的分类器集成为一个多分类器系统。通过实验分析了几种分类器集成的方法,验证了具有一定互补性的多分类器集成对手写体汉字的识别率有较大的提高。实验结果表明、所提出的方法是行之有效的。  相似文献   

12.
一种手写体汉字识别的神经网络多分类器集成方案   总被引:1,自引:1,他引:1  
万红梅 《计算机工程》2004,30(16):151-152
提出了一种基于单字单网的手写体汉字识别纯神经网络的多分类器集成方案,并通过实验证明用该方案实现的神经网络集成系统性能均比任一个神经网络单分类器都好,对1 000种不同的手写体汉字的1 000×10个字进行测试,集成后的识别率最高达到95.22%,比单分类器的识别率高出5.0%-8.7%。  相似文献   

13.
结合开发实际,介绍了笔顺输入法中汉字搜索算法和字码表及词码表的生成过程。从排序和查找两方面考虑,首先将汉字字库生成汉字字码表,然后将字码表根据首笔进行分区,当用户输入首笔后由汉字字码表索引文件决定在哪个分区范围内进行查找。实例证明本方法满足查找速度要求。  相似文献   

14.
中文搜索引擎的自动分词算法   总被引:2,自引:0,他引:2  
提出了基于关键词搜索的两种自动分词算法。均以双词及三词作为搜索的最小单位 (或基本单位 )。一种以栈实现 ,一种不借助栈且动态匹配实现。通过此两种算法均可进行发布网站、网页前网名入数据库的关键词标识提取及实现匹配后有效性的确认 ,以提高中文搜索引擎的搜索准确率及获得由网名入数据库前后同步性决定的快速响应  相似文献   

15.
多知识综合判决的字符切分算法   总被引:3,自引:0,他引:3  
高性能的印刷体文字识别系统中,在单字识别技术比较成熟的条件下,字符切分成为比较关键的环节。字符切分可以看作是对字符边界正确切分位置的一个决策过程,该决策需要同时考虑字符局部的识别情况和全局的上下文关系。该文通过对中日韩三国文字字符切分的研究,提出一种基于多知识综合判决的字符切分算法。该算法成功应用于AsiaOCR项目,对于东方文字中常见的混排英文问题也能很好处理。实验结果表明,和以前的算法相比,新算法在中日韩三国文字识别系统中的切分错误率平均下降50%。  相似文献   

16.
多字体多字号印刷汉字识别方法的研究   总被引:2,自引:0,他引:2  
本文对多体多字号印别汉字识别的方法进行了研究, 本文提出的方法是首先对不同字号印刷 汉字进行归一化处理, 再抽取汉字四周笔端数特征、改进粗外围特征、笔划穿插次数特征和投影变换特征, 然后对组合特征进行多级分类识别。实验在IBM一PC AT 微型机上进行, 结果表明, 实验系统在识别实际印别文本时识别率大于98%。  相似文献   

17.
在采用最近邻法进行模式识别时,减小搜索的计算量是一个重要的问题,对于在线识别尤为重要,解决的途径之一是采用快速搜索近邻法。快速近邻法在将样本集分级后,若采用样本均值作为子集圆心,则求取所得的样本子集半径将大于其实际半径。该文介绍了一种高维特征情况下的样本子集圆心的求取方法,根据该方法求得的样本子集圆心与样本均值存在一定的距离,且求得的样本子集半径较小。将这两个圆心以及子集中特征累加值最大和最小的样本作为定位点,应用于基于三角不等式的搜索算法的样本排除规则,大大减少了搜索的计算量。在手写汉字识别实验中,基于该方法的快速近邻法识别速度更快。  相似文献   

18.
为了提高手写汉字的识别率和降低训练时间,提出了一种基于多通道PCA(Principal component analysis)模型的手写汉字识别方法.该方法首先根据汉字的结构特点,将手写汉字分解为“一”、“I”、“J”、“\”4种方向子模式,然后分别对每个子模式进行主分量分析,最后通过建立起每类汉字的多通道PCA模型来进行手写汉字的识别.该方法既兼顾了主分量对手写汉字的描述能力,又有效地降低了建立模型的训练时间.针对1034类别的手写汉字样本的实验结果表明,该汉字识别方法的识别率较欧氏距离分类器提高了4.4个百分点,而其训练时间则明显低于直接进行PCA重建的识别方法,由此可见,该方法是有效的。  相似文献   

19.
863手写汉字识别测试平台   总被引:1,自引:2,他引:1  
本文详细介绍了用于1998年4月在北京举行的全国863评测手写汉字识别测试平台的情况,如测试大纲、测试样本的选择与分类、测试结果等,并提出了作者的一些看法和建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号