首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
实验性6763个印刷体汉字识别系统   总被引:1,自引:1,他引:0  
本文提出一种识别国标两级(6763个)印刷体汉字的新方法。根据汉字的结构,定义了一组结构特征(边框特征、局部特征和笔划端结点),作为预分类和匹配、识别的依据。 建立了一个识别6763个汉字的实验系统。实验结果表明,系统具有较高的抗干扰能力,正确识别率优于98%。  相似文献   

2.
该文提出了整体分析法和个体分析法的概念,并在分析它们各自适用范围的基础上,指出个体分析法更适合于解决印刷体汉字字体识别。在此基础上,提出一种基于特征点的个体分析法来解决汉字字体识别问题,与以往方法相比,该方法具有3个优点:识别可信度可控;处理速度快;适用于多语混排情况。实验结果表明,该方法有效解决了印刷体汉字字体识别问题,其性能大大优于以往方法。  相似文献   

3.
印刷体汉字识别OCR(“光学字符识别”的英文缩写)利用图像扫描方式将汉字信息高速输入计算机,解决了低速的信息输入与高速信息处理之间的矛盾,能够大大提高整个计算机系统的效率。这种根据汉字识别而达到自动录入汉字文本的方法,从根本上改变了人们对计算机汉字人工编码录入的  相似文献   

4.
本文简述了印刷体汉字识别技术理论与实践的发展历程,重点介绍了汉字识别技术的最新进展,并展望了印刷汉字识别的美好前景。  相似文献   

5.
本文提出了一种识别印刷体汉字的新方法——轮廓笔划码序列法。首先,运用修改的Ullmann边缘跟踪算法跟踪整个汉字边缘轮廓,得出链式方向码序列;其次,给出一种适用于汉字识别的高曲率点的定义及检测方法;最后,介绍产生轮廓笔划码序列的步骤。本文还通过对具有代表性的四十个汉字的计算机模拟,和在带有图象扫描系统C1000的Cromemco微型计算机系统Z-2H上的实际扫描实验,表明了轮廓笔划码序列法具有占用内存小、抽取特征准确方便、计算量少、有一定的抗干扰能力等优点。这种方法对于建立实用的印刷体汉字识别系统具有一定的指导意义。  相似文献   

6.
汉字字形变化多种多样,印刷体字符具有字体差异,手写字体更是没有统一的规则,识别难度非常大,当前用于汉字识别的字形编码方法大多依据字符,无法区分笔画相近的汉字。为此设计一种新的用于汉字识别的字形编码系统,介绍了汉字字形编码的原理,并给出了字形设计方案,依据编码原则,按照汉字被拆分的部件个数对汉字字形编码方案进行设计。详细介绍了汉字输入编辑器IME的结构,通过IME实现汉字的输入。依据汉字的使用频率与分布特性,通过数理统计工具设计含有汉字活动字库的操作系统,主要包括CC-DOS和MPC-DOS操作系统。实验结果表明,采用所设计系统对汉字进行识别精度较高且编码时间少、能耗低。  相似文献   

7.
CHASRE/30软件是为印刷体、打字体和手写体汉字的自动识别而研制的。使用这一识别逻辑,也可以实现对字母和数字的自动识别。本文概略地介绍了这一系统的识别原理,并给出了就这一软件逻辑所进行的计算机模拟的结果。  相似文献   

8.
本文以字符在各象限的端点数和转动惯量为识别特征,并利用邻类兼容和多级分类来识别印刷体字符。这种方法具有较强的区分相似字符的能力。本方法在C-4500数字图象处理机和FELIX-C512电子计算机组成的系统上做了实验,对6000个印刷体汉字的识别取得了令人满意的结果。  相似文献   

9.
盛立东 《通信学报》1990,11(3):32-37
本文针对目前汉字识别中两个关键问题——特征的选择和识别方法进行了较深入的研究。提出了利用动态兼容线性分类法实现一个印刷体汉字识别实验系统。在分类中,采用了质量等十一种特征。其中四象限投影脉冲恃征,八象限特征,十六象限0—1特征和四方向微分特征是本文提出和修正改进的。本文还提出了动态兼容线性分类法和识别字典自动完善的方法。利用上述方法在微机上构成了一个实验识别系统。对3000个加有随机噪声的标准汉字进行了识别,经过训练后识别率可达98.5%,识别速度平均每字0.4秒,收到较好效果。  相似文献   

10.
本文讨论了印刷体汉字的识别,它包括字符的输入、二值化、行切分、字切分、平化、规正、细化、特征提取、识别、后处理。提出了零阶距特征、笔端数特征、笔道数特征和方向数特征。  相似文献   

11.
基于小波特征的单字符汉字字体识别   总被引:4,自引:0,他引:4       下载免费PDF全文
陈力  丁晓青 《电子学报》2004,32(2):177-180
汉字图像不仅包含了汉字的字符信息,还包含了汉字的字体信息.字体信息是版面分析、理解和恢复的重要依据,还有助于实现高性能字符识别系统.目前的字体识别方法还不能对单个汉字字符的字体进行识别.本文提出了一种新的字体识别方法,能够在不知道汉字字符的前提下,识别单个汉字的字体.首先对单个汉字的字符图像进行小波分解,在变换图像上提取小波特征.提取的小波特征经Box-Cox变换整形后,用线性鉴别分析技术(LDA)进行特征选择,得到字体识别特征.所使用的分类器是MQDF分类器.在包含7种字体的样本集上进行的实验表明,本文提出的方法能够在不知道汉字字符的前提下,对单个汉字的字体进行有效识别,基于单字的字体识别率达到97.35%.  相似文献   

12.
本文讨论了印刷体汉字的识别,它包括字符的输入,二值化,行切分,平化、规正,细化,特征提取,后处理。提出了零阶距特征,笔端数特征,笔道数特征和方向数特征。  相似文献   

13.
庄崇彪  金连文 《信号处理》2005,21(3):276-279
在计算机上演示汉字规范的书写过程,是当今计算机辅助教学所追求的功能,但是却很少存在对汉字书写正误及工整方面进行评判.为了实现这一功能,本文详细归纳了汉字书写过程中与计算机识别紧密相关的错误类型,并在此基础上提出了在线汉字书写正误及工整的智能评判算法.该算法通过笔画特征及笔画间特征的提取来实现书写正误和工整两种错误类型的判断.实验结果表明,该算法能较好做出笔势、笔序、多笔画、少笔画等等正误判断及一些初步的书写工整评判.  相似文献   

14.
在计算机上演示汉字规范的书写过程,是当今计算机辅助教学所追求的功能,但是却很少存在对汉字书写正误及工整方面进行评判.为了实现这一功能,本文详细归纳了汉字书写过程中与计算机识别紧密相关的错误类型,并在此基础上提出了在线汉字书写正误及工整的智能评判算法.该算法通过笔画特征及笔画间特征的提取来实现书写正误和工整两种错误类型的判断.实验结果表明,该算法能较好做出笔势、笔序、多笔画、少笔画等等正误判断及一些初步的书写工整评判.  相似文献   

15.
1 中文信息处理发展概述 中文信息处理从处理流程上看分为:输入(中文信息以某种方式进入计算机)、中文信息的机内处理(包括系统软件和应用软件,它们之间用机内码通讯,以及存贮方式和字库设计和存贮)、输出(按照用户的要求以某种形式输出、汉字显示、汉字印字和语音输  相似文献   

16.
本文介绍了一种高光度曲面上的印刷体数字图像识别技术中,对于图像进行二值化处理的方法。  相似文献   

17.
本文在GoogLeNet网络基础上搭建了一个适合手写汉字识别的卷积神经网络.研究建立了新的手写汉字训练集,新训练集综合了现有的训练集并剔除了其中的错误,同时加入印刷体训练集,增加书写风格的多样性.训练神经网络时采用随机梯度下降算法,并加入动量项加速网络参数的收敛,使用正则项防止过度拟合,最终训练出的神经网络在训练集上的正确率为99.56%,在验证集上的正确率达到96%,并具有很好的泛化能力.  相似文献   

18.
数学公式识别是将中文电子文档中包含的数学公式识别出来的方法.印刷体文档中的数学公式识别是由预处理,数学公式的抽取分割定位和结构分析识别3部分组成.主要介绍了目前数学公式识别的研究现状,并对已提出的各种成熟识别方法进行总结.  相似文献   

19.
RFID的技术动向   总被引:1,自引:0,他引:1  
老蔡 《电子产品世界》2004,(5):47-47,54
最近,RFID(射频识别)、无‘线标签、IC标签、无线卡-等术语充斥媒体.这些都是在无线通信中按某种规则(协议)进行ID或其它数据提取的新方法.发送接受数据的处理、管理虽随应用领域及系统而不同,但无线通信有关的技术几乎是共通的.本文中把这些称谓统一为RFID射频识别.  相似文献   

20.
提出了一种适用于汉字识别的新的局部描绘子,在SIFT描绘子的基础上添加了灰度对比直方图的概念。该局部描绘子作为汉字的特征表述,测试系统思想是把汉字识别当作图像匹配问题。为了检测新描绘子的特性,在仿射、噪声、背景、复杂情况这4种情况下进行汉字识别测试,对比新描述子和SIFT描绘子的汉字识别正确率,实验结果证明该描绘子在汉字识别方面可以描述更多的局部信息,表现也比SIFT描绘子要好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号