首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
汉字识别中正确识别率与识别速度的探讨   总被引:1,自引:0,他引:1  
本文把汉字识别归结为无记忆信道对离散信源的信息传输模型。由此出发导出了正确识别率、识别速度的计算公式,分析了影响正确识别率和识别速度的各种因素。给出了正确识别率与被识别字域大小的关系曲线。曲线表明,出现概率越大的汉字对正确识别率的贡献也越大。在汉字综合频度表的6763个汉字中,出现概率大的前4081个汉字对正确识别率的贡献为99.9%,而余下的2682个汉字对正确识别率的贡献仅仅为0.1%。 文中还对提高识别速度的途径进行了探讨,并作了模拟实验,给出了具有启示性的实验结果。  相似文献   

2.
盛立东 《通信学报》1990,11(3):32-37
本文针对目前汉字识别中两个关键问题——特征的选择和识别方法进行了较深入的研究。提出了利用动态兼容线性分类法实现一个印刷体汉字识别实验系统。在分类中,采用了质量等十一种特征。其中四象限投影脉冲恃征,八象限特征,十六象限0—1特征和四方向微分特征是本文提出和修正改进的。本文还提出了动态兼容线性分类法和识别字典自动完善的方法。利用上述方法在微机上构成了一个实验识别系统。对3000个加有随机噪声的标准汉字进行了识别,经过训练后识别率可达98.5%,识别速度平均每字0.4秒,收到较好效果。  相似文献   

3.
基于小波特征的单字符汉字字体识别   总被引:4,自引:0,他引:4       下载免费PDF全文
陈力  丁晓青 《电子学报》2004,32(2):177-180
汉字图像不仅包含了汉字的字符信息,还包含了汉字的字体信息.字体信息是版面分析、理解和恢复的重要依据,还有助于实现高性能字符识别系统.目前的字体识别方法还不能对单个汉字字符的字体进行识别.本文提出了一种新的字体识别方法,能够在不知道汉字字符的前提下,识别单个汉字的字体.首先对单个汉字的字符图像进行小波分解,在变换图像上提取小波特征.提取的小波特征经Box-Cox变换整形后,用线性鉴别分析技术(LDA)进行特征选择,得到字体识别特征.所使用的分类器是MQDF分类器.在包含7种字体的样本集上进行的实验表明,本文提出的方法能够在不知道汉字字符的前提下,对单个汉字的字体进行有效识别,基于单字的字体识别率达到97.35%.  相似文献   

4.
提出了一种适用于汉字识别的新的局部描绘子,在SIFT描绘子的基础上添加了灰度对比直方图的概念。该局部描绘子作为汉字的特征表述,测试系统思想是把汉字识别当作图像匹配问题。为了检测新描绘子的特性,在仿射、噪声、背景、复杂情况这4种情况下进行汉字识别测试,对比新描述子和SIFT描绘子的汉字识别正确率,实验结果证明该描绘子在汉字识别方面可以描述更多的局部信息,表现也比SIFT描绘子要好。  相似文献   

5.
一种基于笔划特征的印刷体汉字识别方法   总被引:1,自引:0,他引:1  
本文根据汉字的结构特点,以组成汉字的基本结构——笔划作为识别的基本单元,提出了笔划区域编码的分类方法和利用笔划有序四元组的识别方案,这种方法具有较强的分类能力和抗噪声能力。利用由FX-3300传真机、IBM-PC和TS-84图象显示系统所组成的汉字识别实验系统,对3,755个仿宋体印刷汉字进行多次现场识别,取得了较好的结果。  相似文献   

6.
本文提出了一种识别印刷体汉字的新方法——轮廓笔划码序列法。首先,运用修改的Ullmann边缘跟踪算法跟踪整个汉字边缘轮廓,得出链式方向码序列;其次,给出一种适用于汉字识别的高曲率点的定义及检测方法;最后,介绍产生轮廓笔划码序列的步骤。本文还通过对具有代表性的四十个汉字的计算机模拟,和在带有图象扫描系统C1000的Cromemco微型计算机系统Z-2H上的实际扫描实验,表明了轮廓笔划码序列法具有占用内存小、抽取特征准确方便、计算量少、有一定的抗干扰能力等优点。这种方法对于建立实用的印刷体汉字识别系统具有一定的指导意义。  相似文献   

7.
通常只有6763个汉字的中文系统,远远不能适应作家电脑写作的需要。为此,广东作家协会下属的广东跨世纪教科文产业有限公司用七个月的时间,成功地开发出拥有14000个汉字的“万字作家系统”。这个中文写作系统同四部分组成。1.万字中文系(WCDOS):拥有14000个能输入、能显示、能打印的汉字;2.思想库:拥有囊括马列、人生、政治、经济等庞大的中西方思想精华的格言语录;3.文学库:拥有150万字的中  相似文献   

8.
针对传统的模板匹配法对汉字的识别率较低,文中提出一种基于SVM的多特征手写体汉字识别技术。在提取网格特征的基础上增加对汉字质心特征、笔划特征、特征点的提取,并采用SVM算法构造分类器,实现对手写体汉字的识别。实验结果表明,该方法的平均识别率为95.9%,高于传统的模板匹配法。  相似文献   

9.
一种基于段化的手写汉字特征点提取方法及其实现   总被引:3,自引:0,他引:3  
手写汉字识别中的特征点提取,一直是结构匹配方法中的一个关键问题.系统识别率很大程度上取决于特征点提取的正确率.本文在总结前人和作者以前工作的基础上,提出了一种新的段化特征点提取方法,并具体用于手写汉字识别的实用系统中,取得了十分理想的效果.从已测试的1800×10个样本字的结果看,特征点提取正确率突破了98%大关,为实用化手写汉字识别系统奠定了基础.  相似文献   

10.
该文提出了整体分析法和个体分析法的概念,并在分析它们各自适用范围的基础上,指出个体分析法更适合于解决印刷体汉字字体识别。在此基础上,提出一种基于特征点的个体分析法来解决汉字字体识别问题,与以往方法相比,该方法具有3个优点:识别可信度可控;处理速度快;适用于多语混排情况。实验结果表明,该方法有效解决了印刷体汉字字体识别问题,其性能大大优于以往方法。  相似文献   

11.
张剑 《信息技术》2011,(9):109-110,120
对智能交通系统进行了简要的概述,分析了字符识别在车牌识别中的重要性及选取特征的标准,针对车牌中汉字与大写字母和数字采取不同的特征提取方法,最后进行实验分析并对其识别效果进行比较,发现用改进的13点特征法对汉字进行特征提取,其识别效果要好于直接用13点特征法对汉字进行识别。  相似文献   

12.
本文以字符在各象限的端点数和转动惯量为识别特征,并利用邻类兼容和多级分类来识别印刷体字符。这种方法具有较强的区分相似字符的能力。本方法在C-4500数字图象处理机和FELIX-C512电子计算机组成的系统上做了实验,对6000个印刷体汉字的识别取得了令人满意的结果。  相似文献   

13.
在线汉字识别技术在广播电视实时检测系统中的应用   总被引:1,自引:0,他引:1  
戴建秋 《电视技术》2005,(8):90-93,96
针对广播电视检测系统中只需少量汉字服务的实际情况,提出一种使用在线手写汉字识别的方法,来优化系统设计.该方法有三个特点,一是通过利用汉字的笔段链码特征,在单片机中建立动态字典库和词汇库;二是操作者只需手写极少"领衔汉字"供系统识别,系统并将与其相关联的所有命令都显示出来,供操作者选用;三是被检测点的数量等改变时,系统程序不变,且状态既能用数据显示,也能用释意汉字串显示.实用结果表明,该方法具有稳定、高效、经济、使用方便等特点,并且拓展了手写在线识别技术的应用领域.  相似文献   

14.
本文研究手写体汉字识别中的一种新的特征提取方法—弹性网格方向分解特征,在该方法中,我们将手写体汉字进行横、竖、撇、捺四方向的分解,然后根据该汉字的笔划分布构造一组非均匀的弹性网格,将弹性网格分别作用于汉字的四方向分量上,统计汉字象素点在网格中的概率分布来作为特征。对1034类汉字共51700个手写体汉字样本的实验我们得到了9439%的识别率,表明该特征提取方法是十分可行和有效的。  相似文献   

15.
大数据下的基于深度神经网的相似汉字识别   总被引:1,自引:0,他引:1  
针对传统相似手写汉字识别系统(SHCCR)受特征提取方法的限制,提出采用深度神经网(DNN)对相似汉字自动学习有效特征并进行识别,介绍相似字符集生成方法和针对相似汉字识别的深度神经网络的具体结构,研究对比不同的训练数据规模对识别性能的影响.实验表明,DNN能有效地进行特征学习,避免了人工设计特征的不足,与传统基于梯度特征的支持向量机(SVM)和最近邻分类器(1-NN)方法相比,识别率有较大的提高;且随着训练样本增加的同时,DNN在提高识别性能上表现得更为优秀,大数据训练对提升深度神经网络的识别率作用明显.  相似文献   

16.
基于数学形态学的模糊子笔画提取   总被引:1,自引:0,他引:1  
乔德江  陈鸿昶 《通信技术》2009,42(2):174-175
文章提出了一种数学形态学和模糊方向特征融合的方法,实现对手写体汉字的模糊子笔画的提取,进而实现手写体汉字的识别。实验证明,这是一种非常有效的子笔画提取方法。  相似文献   

17.
采用基于统计的方法实现日本人名的识别和翻译系统。将人名的识别转换成序列标注问题,采用条件随机场方法训练识别模型。训练语料在标注时使用S/E(Start/End)标注风格;利用人名在上下文中的关系、人名称呼后缀词和人名字典来设计特征模板。人名翻译时将日本人名分为假名人名和汉字人名,汉字人名的翻译通过建立日本人名常用汉字翻译字典实现;假名人名的翻译通过Moses系统训练翻译模型实现。该系统在人名的识别和翻译测试中都取得了不错统计结果。  相似文献   

18.
汉字字形变化多种多样,印刷体字符具有字体差异,手写字体更是没有统一的规则,识别难度非常大,当前用于汉字识别的字形编码方法大多依据字符,无法区分笔画相近的汉字。为此设计一种新的用于汉字识别的字形编码系统,介绍了汉字字形编码的原理,并给出了字形设计方案,依据编码原则,按照汉字被拆分的部件个数对汉字字形编码方案进行设计。详细介绍了汉字输入编辑器IME的结构,通过IME实现汉字的输入。依据汉字的使用频率与分布特性,通过数理统计工具设计含有汉字活动字库的操作系统,主要包括CC-DOS和MPC-DOS操作系统。实验结果表明,采用所设计系统对汉字进行识别精度较高且编码时间少、能耗低。  相似文献   

19.
一种基于集成BP网络的手写汉字识别方法   总被引:6,自引:3,他引:3  
针对脱机手写体汉字识别,文章给出了一种基于多层BP网络的并行集成方法,该方法是纯神经网络的多分类器并行集成方案。汉字经预处理后,采用弹性网格变换和Zernike矩分别对汉字进行局部和全局特征提取,利用两个BP网络分类器对这两种特征进行训练和初分类。再利用集成网络对前两个子网络的识别结果进行识别。同时对BP网络的应用做了有益的探索,也为BP网络在人类别分类问题中的应用提供了一条可行的途径。实验结果验证了此方法的有效性。  相似文献   

20.
本文研究手写体汉字识别中的一种新的特征提取方法-弹性网络方向分解特征,在该方法中,我们将手写体汉字进行横,竖,撇,捺四方向的分解,然后根据该汉字的笔划分构造一组非均匀的弹性网格,将弹性网格分别作用于汉字的四方向分量上,统计汉字象素点在网格上的概率分布作为特征,对1034类汉字共51700个手写体汉字样本的实验我们得到了94.39%的识别率,表明该特征提取方法是十分可行和有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号