首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
在普通话大词汇量连续语音识别中,使用最大后验概率决策规则解码得到的是具有最小句子错误率的识别结果,但是本文通常使用字错误率作为识别结果的评测标准.为了使识别结果具有最小字错误率,在充分考虑汉语语言特点的基础上,提出了一种汉字混淆网络算法.这种算法能够有效地将普通话大词汇量连续语音识别系统输出的词格转换成为汉字混淆网络.详细讨论了最小贝叶斯风险决策规则理论及使用汉字混淆网络进行的解码过程.基于2005 HTRDP(863)评测数据集进行的实验结果表明,这种使用汉语字混淆网络的方法有效地降低了普通话大词汇量连续语音识别结果的字错误率.  相似文献   

2.
基于N联字的汉字识别后处理研究   总被引:1,自引:0,他引:1  
为了提高汉字识别率, 本文提出了在单个汉字的初级识别后, 利用N联字的上下文关系, 对初级识别中拒识或不确定的汉字语段作进一步确认的一种方法, 阐明了N联字后处理方法的基本思想, 给出了实现此方法的数据库的结构设计方案和理论算法, 分析了理论上可提高的识别率, 最后给出了一个N联字汉字识别后处理系统模型。  相似文献   

3.
针对汉字图像预处理过程中归一化算法进行了改进.先对单个汉字进行大小归一化,并在此基础上对汉字进行细化,最后对骨架图像进行修正.实验结果表明该算法有效可行,可应用于汉字识别的后续处理.  相似文献   

4.
本文仔细研究了地图背景下的汉字的特征,特别是汉字与地图背景的关系,并就此提出了一些特定的预处理技术,包括图文分离、行倾斜校正、"倾斜字"校正、字切分等算法.经过这些预处理,就能从地图背景下分离出汉字,并将汉字变成单个标准点阵模块,为汉字识别奠定基础,最终实现地图下的汉字自动化输入。  相似文献   

5.
手写汉字的集群识别   总被引:3,自引:0,他引:3  
为了降低单个汉字的分辨率,论文分析了通用的汉字识别模型,并在此基础上建立了适于多字识别的集群识别模型。为了充分论证集群识别模型的观点,本文从理论证明和实验两方面获得支持根据。实验结果表明基于多字识别模型的集群识别能可靠提高对连续文字的识别效果,是手写汉字识别中很有希望的发展方向。  相似文献   

6.
汉字混淆集是错别字识别中的重要资源之一。在本项研究中,首先手工整理了11935个汉字的可能的错别字,然后以这些汉字为节点、"可错成"关系为边,将混淆集构造成一个错别字混淆集图。由于人工总结错别字具有很大的局限性,因此在种子错别字混淆集图的基础上,设计了自扩展算法和开源外部补充算法来对错别字混淆集图进行扩展,以发现新的错别字对。根据实验,新发现了15133组错别字对。经过随机抽样校对,准确率达到87.35%。  相似文献   

7.
王建平  王晓雪 《计算机应用》2007,27(12):3084-3088
针对汉字特点,提出一种基于汉字结构度和繁简度二类模态判别的多模式识别法。给出了汉字字型结构度类型的字型编码,以及汉字字型结构分解算法;对分解后的部件进行繁简度判断,依据各部件繁简度模态选择合适的特征提取算法,实现手写体汉字字型分解的多模式识别方法融合;对相似字采用两级分类的识别法,从而提高汉字的识别率和正确率。仿真实验验证了方法的有效性。  相似文献   

8.
赵明 《软件学报》1991,2(3):11-19
本文介绍手写印刷体汉字识别方法2-D EAG。主要的工作为:提出了二维扩展属性文法模式识别方法,可实现自底向上归约和自顶向下推导双向信息传递和控制;提出了一种直接利用二维信息进行识别的方式,可避免特征线性化造成的信息丢失;提出了多义文法、共生文法和结构推断三种在文法之间建立联系,利用结构类比区分极相似字的 识别算法;提出了多冗余归约机制,双边缘弹性跟踪笔段抽取算法,多冗余有引导部件抽取算法。用2-D EAG方法对100字种实际手写汉字进行了识别实验,在识别大畸变汉字(包括部分连笔字)方面得到了很好的结果。  相似文献   

9.
方应谦  王鲁 《中文信息学报》2000,14(2):26-30,,48,
汉字识别中,以往的分类器设计都是以字为单位的“字分类器”。字分类器的输出总是与待识字结构相似的一个侯选字集合。这是使后级识别容易产生误识的主要原因。为克服字分类器的缺点,本文给出了以词为单位的词分类器设计的策略与方法,并实验验证了词分类器在分类率及分类速度方面均优于字分类器。  相似文献   

10.
基于互动计算的汉字楷书识别   总被引:3,自引:0,他引:3  
本文从互动计算的角度出发,对汉字楷书识别问题作了专门的研究,给出了一个具体算法 及其实现.由于强调了识别的整体性、关联性、相对性和同时性,有效地解决了汉字形似字的 识别问题,识别率达80%以上.  相似文献   

11.
Recognition of Chinese characters has been an area of major interest for many years, and a large number of research papers and reports have already been published in this area. There are several major problems with Chinese character recognition: Chinese characters are distinct and ideographic, the character size is very large and a lot of structurally similar characters exist in the character set. Thus, classification criteria are difficult to generate. This paper presents a new technique for the recognition of hand-printed Chinese characters using the C4.5 machine learning system. Conventional methods have relied on hand-constructed dictionaries which are tedious to construct and difficult to make tolerant to variation in writing styles. The paper discusses Chinese character recognition using theHough transform for feature extraction and C4.5 system. The system was tested with 900 characters written by different writers from poor to acceptable quality (each character has 40 samples) and the rate of recognition obtained was 84%.  相似文献   

12.
联机手写体汉字联想识别系统   总被引:1,自引:0,他引:1  
本文提出一种联机手写体汉字联想识别系统.在单字识别的基础上,有分词信息的前提下,利用汉语词的前后约束及字的特征信息对识别结果进行后处理.从而提高了联机识别系统的识别率.  相似文献   

13.
手写汉字识别是手写汉字输入的基础。目前智能设备中的手写汉字输入法无法根据用户的汉字书写习惯,动态调整识别模型以提升手写汉字的正确识别率。通过对最新深度学习算法及训练模型的研究,提出了一种基于用户手写汉字样本实时采集的个性化手写汉字输入系统的设计方法。该方法将采集用户的手写汉字作为增量样本,通过对服务器端训练生成的手写汉字识别模型的再次训练,使识别模型能够更好地适应该用户的书写习惯,提升手写汉字输入系统的识别率。最后,在该理论方法的基础上,结合新设计的深度残差网络,进行了手写汉字识别的对比实验。实验结果显示,通过引入实时采集样本的再次训练,手写汉字识别模型的识别率有较大幅度的提升,能够更有效的满足用户在智能设备端对手写汉字输入系统的使用需求。  相似文献   

14.
针对单一尺度的Gabor滤波器组只对某一特定粗细的手写体汉字敏感的缺点,提出了一种新颖的多尺度局部Gabor滤波器组。为了评估该方法的识别性能,提出了一个基于Gabor特征的手写体汉字识别系统,实验表明多尺度全局Gabor滤波器组在识别性能上明显提高,局部Gabor滤波器组在基本保持识别性能的情况下,特征维数明显降低,计算量和内存需求减少。该方法的创新之处在于选取局部Gabor滤波器,对863 HCL2000手写体汉字数据库的识别,最高平均识别率达到了92.32%,表明了该方法在手写体汉字识别中的有效性。  相似文献   

15.
利用汉字的部首层次结构有助于减小字符识别器的存储空间和提高泛化性、适应性,但部首分割一直是一个难点.提出一种新的基于部首的联机手写汉字识别方法,该方法把部首形状信息和几何信息集成到识别框架中,在组合搜索过程中利用字符-部首的层次结构字典引导部首的分割与识别,从而提高部首分割的准确率.为克服部首间的连笔,引入角点检测提取子笔划.部首识别采用统计分类器,模型参数通过自学习得到.在字符识别中,采用了2种不同的字典表示以及相应的不同搜索算法.该方法已用于左右与上下结构的字符集,实验结果表明了该方法的有效性.  相似文献   

16.
This paper presents some novel results concerning the recognition of single-font printed Chinese characters via the transformation algorithms of Fourier, Hadamard, and Rapid. The new design philosophy of a three-stage structure is believed to offer at least a suboptimal search strategy for recognizing printed Chinese characters with a dictionary of 7000–8000 characters. The transformation algorithms discussed in this paper will be used in the last two stages. Extensive experiments and simulations concerning feature extraction and noisy or abnormal pattern recognition have been carried out (the simulations have been restricted to a 63-character subset called “Radicals”). Comparison has been made of all three transforms according to their ability to recognize characters.  相似文献   

17.
针对手写汉字字符图像识别率受随机噪声影响的问题,提出了一种基于深度学习与抑制噪声相结合的新算法。该算法主要应用于拥有随机噪声的手写汉字字符图片,是其在Python环境下,利用Caffe平台建立抑制噪声与卷积神经网络相结合的模型,通过模型移除噪声并正确识别手写汉字。另外,新算法去除噪声的同时对字符形态没有改变,保留了汉字的原始信息。结果在其两种不同的噪声(高斯噪声和椒盐噪声)下,逐渐提升其噪声强度,进行多次实验,同时与其他方法对比,最终得到其平均识别率为97.05%。实验结果表明,该模型和算法具有效率快、识别能力强的优点。  相似文献   

18.
根据数字字符整体特征, 提出一种基于字符整体特征的Bp神经网络数字二次识别方法. 该方法首先根据Bp神经网络原理对数字字符进行预识别; 然后对预识别结果中存在混淆的字符按照字符整体特征进行二次识别, 从而准确获得识别结果. 该方法结合了神经网络非线性、自主学习特点和字符整体特征形状结构不变性特点, 有效的在低样本量情况下, 获得较高的字符识别精度.  相似文献   

19.
借鉴仿生模式识别的认知观点,从汉字的构造机理和人类认识汉字的习惯角度出发,提出一种基于小波变换的图像汉字识别方法。制定了图像汉字笔划特征提取的具体规则,采用小波变换的方法对图像汉字边缘和笔划轮廓进行检测,通过有效提取图像汉字笔段信息,进行笔段合成,生成汉字或汉字的基本笔划。仿真实验结果表明,这种方法提高了图像汉字笔划特征提取的准确率和稳定性,对于印刷体和书写较规范的手写体图像汉字具有极高的识别率。  相似文献   

20.
基于组件合并的手写体汉字串分割   总被引:5,自引:0,他引:5  
吕岳  施鹏飞  张克华 《软件学报》2000,11(11):1554-1559
人们对孤立的手写体汉字字符的离线 识别做了大量的研究工作,而走向实用化的进展并不快.除了单字识别率不理想以外,从文本 中正确分割出单个汉字字符也是一个主要难题,因为字符的识别离不开正确分割.利用汉字的 基本结构特征,根据两个组件之间的上下、左右和包围关系,对组件进行合并形成完整的汉字 图像.对整个汉字字符串中组件的宽度和相邻组件的间距进行分析,有助于左右关系组件的合 并.实验结果表明,该方法对手写体汉字字符串具有理想的分割效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号