首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
通过分析汉字的常见结构,鉴于汉字与汉字之间的距离和构成汉字的部件之间的距离的显著差异性,提出一种基于候选特征笔画和多类阈值的手写汉字切分方法.首先从构成手写汉字的笔画集合中提取候选特征笔画,根据候选特征笔画将手写汉字预切分,然后利用基于间距阈值的部件组合规则对过切分的汉字部件进行组合,最后采用基于单字宽度阈值的粘连汉字判断规则搜索粘连汉字,对粘连汉字进行递归切分.实验表明,该方法对连续手写汉字的切分准确率较高,具有一定的实用性.  相似文献   

2.
基于可伸缩矢量图SVG的在线手写汉字是以SVG图像作为汉字图像格式、以SVG的path对象作为笔画的基本存储单元来对汉字进行显示和存储的,笔画的轮廓是以手写过程中记录的坐标值作为特征数值加以确定的。基于此种SVG手写汉字存储和表示形式,本文提出一种基于图论的在线连续手写汉字多步分割方法。该方法根据汉字笔画间的坐标位置关系对手写笔画序列构建无向图模型,并利用图的广度优先搜索将原笔画序列分割为互不连通的笔画部件,使偏旁部首分离较远、非粘连汉字得到正确分割;然后利用改进的tarjan算法对部件中的粘连字符进行分割,最后基于笔画部件间距,利用二分类迭代算法对间距进行分类,找出全局最佳分割位置,对过分割的部件进行重组合并。实验结果表明,该方法对于在线手写汉字的分割是有效可行的。  相似文献   

3.
书写顺序恢复是从静态文本图像中提取动态的字符书写顺序信息,将2维的图像转换为1维的书写位置的时间序列的过程.为了对手写汉字进行书写顺序提取,提出了一种脱机手写汉字书写顺序的恢复模型.该模型首先将汉字分为整字、部件、子部件和笔画4个层次;然后利用4种拆分操作将整字拆分为部件,再将部件拆分为子部件;最后通过定义一组拆分关系与子部件偏序关系之间的对应规则来得到子部件的全序关系.而将子部件作为最基本的恢复单位,其书写顺序可通过对笔画和交叉笔画对进行分类来得到.实验表明,该模型提出的汉字书写顺序恢复方法的恢复结果具有较高的准确率,且处理速度达到了6.9字/s.  相似文献   

4.
提出了一种基于笔顺重排算法的手写汉字识别。将手写汉字的可见线段和不可见线段进行联合编码,并 采用了一种基于单字切分及基本笔顺表的识别方法。首先将单字分解为部件,根据分解的结构,对字典进行粗略的过滤,将字典中不符合待识别汉字拆分结构的字排除,然后根据笔划编码进行识别,有效提高了笔划的匹配速度,较好地解决了联机手写汉字识别中连笔及笔顺自由问题。  相似文献   

5.
手写汉字中笔划,部件及其位置关系均产生较大变化,这种变化是引起手写汉字特征不稳定的主要因素。为了减小上述不利影响,使手写汉字特征的描述趋于稳定,本文给出了一种基于汉字基元之间的模糊关系识别手写汉字的方法。  相似文献   

6.
对以前提出的非线性动态手写模板加以改进并用于手写汉字的部件识别.在训练阶 段,核-主元分析用来捕捉非线性的手写变化.于是,只需改变少量的形状参数就可获得动态变 形的模板.在识别阶段,遗传算法取代了原始的动态通道算法去寻找最优的形状参数.我们对覆 盖2154个汉字类别的200个部件进行了实验,对不用人书写的430,800个测试样本的部件识 别率达97.4%.与现有的代表性部件方法比较也显示本文的方法效果最好.  相似文献   

7.
小类别数手写汉字建模   总被引:3,自引:1,他引:3  
在手写汉字识别的研究中,鲜有研究者提出建立手写汉字的数学模型,本文在这方面作了一些探讨。建模的目的通常有两个:一是手写汉字的表示或描述,二是手写汉字的识别。本文针对小类别数手写汉字,在骨架图形的基础上,把手写汉字看作孤枝、孤环和部件的集合,并定义三者之间的方位关系,从而建立手写汉字的数学模型。实验表明,该模型用于识别,效果良好。  相似文献   

8.
本文提出了一种在隐含马尔可夫模型(HMM)框架下建立的识别脱机手写汉字的方法,介绍了以HMM对脱机手写汉字进行建模、识别的整个过程,并给出了实验结果对国标一级3755个汉字的识别率,在两种测试集上分别达到96.4%和91.5%.  相似文献   

9.
自动识别手写印刷体汉字系统中的部件分离问题   总被引:1,自引:0,他引:1  
在用抽取笔划有序列法自动识别手写印刷体汉字的系统中,分离出汉字“部件”是很必要的,这里所说的“部件”是指汉字中一些能分离的笔划组合,主要是汉字的偏旁部首(或字根),由计算机自动识别汉字的需要而定。 在以笔划为基元,用句法结构法识别汉字的系统中分离部件是为了恢复部件的有序性,本文提出了一种适合于分离手写印刷体汉字部件的方法,给出这种分离部件方法的框图和在PDP-11/23计算机上进行模拟试验所得到的结果。  相似文献   

10.
汉字分割是连续手写汉字识别的关键问题之一,现有多数汉字分割算法需要对笔划结构进行分析,由于汉字具有复杂的结构和不同的书写风格,因此往往计算量偏大.针对嵌入式系统处理能力和内存资源相对较少的特点,介绍了一种基于笔划连通域和字符投影的手写汉字分割算法,以连通域为单元实现连续汉字的分割,不用考虑连通域中所包含笔划的结构和风格,降低了计算量.  相似文献   

11.
在模式识别领域,投票策略是非常有效的,而且已被成功应用到人脸检测、识别等领域. 然而,在手写汉字识别 (Handwritten Chinese character recognition, HCCR)中,由于类别集很大、训练样本少等特点,现有的很多分类器集成方法方法都很难直接应用于此领域. 本文提出一种自产生式投票的方法,该方法通过事先学习得到的参数集产生一个测试集合,然后用一个分类器去识别 测试集合中的每个样本,得到属于各个类别的概率,最后通过加权投票得到识别结果. 实验结果表明,本文提出的方法是实用和有效的.  相似文献   

12.
手写汉字的集群识别   总被引:3,自引:0,他引:3  
为了降低单个汉字的分辨率,论文分析了通用的汉字识别模型,并在此基础上建立了适于多字识别的集群识别模型。为了充分论证集群识别模型的观点,本文从理论证明和实验两方面获得支持根据。实验结果表明基于多字识别模型的集群识别能可靠提高对连续文字的识别效果,是手写汉字识别中很有希望的发展方向。  相似文献   

13.
手写汉字识别是手写汉字输入的基础。目前智能设备中的手写汉字输入法无法根据用户的汉字书写习惯,动态调整识别模型以提升手写汉字的正确识别率。通过对最新深度学习算法及训练模型的研究,提出了一种基于用户手写汉字样本实时采集的个性化手写汉字输入系统的设计方法。该方法将采集用户的手写汉字作为增量样本,通过对服务器端训练生成的手写汉字识别模型的再次训练,使识别模型能够更好地适应该用户的书写习惯,提升手写汉字输入系统的识别率。最后,在该理论方法的基础上,结合新设计的深度残差网络,进行了手写汉字识别的对比实验。实验结果显示,通过引入实时采集样本的再次训练,手写汉字识别模型的识别率有较大幅度的提升,能够更有效的满足用户在智能设备端对手写汉字输入系统的使用需求。  相似文献   

14.
This paper presents a new linguistic decoding method for online hadwritten Chinese character recognition.The method employs a hybrid language model which combines N-gram and linguistic rules by rule quantification technique,The linguistic decoding algorithm consists of three stages:word lattice construction,the optimal sentence hypothesis search and self-adaptive learning mechanism.The technique has been applied to palmtop computer‘s online handwritten chinese character recognition.Samples containing millions of characters were used to test the acter recognition,Samples containing millions of characters were used to test the linguistic decoder.In the open experiment,accuracy rate up to 92% is acieved.and the error rate is reduced by 68%.  相似文献   

15.
小类别数手写汉字识别   总被引:5,自引:0,他引:5  
针对小类别数手写汉字,在骨架图形的基础上,把手写汉字看作孤枝、孤环和部件的集合,并定义三者之间的方位关系,从而建立手写汉字的数学模型.基于迷种模型,进一步探讨一种新的识别方法以及新方法所使用的知识库的构造方法.实验表明,所提出的模型及识别方法对于小类数的手写汉字识别行之有效。  相似文献   

16.
孙伟 《微处理机》2002,(4):24-27
手写汉字识别是模式识别领域极具应用前景的研究课题之一。本文介绍了用Visual C^ 6.0构造用于研究手写汉字识别的模拟系统,用软件方式实现手写输入。该系统使用方便,使用者可以将精力集中在手写汉字特征提取、识别速度和识别率等方面。  相似文献   

17.
基于遗传算法的手写体汉字识别系统优化方法的研究   总被引:8,自引:0,他引:8  
为了改善手写体汉字识别系统的性能,提出了前端单字识别器(SCR)和后端语言解码器(post-processing system)有效结合的模型,并且利用遗传算法对系统参数进行优化。以联机手写体汉字识别系统作为SCR进行测试,首选准确率为69.46%,汉字识别的准确率达到87.59%,较优化前提高6.4%。实验结果表明,遗传算法(GA)是一种有效的优化系统参数的方法。  相似文献   

18.
针对单一尺度的Gabor滤波器组只对某一特定粗细的手写体汉字敏感的缺点,提出了一种新颖的多尺度局部Gabor滤波器组。为了评估该方法的识别性能,提出了一个基于Gabor特征的手写体汉字识别系统,实验表明多尺度全局Gabor滤波器组在识别性能上明显提高,局部Gabor滤波器组在基本保持识别性能的情况下,特征维数明显降低,计算量和内存需求减少。该方法的创新之处在于选取局部Gabor滤波器,对863 HCL2000手写体汉字数据库的识别,最高平均识别率达到了92.32%,表明了该方法在手写体汉字识别中的有效性。  相似文献   

19.
针对手写汉字字符图像识别率受随机噪声影响的问题,提出了一种基于深度学习与抑制噪声相结合的新算法。该算法主要应用于拥有随机噪声的手写汉字字符图片,是其在Python环境下,利用Caffe平台建立抑制噪声与卷积神经网络相结合的模型,通过模型移除噪声并正确识别手写汉字。另外,新算法去除噪声的同时对字符形态没有改变,保留了汉字的原始信息。结果在其两种不同的噪声(高斯噪声和椒盐噪声)下,逐渐提升其噪声强度,进行多次实验,同时与其他方法对比,最终得到其平均识别率为97.05%。实验结果表明,该模型和算法具有效率快、识别能力强的优点。  相似文献   

20.
提出了一种笔画分区矩特征的提取方法。根据汉字笔画分布特点,利用小波变换将汉字分解为4个方向笔画分量,用分区矩分别描述4个笔画于图像,并采用K—L变换对特征进行降维处理。采用该特征对有限集手写体汉字进行识别,初步实验结果表明该方法十分有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号