首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 578 毫秒
1.
通过分析汉字的常见结构,鉴于汉字与汉字之间的距离和构成汉字的部件之间的距离的显著差异性,提出一种基于候选特征笔画和多类阈值的手写汉字切分方法.首先从构成手写汉字的笔画集合中提取候选特征笔画,根据候选特征笔画将手写汉字预切分,然后利用基于间距阈值的部件组合规则对过切分的汉字部件进行组合,最后采用基于单字宽度阈值的粘连汉字判断规则搜索粘连汉字,对粘连汉字进行递归切分.实验表明,该方法对连续手写汉字的切分准确率较高,具有一定的实用性.  相似文献   

2.
为了解决联机手写体汉字笔划顺序、笔划数目及笔划形状变化问题,提出了一种新的联机手写体汉字识别方法人工神经网络(ANN)和隐马尔可夫模型(HMM)相结合的汉字识别方法,首先通过BP神经网络进行笔划识别,再通过笔划类型和笔划间位置关系的隐马尔可夫模型进行整字识别.实验证明,该联机手写体汉字识别系统具有较高地识别准确率.  相似文献   

3.
自动识别手写印刷体汉字系统中的部件分离问题   总被引:1,自引:0,他引:1  
在用抽取笔划有序列法自动识别手写印刷体汉字的系统中,分离出汉字“部件”是很必要的,这里所说的“部件”是指汉字中一些能分离的笔划组合,主要是汉字的偏旁部首(或字根),由计算机自动识别汉字的需要而定。 在以笔划为基元,用句法结构法识别汉字的系统中分离部件是为了恢复部件的有序性,本文提出了一种适合于分离手写印刷体汉字部件的方法,给出这种分离部件方法的框图和在PDP-11/23计算机上进行模拟试验所得到的结果。  相似文献   

4.
基于ANN和HMM的联机手写体汉字识别系统   总被引:1,自引:0,他引:1  
为了解决联机手写体汉字笔划顺序、笔划数目及笔划形状变化问题,提出了一种新的联机手写体汉字识别方法:人工神经网络(ANN)和隐马尔可夫模型(HMM)相结合的汉字识别方法,首先通过BP神经网络进行笔划识别,再通过笔划类型和笔划间位置关系的隐马尔可夫模型进行整字识别。实验证明,该联机手写体汉字识别系统具有较高地识别准确率。  相似文献   

5.
提出了一种基于笔顺重排算法的手写汉字识别。将手写汉字的可见线段和不可见线段进行联合编码,并 采用了一种基于单字切分及基本笔顺表的识别方法。首先将单字分解为部件,根据分解的结构,对字典进行粗略的过滤,将字典中不符合待识别汉字拆分结构的字排除,然后根据笔划编码进行识别,有效提高了笔划的匹配速度,较好地解决了联机手写汉字识别中连笔及笔顺自由问题。  相似文献   

6.
用于粘连手写体汉字切分的二次寻点算法   总被引:2,自引:0,他引:2  
离线手写体汉字的切分是离线汉字识别的基础,其中以粘连字体的切分最难。文章提出了一种对粘连手写体汉字粘连位置精确定位的算法。该算法包含两次寻点过程,第一步寻找波谷点,对粘连字的分割位置进行粗定位;第二步寻找理想切分点,即结合波谷点与波谷邻近特征点的综合位置,最终给出切分线定位,以实现粘连汉字的切分。  相似文献   

7.
为有效地获取脱机手写体汉字笔划信息,采用过程神经元网络提取手写体汉字基本笔段,分析各类笔段间的拓扑性质,并将手写体汉字图像转化为具有容错表征方式的六种汉字笔划类型在不同位置组成的几何图形.模仿人类汉字形码输入法,统计具有冗余容错形状的笔划类型和相合相交点的数量和位置,建立手写体汉字多维特征知识数据结构表,通过对比和判断仿人容错地识别手写体汉字.对SCUT-IRAC手写体汉字库中汉字进行了实验仿真,该方法具有较强的"认知"手写体汉字的能力.  相似文献   

8.
为提高维吾尔文档图像的检索效率,提出一种基于字符空间关系的关键词检索方法.通过对文档图像进行单词切分,提取切分后单词图像的字符空间位置特征,将提取的特征根据单词的连体段数目存储为多个特征文件,根据输入关键词图像的特征寻找对应的特征文件进行查询.从115张印刷体维吾尔文档图像切分后的24460张单词集中选取10张有丰富含...  相似文献   

9.
本文提出了一种利用关键构件提取印刷体汉字部首的新方法.该方法先将部首分解为若干关键构件,由这些关键构件及它们之间的相对位置关系组成部首的特征,然后根据部首的特征来设计分类树,利用分类树把待识汉字的部首提取出来.采用本方法提取部首,不会受部首大小的影响,也不会受部首与字中其它部分笔划粘连的影响,而且与笔划的粗细无关.本方法在提取关键构件时引入了数学形态学的算法,可以实现并行运算.对传真机输入的二级印刷体宋体汉字(6763个)进行了实验,提取部首的正确率达98.6%.  相似文献   

10.
本文论述了基于汉字笔划骨骼运笔特征的笔迹鉴定的方法。实验以汉字中抽取的基本笔划为研究对象,并提取反映各行笔部运笔的骨骼特征,以形成多维持征空间,在特征空间中确定鉴定对象的分布后,计算它与辞书中各书写者位置间的广义距离来实现笔迹的鉴定。判断鉴定对象是否自出于原书写者的方法即为特定对象鉴定法,该方法采用对十位书写者、八种基本笔划,每种笔划十个样本进行测试,结果显示对于单一笔划和笔划组合取得了令人满意的鉴定率,对推广和完善该实用性的研究具有参考价值。  相似文献   

11.
基于可伸缩矢量图SVG的在线手写汉字是以SVG图像作为汉字图像格式、以SVG的path对象作为笔画的基本存储单元来对汉字进行显示和存储的,笔画的轮廓是以手写过程中记录的坐标值作为特征数值加以确定的。基于此种SVG手写汉字存储和表示形式,本文提出一种基于图论的在线连续手写汉字多步分割方法。该方法根据汉字笔画间的坐标位置关系对手写笔画序列构建无向图模型,并利用图的广度优先搜索将原笔画序列分割为互不连通的笔画部件,使偏旁部首分离较远、非粘连汉字得到正确分割;然后利用改进的tarjan算法对部件中的粘连字符进行分割,最后基于笔画部件间距,利用二分类迭代算法对间距进行分类,找出全局最佳分割位置,对过分割的部件进行重组合并。实验结果表明,该方法对于在线手写汉字的分割是有效可行的。  相似文献   

12.
汉字笔段形成规律及其提取方法   总被引:8,自引:0,他引:8  
该文从点阵图像行(列)连通像素段出发,研究汉字图像的笔段构成,发现汉字点阵图像仅由阶梯型笔段和平行长笔段两种类型的笔段构成,并归纳出阶梯型笔段和平行长笔段的形成规律.以笔段形成规律为基础提出了汉字笔段的提取方法,该方法将像素级汉字图像转变为以笔段为单位的图像,有利于汉字识别、汉字细化及汉字字体的自动生成.最后该文给出了印刷体和手写体汉字笔段提取的实验结果.  相似文献   

13.
Correct segmentation of handwritten Chinese characters is crucial to their successful recognition. However, due to many difficulties involved, little work has been reported in this area. In this paper, a two-stage approach is presented to segment unconstrained handwritten Chinese characters. A handwritten Chinese character string is first coarsely segmented according to the background skeleton and vertical projection after a proper image preprocessing. With several geometric features, all possible segmentation paths are evaluated by using the fuzzy decision rules learned from examples. As a result, unsuitable segmentation paths are discarded. In the fine segmentation stage that follows, the strokes that may contain segmentation points are first identified. The feature points are then extracted from candidate strokes and taken as segmentation point candidates through each of which a segmentation path may be formed. The geometric features similar to the coarse segmentation stage are used and corresponding fuzzy decision rules are generated to evaluate fine segmentation paths. Experimental results on 1000 Chinese character strings from postal mail show that our approach can achieve a reasonable good overall accuracy in segmenting unconstrained handwritten Chinese characters.  相似文献   

14.
基于组件合并的手写体汉字串分割   总被引:5,自引:0,他引:5  
吕岳  施鹏飞  张克华 《软件学报》2000,11(11):1554-1559
人们对孤立的手写体汉字字符的离线 识别做了大量的研究工作,而走向实用化的进展并不快.除了单字识别率不理想以外,从文本 中正确分割出单个汉字字符也是一个主要难题,因为字符的识别离不开正确分割.利用汉字的 基本结构特征,根据两个组件之间的上下、左右和包围关系,对组件进行合并形成完整的汉字 图像.对整个汉字字符串中组件的宽度和相邻组件的间距进行分析,有助于左右关系组件的合 并.实验结果表明,该方法对手写体汉字字符串具有理想的分割效果.  相似文献   

15.
基于笔划包围盒的脱机手写体汉字分割算法   总被引:1,自引:3,他引:1  
汉字分割是脱机手写体汉字识别预处理的重要部分,改进了基于笔画包围盒的汉字分割算法。根据方向行程长度提取出汉字的笔画,对所得笔画建立包围盒。使用4种基本合并操作得到汉字的粗略的分割。最后使用动态规划的方法实现汉字的精细分割。实验结果表明,该算法较好地解决了汉字分割中的笔画粘连和重叠问题。  相似文献   

16.
借鉴仿生模式识别的认知观点,从汉字的构造机理和人类认识汉字的习惯角度出发,提出一种基于小波变换的图像汉字识别方法。制定了图像汉字笔划特征提取的具体规则,采用小波变换的方法对图像汉字边缘和笔划轮廓进行检测,通过有效提取图像汉字笔段信息,进行笔段合成,生成汉字或汉字的基本笔划。仿真实验结果表明,这种方法提高了图像汉字笔划特征提取的准确率和稳定性,对于印刷体和书写较规范的手写体图像汉字具有极高的识别率。  相似文献   

17.
文章通过讨论汉字的基本笔画及字体特征提出了一种基于原体的汉字程序变体方法。该方法从汉字的骨架拓扑结构及各字体笔画轮廓线的几何形状出发,建立了字体的数学描述模型、索引结构及字体成形算法,继承了字库存在方式的优点,又改变了完全靠字库变体的老方法。实验结果表明该方法不但可以实现具有实用性的字形变体,而且大量节约了存储空间。  相似文献   

18.
林民  宋柔 《中文信息学报》2008,22(3):115-123
目前汉字字形描述方法存在的主要问题是缺少能涵盖一切可能汉字的可计算的字形形式化描述体系,从而造成汉字处理应用中的一系列障碍。本文给出了一种汉字网格字形描述方法,实验表明,该方法具有描述一切可能汉字字形(包括错字)骨架的能力,支持不同颗粒度的构字元素、结构关系等字形特征的自动提取和计算,为字形特征的自动分析处理提供了一种有效的手段,从而也为基于字形计算的各种应用建立了可靠的基础。  相似文献   

19.
黄弋石  梁艳  陆峥嵘 《软件》2013,34(5):67-70,90
为了解决手机的汉字联机识别,我们提供了完整的解决方案。先定义了一套六组基本定义,形成一种特殊的但是很简单的图形描述方法。将汉字楷书的常用字的笔画,进行统计归纳归类,找到有限的笔画组成。使用基本定义,描述楷书的独立笔画,这些描述是互不相同的。回避了传统的复杂的二维图形学的方法。经过穷举法验证,几乎每个常用汉字的拆解的内容,都互不相同,所以从逻辑上可判定这种方法是有效的。也提供并公布对汉字行书、草书的部分解决方案。形成了一个手机汉字连笔识别的体系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号