首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
王建平  蔺菲  陈军 《计算机工程》2007,33(10):230-232,248
提出了手写体汉字笔画宽度提取、基于提取出的笔画宽度归一化手写体汉字的方法,给出手写体汉字笔画重构的思想,实现了一种基于手写体汉字笔画提取的汉字重构并最终识别手写体汉字的算法,构建了手写体汉字的识别系统。实验证实,该方法可保证原有笔画特征信息,且能有效地识别手写体汉字。  相似文献   

2.
完全基于结构知识的汉字笔画抽取方法   总被引:17,自引:1,他引:16  
从汉字结构知识出发,提出了一种从汉字图像直接抽取笔画的算法,给出了抽取横、竖、撇、捺4种笔画的完全量化的昨去除不同字体的笔画修饰噪声的规则,该方法较好地解决了各笔画的相交、相连及噪声排队等总理2,综在汉字识别及字体自动生成等汉字信息处理方面有重要作用。  相似文献   

3.
基于笔划包围盒的脱机手写体汉字分割算法   总被引:1,自引:3,他引:1  
汉字分割是脱机手写体汉字识别预处理的重要部分,改进了基于笔画包围盒的汉字分割算法。根据方向行程长度提取出汉字的笔画,对所得笔画建立包围盒。使用4种基本合并操作得到汉字的粗略的分割。最后使用动态规划的方法实现汉字的精细分割。实验结果表明,该算法较好地解决了汉字分割中的笔画粘连和重叠问题。  相似文献   

4.
提出了一种笔画分区矩特征的提取方法。根据汉字笔画分布特点,利用小波变换将汉字分解为4个方向笔画分量,用分区矩分别描述4个笔画于图像,并采用K—L变换对特征进行降维处理。采用该特征对有限集手写体汉字进行识别,初步实验结果表明该方法十分有效。  相似文献   

5.
汉字由笔画或子笔画组成,笔画或子笔画特征在手写体汉字识别中得到了广泛应用。论文提出一种模糊子笔画抽取方法,解决了因无限制手写体笔画随意性而使得抽取的子笔画不稳定的问题。计算字符边缘点“横”、“竖”、“撇”、“捺”的模糊子笔画属性特征,并将其与模糊网格相结合,生成模糊子笔画统计特征。银行支票手写体汉字大写金额识别的实验结果表明应用模糊子笔画统计特征能取得更好的识别效果。  相似文献   

6.
侯艳平  王正群  邹军  沈杰 《计算机应用》2007,27(6):1500-1501
针对手写体汉字识别过程中的特征抽取,提出了一种改进的抽取笔画平面的方法。首先,将手写汉字图像进行非线性规一化;然后,利用弹性笔画长度,根据汉字的横竖撇捺四种笔画分别抽取出四种笔画的平面;最后,将四个笔画平面分别均匀划分成S×S个小网格,在每个小格内计算其笔画交叉数目,便得到了一个4S2维的特征向量。实验利用基于最小距离的分类器对含有7600(19类)个汉字的测试集进行了分类,取得了较好的识别效果。  相似文献   

7.
由汉字的轮廓提取笔画,其关键之处在于找到笔画相交处的交点。在提取汉字图像轮廓和特征点的基础上,提出了笔画分离算法,并通过程序实现了该算法。实验证明该算法对于提取印刷体汉字和无连笔的手写体汉字是有效的。  相似文献   

8.
基于过程神经网络的手写体汉字识别方法研究   总被引:1,自引:0,他引:1  
分析手写体汉字各类基本笔画间的拓扑关系,将手写体汉字图像转化为具有容错表征方式的多种汉字笔画类型在不同位置组成的几何图形。采用过程神经元网络提取手写体汉字各类型笔形,统计各类型笔形和相交点的数量,从而建立手写体汉字特征知识的数据结构表。对SCUT IRAC手写体汉字库中汉字进行了实验仿真,该方法大大降低了脱机手写体汉字识别的难度,有较高的汉字识别率。  相似文献   

9.
文章通过讨论汉字的基本笔画及字体特征提出了一种基于原体的汉字程序变体方法。该方法从汉字的骨架拓扑结构及各字体笔画轮廓线的几何形状出发,建立了字体的数学描述模型、索引结构及字体成形算法,继承了字库存在方式的优点,又改变了完全靠字库变体的老方法。实验结果表明该方法不但可以实现具有实用性的字形变体,而且大量节约了存储空间。  相似文献   

10.
提出了一种获得汉字笔画种类及其拓扑结构的新方法.通过分析TrueType字库存储的汉字字形信息,构造笔画图形并提取出笔画特征,采用统计分类和边界关键点定位相结合的方法,利用综合分类法实现了对二级6763个汉字的笔画种类和拓扑结构的基于XML的语义知识表达,可结合前端输入程序进行快速搜索和定位.为字体变形、字体自动生成、汉字知识挖掘等提供了必需的基本信息.实验表明这种方法能够准确、有效地识别汉字笔画及其拓扑结构.  相似文献   

11.
基于组件合并的手写体汉字串分割   总被引:5,自引:0,他引:5  
吕岳  施鹏飞  张克华 《软件学报》2000,11(11):1554-1559
人们对孤立的手写体汉字字符的离线 识别做了大量的研究工作,而走向实用化的进展并不快.除了单字识别率不理想以外,从文本 中正确分割出单个汉字字符也是一个主要难题,因为字符的识别离不开正确分割.利用汉字的 基本结构特征,根据两个组件之间的上下、左右和包围关系,对组件进行合并形成完整的汉字 图像.对整个汉字字符串中组件的宽度和相邻组件的间距进行分析,有助于左右关系组件的合 并.实验结果表明,该方法对手写体汉字字符串具有理想的分割效果.  相似文献   

12.
手写汉字识别是手写汉字输入的基础。目前智能设备中的手写汉字输入法无法根据用户的汉字书写习惯,动态调整识别模型以提升手写汉字的正确识别率。通过对最新深度学习算法及训练模型的研究,提出了一种基于用户手写汉字样本实时采集的个性化手写汉字输入系统的设计方法。该方法将采集用户的手写汉字作为增量样本,通过对服务器端训练生成的手写汉字识别模型的再次训练,使识别模型能够更好地适应该用户的书写习惯,提升手写汉字输入系统的识别率。最后,在该理论方法的基础上,结合新设计的深度残差网络,进行了手写汉字识别的对比实验。实验结果显示,通过引入实时采集样本的再次训练,手写汉字识别模型的识别率有较大幅度的提升,能够更有效的满足用户在智能设备端对手写汉字输入系统的使用需求。  相似文献   

13.
基于笔划宽度提取的手写体汉字归一化方法   总被引:1,自引:0,他引:1  
王建平  蔺菲 《微机发展》2006,16(10):29-31
手写体汉字书写变形是手写体汉字识别预处理阶段的重要问题之一。为了有效地改善手写体汉字变形并识别手写体汉字,提出了手写体汉字笔划宽度提取,以及基于提取出的笔划宽度的手写体汉字归一化的方法。用上述方法在计算机上进行仿真实验,实验结果表明,手写体汉字归一化的方法既能保证原手写体汉字的形状结构特征不变,并可有效地改善手写体汉字变形差异。  相似文献   

14.
基于可伸缩矢量图SVG的在线手写汉字是以SVG图像作为汉字图像格式、以SVG的path对象作为笔画的基本存储单元来对汉字进行显示和存储的,笔画的轮廓是以手写过程中记录的坐标值作为特征数值加以确定的。基于此种SVG手写汉字存储和表示形式,本文提出一种基于图论的在线连续手写汉字多步分割方法。该方法根据汉字笔画间的坐标位置关系对手写笔画序列构建无向图模型,并利用图的广度优先搜索将原笔画序列分割为互不连通的笔画部件,使偏旁部首分离较远、非粘连汉字得到正确分割;然后利用改进的tarjan算法对部件中的粘连字符进行分割,最后基于笔画部件间距,利用二分类迭代算法对间距进行分类,找出全局最佳分割位置,对过分割的部件进行重组合并。实验结果表明,该方法对于在线手写汉字的分割是有效可行的。  相似文献   

15.
针对银行支票图像大写金额的无限制手写体汉字识别问题,进行了基于密度均衡原则的非线性规范化研究。提出了一种改进的非线性规范化方法.该方法定义的基于笔画间距和宽度的密度函数,不仅能较好地克服笔画变形的局部性、不规则性,而且能使同一字符内以及不同字符之间的笔画粗细趋于一致;同时,确定了图像中字符的有效区域,并据此改进了基于密度均衡原则的通用表达式,有效地解决了字符整体倾斜和单个笔画比较突出的问题,实验结果表明:该方法比其他同类方法效果更佳,可使银行支票图像的大写金额识别系统的识别正确率提高约1.5%。  相似文献   

16.
通过分析汉字的常见结构,鉴于汉字与汉字之间的距离和构成汉字的部件之间的距离的显著差异性,提出一种基于候选特征笔画和多类阈值的手写汉字切分方法.首先从构成手写汉字的笔画集合中提取候选特征笔画,根据候选特征笔画将手写汉字预切分,然后利用基于间距阈值的部件组合规则对过切分的汉字部件进行组合,最后采用基于单字宽度阈值的粘连汉字判断规则搜索粘连汉字,对粘连汉字进行递归切分.实验表明,该方法对连续手写汉字的切分准确率较高,具有一定的实用性.  相似文献   

17.
引入方向代码的概念,将联机手写笔画的运动轨迹转换成由方向代码组成的序列。通过分析代码序列中的噪声因素,归纳了噪声的种类,进而设计并实现了一种基于方向代码序列的滤波算法,为联机手写汉字的识别奠定了基础。结合实验完成了滤波、归并和匹配各个过程的设计,从而完成了单笔画及连笔部件的识别。  相似文献   

18.
介绍了一个实用的手写成绩单识别系统,它既可以识别手写的数字成绩单,也可以识别手写的汉字成绩单。对脱机手写汉字的识别,提出了一种基于隐马尔可夫模型的识别方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号