首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
基于SVM的脱机手写汉字机器学习识别方法研究   总被引:3,自引:1,他引:3  
提出了一种模糊统计方法的脱机手写体汉字特征提取方法.结合小波网格方法和汉字笔画密度特征方法对汉字进行特征提取,并运用支持向量机方法,通过机器学习对脱机手写汉字识别。仿真实验表明,支持向量机方法在脱机手写汉字识别中有良好的识别性能及模糊统计方法是有效的。  相似文献   

3.
王建平  陈军  徐晓冰  王熹徽 《微机发展》2006,16(10):104-107
提出了一种模糊统计方法的脱机手写体汉字特征提取方法,结合小波网格方法和汉字笔画密度特征方法对汉字进行特征提取,并运用支持向量机方法,通过机器学习对脱机手写汉字识别。仿真实验表明,支持向量机方法在脱机手写汉字识别中有良好的识别性能及模糊统计方法是有效的。  相似文献   

4.
脱机手写体汉字识别是当前OCR技术研究的热点之一.本文提出了一种用于手写体汉字识别的多特征多分类器集成的系统模型,并利用Matlab工具箱对50个汉字5000个样本进行了初步仿真实验,实验表明该模型是十分可行和有效的.  相似文献   

5.
脱机手写数字识别方法   总被引:1,自引:2,他引:1  
脱机手写体数字识别有着重大的使用价值,特征提取占据了重要的位置.提出了一种通过拓扑特征构造的特征提取新方法,利于了9种特征对数字进行特征提取,然后利用分类树的方法将数字进行分类.最后,在本科学生手写数字图像样本库上的试验结果表明,提出的特征提取方法不仅具有很快的运算能力,而且较大幅度地提高了识别率.  相似文献   

6.
本文提出了一种在隐含马尔可夫模型(HMM)框架下建立的识别脱机手写汉字的方法,介绍了以HMM对脱机手写汉字进行建模、识别的整个过程,并给出了实验结果对国标一级3755个汉字的识别率,在两种测试集上分别达到96.4%和91.5%.  相似文献   

7.
手写印刷体汉字识别方法综述   总被引:13,自引:0,他引:13  
  相似文献   

8.
基于SVM的脱机手写汉字识别   总被引:2,自引:0,他引:2  
程博  吴国平 《现代计算机》2005,8(9):110-112
为了对手写体汉字进行快速准确的识别,本文应用SVM和三种特征识别汉字.经过实验,它的处理速度和识别率都令人满意,如果组合成多分类器可以得到更高的识别率.  相似文献   

9.
针对传统特征提取和分类方法速度慢、稳定性差、识别率低等特点,提出了一种基于外围结构特征提取的手写数字识别方法。该方法多次少量地提取经过双射变换后的图像外围结构特征,对每一次提取的特征结合BP神经网络生成相应的分类器,对不同特征的分类结果进行融合得出手写数字的识别结果。实验结果表明,该特征提取方法实现简单,运算量小,大大提高了脱机手写数字的识别率和效率。  相似文献   

10.
蒙古文的一大特点是字符无缝连接,因此一个蒙古文单词有多种字符划分方式。根据蒙古文这一特点,该文提出了多尺度蒙古文脱机手写识别方法,即让一个手写蒙古文单词图像对应多种目标序列,用多个目标序列同时约束训练模型,使得模型更加精准地学习手写图像的细节信息和蒙古文构词规则。该文提出了“十二字头”码、变形显现码和字素码3种字符划分方法,且拥有相互包含关系,即“十二字头”码可以分解为变形显现码、变形显现码可以进一步分解为字素码。多尺度模型首先用多层双向长短时记忆网络对序列化手写图像进行处理,之后加入第一层连接时序分类器做“十二字头”码序列的映射,然后是第二层连接时序分类器做变形显现码序列的映射,最后是第三层连接时序分类器做字素码序列的映射。用三个连接时序分类器损失函数的和作为模型的总损失函数。实验结果表明,该模型在公开的蒙古文脱机手写数据集MHW上表现出了最佳性能,在简单的最佳路径解码方式下,测试集Ⅰ上的单词识别准确率为66.22%、测试集Ⅱ上为63.97%。  相似文献   

11.
脱机手写汉字识别是我们面临的最困难、最具挑战性的课题,而无论是在办公自动化方面,还是在机器翻译方面,脱机手写汉字识别的应用前景都非常广泛,因此,有必要立足细化处理,对脱机手写汉字识别进行深入研究,使其在各个领域中发挥更大应用价值。  相似文献   

12.
陈站  邱卫根  张立臣 《计算机应用研究》2020,37(4):1244-1246,1251
由于字形的复杂多变,脱机手写汉字的识别一直是模式识别的难题,深度卷积神经网络的发展为其提供了一种直接有效的解决方案。研究基于inceptions 结构神经网络的脱机手写汉字识别,提出了一种inception结构的改进方法,它具有结构更加简单、网络深度扩展更加容易、需要的训练参数量更少的优点。该方法在数据集CISIA-HWDB1.1 上进行了实验验证,采用随机梯度下降优化算法,模型达到了96.95%的平均准确率。实验结果表明,使用改进的inception结构在图像分类上具有更好的鲁棒性,更容易扩展到其他应用领域。  相似文献   

13.
手写汉字识别是模式识别与机器学习的重要研究方向和应用领域;近年来,随着深度学习理论方法的完善、新技术的层出不穷,深度神经网络在图像识别分类、图像生成等典型应用中取得了突破性的进展,其中,深度残差网络作为最新的研究成果,已成功应用于手写数字识别、图片识别分类等多个领域;将研究深度残差网络在脱机孤立手写汉字识别中的应用方法,通过改进残差学习模块的单元结构,优化深度残差网络性能,同时通过对训练集的预处理,从数据层面实现训练生成模型性能的提升,最后设计实验,验证深度残差网络、End-to-End模式在脱机手写汉字识别中的可行性,分析、总结存在的问题及今后的研究方向。  相似文献   

14.
建立一个实用的脱机手写汉字笔迹库是研究笔迹鉴别技术的基础,论文结合笔迹图像与书写者信息设计了一个脱机手写汉字笔迹库系统,详细介绍了笔迹样本采集方案及系统的主要功能,阐述了部分关键问题的解决方案。  相似文献   

15.
脱机手写汉字识别是模式识别领域一项难题.支持向量机(SVM)也是近年来发展起来并成功的用于模式分类的新型机器学习方法,由训练集和核函数完全刻画.其中核函数的选择决定了支持向量机的性能,由于普通核函数各有其利弊,为了得到学习能力和泛化性能都很强的核函数来吸收手写汉字的变形,采用混合核函数,并运用于手写体汉字分类.实验结果表明混合核函数对手写体汉字的分类识别率要高于由普通单个核函数构造的支持向量机.  相似文献   

16.
书写顺序恢复是从静态文本图像中提取动态的字符书写顺序信息,将2维的图像转换为1维的书写位置的时间序列的过程.为了对手写汉字进行书写顺序提取,提出了一种脱机手写汉字书写顺序的恢复模型.该模型首先将汉字分为整字、部件、子部件和笔画4个层次;然后利用4种拆分操作将整字拆分为部件,再将部件拆分为子部件;最后通过定义一组拆分关系与子部件偏序关系之间的对应规则来得到子部件的全序关系.而将子部件作为最基本的恢复单位,其书写顺序可通过对笔画和交叉笔画对进行分类来得到.实验表明,该模型提出的汉字书写顺序恢复方法的恢复结果具有较高的准确率,且处理速度达到了6.9字/s.  相似文献   

17.
以往的手写汉字识别方法,无论应用何种特征提取方法,在生成标准模板时,一般都采用样本特征的算术平均值。文章提出了一种使用样本特征的分位数组合生成标准模板的方法,通过其在手写汉字识别中的应用表明,该方法比基于均值的标准模板有更好的鲁棒性,且在不增加任何计算量和算法复杂度的前提下,使系统的识别性能有所提高;同时该算法还有很好的推广性能,可以应用到各种特征提取算法中。  相似文献   

18.
赵明 《软件学报》1991,2(3):11-19
本文介绍手写印刷体汉字识别方法2-D EAG。主要的工作为:提出了二维扩展属性文法模式识别方法,可实现自底向上归约和自顶向下推导双向信息传递和控制;提出了一种直接利用二维信息进行识别的方式,可避免特征线性化造成的信息丢失;提出了多义文法、共生文法和结构推断三种在文法之间建立联系,利用结构类比区分极相似字的 识别算法;提出了多冗余归约机制,双边缘弹性跟踪笔段抽取算法,多冗余有引导部件抽取算法。用2-D EAG方法对100字种实际手写汉字进行了识别实验,在识别大畸变汉字(包括部分连笔字)方面得到了很好的结果。  相似文献   

19.
为将统计决策方法和句法方法有机结合起来, 本文提出了以部件为基元的基于假设检验的手写印, 体汉字识别方法由统计方法得到候补字集, 利用部件特征的先验知识抽取待识字可能包含的部件并对假设进行验证, 从而不断缩小候补字集, 并逐步完善汉字的结构描述。初步实验表明其分类效果明显。  相似文献   

20.
脱机手写汉字识别的最优采样特征新方法   总被引:5,自引:1,他引:5       下载免费PDF全文
在脱机手写汉字识别中,笔画形变是造成识别率下降的主要原因,减少笔画形变的影响是提高脱机手写汉字识别率的关键。针对上述问题,提出了最优采样特征。该特征以目前被广泛应用的方向线素特征为基础,在一定的约束条件下,通过移动采样点的位置,可以适应笔画的形变。从而减少特征的类内方差,提高特征的可分性,改进了识别性能。通过在THCHR样本集上进行实验,并对最优采样特征和方向线素特征的实验结果进行比较,验证了最优采样特征的识别率优于方向线索特征。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号