共查询到19条相似文献,搜索用时 62 毫秒
1.
基于SVM的脱机手写汉字机器学习识别方法研究 总被引:3,自引:1,他引:3
提出了一种模糊统计方法的脱机手写体汉字特征提取方法.结合小波网格方法和汉字笔画密度特征方法对汉字进行特征提取,并运用支持向量机方法,通过机器学习对脱机手写汉字识别。仿真实验表明,支持向量机方法在脱机手写汉字识别中有良好的识别性能及模糊统计方法是有效的。 相似文献
2.
3.
在脱机手写汉字识别中,笔画形变是造成识别率下降的主要原因,减少笔画形变的影响是提高脱机手写汉字识别率的关键。针对上述问题,提出了最优采样特征。该特征以目前被广泛应用的方向线素特征为基础,在一定的约束条件下,通过移动采样点的位置,可以适应笔画的形变。从而减少特征的类内方差,提高特征的可分性,改进了识别性能。通过在THCHR样本集上进行实验,并对最优采样特征和方向线素特征的实验结果进行比较,验证了最优采样特征的识别率优于方向线索特征。 相似文献
4.
杨玲 《计算机光盘软件与应用》2010,(14)
脱机手写体汉字识别是当前OCR技术研究的热点之一.本文提出了一种用于手写体汉字识别的多特征多分类器集成的系统模型,并利用Matlab工具箱对50个汉字5000个样本进行了初步仿真实验,实验表明该模型是十分可行和有效的. 相似文献
5.
6.
本文通过分析传统汉字的结构模型所具有的优缺点,提出了建立脱机手写汉字统计模型的理论框架;并利用PCA技术发现大量数据规律性的能力,提出了一种基于PCA技术的脱机手写汉字的统计模型.与传统的结构模型相比,该模型避免了目前还无法解决的准确抽取结构基元的困难,通过以容易抽取的可重构的统计特征作为统计基元,并通过对统计基元变化的整体描述或者说对统计基元相互之间关系的描述,较好地建立了脱机手写汉字的统计模型.根据该模型得到的一些实验结果充分说明了其描述脱机手写汉字的有效性. 相似文献
7.
8.
由于字形的复杂多变,脱机手写汉字的识别一直是模式识别的难题,深度卷积神经网络的发展为其提供了一种直接有效的解决方案。研究基于inceptions 结构神经网络的脱机手写汉字识别,提出了一种inception结构的改进方法,它具有结构更加简单、网络深度扩展更加容易、需要的训练参数量更少的优点。该方法在数据集CISIA-HWDB1.1 上进行了实验验证,采用随机梯度下降优化算法,模型达到了96.95%的平均准确率。实验结果表明,使用改进的inception结构在图像分类上具有更好的鲁棒性,更容易扩展到其他应用领域。 相似文献
9.
针对脱机手写体汉字特点,给出一种采用模糊支持向量机粗分类的方法。根据小波分解像素密度特征,利用模糊支持向量机对汉字进行粗分类。细分类识别提取外围特征,同时融合小波多网格特征,采用一对多算法进行细识别。仿真实验表明,该方法有较高识别率。 相似文献
10.
FSVM在有限集脱机手写体汉字识别中的应用 总被引:3,自引:0,他引:3
模糊支持向量机方法解决了多类支持向量机方法中的不可分区域问题。将模糊支持向量机方法引入到有限集脱机手写体汉字识别中,并以同济大学成绩自动识别系统为背景进行了一系列实验,结果表明在相同的条件下可以达到比支持向量机方法更为理想的识别效果。 相似文献
11.
手写体汉字识别是字符识别领域中的难点。为了使机器识别汉字适应于手写体汉字的变形等因素,基于人类认识汉字的容错机理,提出了一种用于机器识字的汉字容错编码方法,以提高手写体汉字识别率。该编码方法首先对横竖撇捺笔划形态给出了模糊化表示;然后定义了仿人拆字的字元集,并给出了易混淆笔划字元的多归类容错编码;接着给出了笔划字元的顺序判断规则和归结了36类简单常用字的部首子结构,并给出冗余的容错编码;进而建立了仿人构字的汉字编码规则和具有容错性的多模板字典,并对《新华字典》中收录的10000余个单字汉字进行了标准编码,重码率为0.48%;最后对HCCORG和NKIM手写体汉字库中的100个手写体汉字进行了仿真识别,识别正确率为96%。试验结果表明,这种编码方法可生成多模板字典,不仅对手写体汉字变形具有较好的容错性,且重码率和误识率较低。 相似文献
12.
SVM在小字符集脱机手写体汉字识别中的应用研究 总被引:5,自引:2,他引:5
提出将SVM方法引入小字符集脱机手写体汉字识别,利用较少的训练样本就可以达到比较理想的识别效果,并在小校本学习的情况下同最小距离法和多重相似度法的识别率和识别时间作了比较,说明SVM方法在小字符集脱机手写体汉字识别中实用性。 相似文献
13.
14.
基于统计与神经元方法相结合的手写体相似字识别 总被引:6,自引:0,他引:6
本文提出了一种基于统计识别方法与人工神经元网络相结合的手写体相似汉字识别方法。该方法充分利用了统计识别方法和神经元网络识别方法的优点,不仅显著地提高了相似字的识别率,而且有效地提高了系统的整体性能。对相似字的识别率由79.02%提高到84.32% ,提高了五个百分点,整体识别率提高了1.3个百分点。 相似文献
15.
16.
手写体数字识别是图像处理与模式识别中具有较高实用价值的研究热点之一。在保证较高识别精度的前提下,为提高手写体数字的识别速度,提出了一种基于SVM的快速手写体数字识别方法。该方法通过各类别在特征空间中的可分性强度确定SVM最优核参数,快速训练出SVM分类器对手写体数字进行分类识别。由于可分性强度的计算是一个简单的迭代过程,所需时间远小于传统参数优化方法中训练相应SVM分类器所需时间,故参数确定时间被大大缩减,训练速度得到相应提高,从而加快了手写体数字的识别过程,同时保证了较好的分类准确率。通过对MNIST手写体数字库的实验验证,结果表明该算法是可行有效的。 相似文献
17.
基于笔划宽度提取的手写体汉字归一化方法 总被引:1,自引:0,他引:1
手写体汉字书写变形是手写体汉字识别预处理阶段的重要问题之一。为了有效地改善手写体汉字变形并识别手写体汉字,提出了手写体汉字笔划宽度提取,以及基于提取出的笔划宽度的手写体汉字归一化的方法。用上述方法在计算机上进行仿真实验,实验结果表明,手写体汉字归一化的方法既能保证原手写体汉字的形状结构特征不变,并可有效地改善手写体汉字变形差异。 相似文献
18.
以往的手写汉字识别方法,无论应用何种特征提取方法,在生成标准模板时,一般都采用样本特征的算术平均值。文章提出了一种使用样本特征的分位数组合生成标准模板的方法,通过其在手写汉字识别中的应用表明,该方法比基于均值的标准模板有更好的鲁棒性,且在不增加任何计算量和算法复杂度的前提下,使系统的识别性能有所提高;同时该算法还有很好的推广性能,可以应用到各种特征提取算法中。 相似文献