共查询到20条相似文献,搜索用时 109 毫秒
1.
2.
3.
脱机手写体汉字识别具有重要的理论意义和实践价值,目前在小字符集方面取得了比较好的效果.对大字符集来说,仍在进行研究.为了解决大字符集的手写体汉字识别问题,一般采用多层分类的方法.根据汉字的繁简和字型结构,构造了五级的二叉树SVM模型进行汉字集的粗分类,给出了模型的构造方法.在每级分类识别当中,采用不同的汉字特征和核函数,利用"one-against-rest"算法进行细分类识别.仿真实验表明,该方法能对手写体汉字分级分类识别,具有较高的识别率. 相似文献
4.
SVM在小字符集脱机手写体汉字识别中的应用研究 总被引:5,自引:2,他引:5
提出将SVM方法引入小字符集脱机手写体汉字识别,利用较少的训练样本就可以达到比较理想的识别效果,并在小校本学习的情况下同最小距离法和多重相似度法的识别率和识别时间作了比较,说明SVM方法在小字符集脱机手写体汉字识别中实用性。 相似文献
5.
6.
7.
以HCL2000手写汉字库为基础,构建了一个实验系统,对一级汉字库3 755个汉字,使用不同的汉字特征和不同的分类距离,进行了一系列比较实验,探讨了大字符集脱机手写体汉字识别的粗分类问题,得到了一些有用的结论. 相似文献
8.
9.
脱机手写体汉字识别的支持向量机方法研究 总被引:2,自引:0,他引:2
提出一种采用二叉树粗分类与SVM细分类结合的分类识别方法,充分发挥SVM在二类分类问题方面相对于单一SVM方法的优势 .实验结果表明提出的识别方法在解决复杂多分类脱机手写体汉字分类识别问题上有效的提高了分类精度和速度. 相似文献
10.
结合距离分类器的神经网络手写体汉字识别 总被引:1,自引:1,他引:1
手写体汉字识别技术中如何解决复杂的大类别识别问题,是汉字识别中的一个难点。该文介绍了基于笔划的手写体汉字特征抽取方法,提出了一种基于预分类的神经网络汉字识别方法,该方法用一个传统的距离分类器先对汉字进行预分类,神经网络根据预分类结果进行有选择的训练和识别,能有效解决神经网络大类别模式识别中的训练和分类问题,学习时间很短,识别效果较理想。 相似文献
11.
Khue Hiang Chan 《Pattern recognition》2002,35(5):1007-1023
Off-line handwritten oriental character recognition is a difficult task due to the large category and stroke variety. These oriental characters are made up of components known as radicals, which are often written in a distorted proportion and size. All these factors lead to a difficult recognition problem, which unfortunately cannot be solved using direct classification approach like the neural network classifier and a preprocessing module. This paper proposes several novel preprocessing approaches and synergy of classifiers to achieve good performance. Novel classification approaches, comprising rough and coarse classification modules are proposed which when combined appropriately produced a high-performance recognition system capable of producing high accuracy classification in off-line oriental character recognition. The recognition accuracy of the system is a high of 97% and a 99% for the top 5 candidate selection scores. 相似文献
12.
基于决策树的汉语未登录词识别 总被引:13,自引:0,他引:13
未登录词识别是汉语分词处理中的一个难点。在大规模中文文本的自动分词处理中,未登录词是造成分词错识误的一个重要原因。本文首先把未登录词识别问题看成一种分类问题。即分词程序处理后产生的分词碎片分为‘合’(合成未登录词)和‘分’(分为两单字词)两类。然后用决策树的方法来解决这个分类的问题。从语料库及现代汉语语素数据库中共统计出六类知识:前字前位成词概率、后字后位成词概率、前字自由度、后字自由度、互信息、单字词共现概率。用这些知识作为属性构建了训练集。最后用C4.5算法生成了决策树。在分词程序已经识别出一定数量的未登录词而仍有分词碎片情况下使用该方法,开放测试的召回率:69.42%,正确率:40.41%。实验结果表明,基于决策树的未登录词识别是一种值得继续探讨的方法。 相似文献
13.
为了研制高性能的车辆牌照自动识别系统,在详细分析车辆牌照上英文和数字字符结构特点的基础上,选择字符图象中的闭合曲线作为其整体特征,将笔画端点,三叉点和四叉点作为其细节特征,同时将笔画中的拐角点作为其辅助结构特征,三者可分别用于字符的粗分类,细分类和相似字符区分,进而提基于图论和细节点特征的闭合曲线检测算法以及基于二值图象外边缘轮廓线的笔画拐角点检测算法,将上述结构特征用于车辆牌照上英文和数字字符识别,测得识别率达96%,用PⅢ550计算机完成结构特征抽取和字符识别所用时间约20ms/字符,表明这些结构特征适用于车辆牌照上英文和数字字符的快速识别。 相似文献
14.
15.
Researchers have thus far focused on the recognition of alpha and numeric characters in isolation as well as in context. In this paper we introduce a new genre of problems where the input pattern is taken to be a pair of characters. This adds to the complexity of the classification task. The 10 class digit recognition problem is now transformed into a 100 class problem where the classes are {00,…, 99}. Similarly, the alpha character recognition problem is transformed to a 26×26 class problem, where the classes are {AA,…, ZZ}. If lower-case characters are also considered the number of classes increases further. The justification for adding to the complexity of the classification task is described in this paper. There are many applications where the pairs of characters occur naturally as an indivisible unit. Therefore, an approach which recognizes pairs of characters, whether or not they are separable, can lead to superior results. In fact, the holistic method described in this paper outperforms the traditional approaches that are based on segmentation. The correct recognition rate on a set of US state abbreviations and digit pairs, touching in various ways, is above 86%. 相似文献
16.
基于遗传算法的汉语未登录词识别 总被引:1,自引:0,他引:1
针对汉语分词处理中未登录词识别这一难点,提出一种应用遗传算法识别的新方法.该方法扩大了分词碎片容量,将未登录词识别问题看成二值分类问题,即在预处理后产生的分词碎片中,单字存在"可组合"和"不可组合"两类,采用遗传算法先将分词碎片中的单字词确定下来,然后将其余相邻单字组合,完成未登录词识别.实验结果表明,该方法可有效地解决未登录词识别问题,提高未登录词识别的精确率和召回率. 相似文献
17.
侯雪梅 《计算机工程与应用》2009,45(19):150-152
针对目前在噪音环境下语音识别系统性能较差的问题,利用小波神经网络融合了小波变换良好的时频局域化性质和RBF神经网络具有最佳分类能力和辨识能力等特性。构建了一个用小波基替代RBF网络中激活函数的小波-RBF神经网络结构,并采用全监督训练算法,实现了基于小波-RBF网络的抗噪语音识别系统。实验结果表明该系统比RBF网络具有更好的识别效果,尤其在噪声环境下,具有更强的鲁棒性。 相似文献
18.
19.
首先介绍了对手建模的几种不同的类型,引出行为建模中的意图识别问题;随后针对意图识别的过程、分类、主要研究方法、研究展望以及实际应用进行了归纳分析,总结并讨论了相关领域取得的最新研究成果;最后指出意图识别目前存在的不足以及未来的发展方向。 相似文献