期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

Recognition of hand-printed Chinese characters using decision trees/machine learning C4.5 system

A. Amin S. Singh 《Pattern Analysis & Applications》1998,1(2):130-141

Recognition of Chinese characters has been an area of major interest for many years, and a large number of research papers and reports have already been published in this area. There are several major problems with Chinese character recognition: Chinese characters are distinct and ideographic, the character size is very large and a lot of structurally similar characters exist in the character set. Thus, classification criteria are difficult to generate. This paper presents a new technique for the recognition of hand-printed Chinese characters using the C4.5 machine learning system. Conventional methods have relied on hand-constructed dictionaries which are tedious to construct and difficult to make tolerant to variation in writing styles. The paper discusses Chinese character recognition using theHough transform for feature extraction and C4.5 system. The system was tested with 900 characters written by different writers from poor to acceptable quality (each character has 40 samples) and the rate of recognition obtained was 84%. 相似文献

2.

基于小波变换的图像汉字笔划特征提取方法

訾兴建王建平《计算机工程与应用》2012,48(12):168-172

借鉴仿生模式识别的认知观点,从汉字的构造机理和人类认识汉字的习惯角度出发,提出一种基于小波变换的图像汉字识别方法。制定了图像汉字笔划特征提取的具体规则,采用小波变换的方法对图像汉字边缘和笔划轮廓进行检测,通过有效提取图像汉字笔段信息,进行笔段合成,生成汉字或汉字的基本笔划。仿真实验结果表明,这种方法提高了图像汉字笔划特征提取的准确率和稳定性,对于印刷体和书写较规范的手写体图像汉字具有极高的识别率。相似文献

3.

基于语义的手写汉字识别模型

白宇徐庆新刘斌《计算机工程与应用》2005,41(7):76-78

目前,已经有很多文献阐述了不同的手写汉字识别算法,但是绝大多数算法都是针对单个汉字进行识别的,所以对于比较容易混淆的字,它们的识别效果都不好。该文针对这个问题,在单个汉字识别的基础上,结合汉语字典,加入了对前后汉字的语义考虑,大大地提高了这些容易混淆的汉字的识别率。相似文献

4.

面向连续字符识别的手写汉字部件集及统计规律

赵巍李春娣刘家锋唐降龙《中文信息学报》2006,20(5):60-66

本文面向手写字符序列输入信号连续识别研究,分析了汉字及联机手写文本的特点,提出并构建了手写汉字部件集。基于该部件集,完成了GB2312-80的6,763个汉字的部件拆分编码和部件集的测试。统计编码数据发现,汉字依手写部件数的分布规律呈对数正态分布。本文从统计学和字符识别技术的角度对手写部件的构字能力作了分析和讨论,部件集的设计方案在部件选择和汉字拆分上均满足设计要求。实验表明,基于手写部件构造的部件识别器对手写汉字和连续汉字的部件识别率分别达到70.21%和58.49%。相似文献

5.

基于小波的车牌汉字特征提取 总被引：15，自引：0，他引：15

下载免费PDF全文

潘翔叶修梓张三元《中国图象图形学报》2003,8(10):1218-1222

车牌识别系统是智能交通不可或缺的一部分.在车牌识别系统中,车牌首位汉字的特征提取和识别是一个难点.为此,将小波的多分辨率特性应用于车牌汉字特征的提取,提出了一种直接从灰度图象提取车牌汉字特征的提取方法.该方法首先提取图象的小波矩和基于小波分解的区域密度特征,然后以识别率好坏为最优依据,进行特征分量排序和选择,最后把特征矢量送入BP神经网络进行字符识别.该方法避免了一些传统汉字特征提取方法需要对图象进行二值化操作而造成的汉字字符结构信息丢失.提取的特征有效地反映了车牌汉字的局部和全局特征.实验结果表明该特征提取方法可以得到比较好的识别效果. 相似文献

6.

基于Rough集理论的车牌汉字特征提取

王希雷《计算机技术与发展》2007,17(6):26-28,227

车牌首位汉字特征提取和识别是一个难点。传统的车牌汉字的特征提取方法是在具有先验知识的情况下进行的,先验知识的好坏对结果有着非常重要的影响。Rough集,理论上可以从数据集中直接提取特征,不依靠先验知识。先用Rough集理论提取待识别汉字的特征,再用这些特征进行模板匹配。实验结果表明该方法有比较好的识别效果。相似文献

7.

基于Rough集理论的车牌汉字特征提取

王希雷《微机发展》2007,17(6):26-28

车牌首位汉字特征提取和识别是一个难点。传统的车牌汉字的特征提取方法是在具有先验知识的情况下进行的,先验知识的好坏对结果有着非常重要的影响。Rough集,理论上可以从数据集中直接提取特征,不依靠先验知识。先用Rough集理论提取待识别汉字的特征,再用这些特征进行模板匹配。实验结果表明该方法有比较好的识别效果。相似文献

8.

基于双弹性网格的手写体汉字识别 总被引：5，自引：0，他引：5

陈章辉黄小晖陈鹏飞李文龙朱思尧《计算机应用》2009,29(2):395-397

特征提取是手写体汉字识别的关键,目前四方向网格特征已被实验证实是一种较好的手写体汉字特征。针对通常的纵横弹性网格对汉字“撇、捺”笔画特征提取的不足,提出一种新的网格构造技术——对角弹性网格,它由45°和135°的对角直线构成,将汉字图像划分为多个菱形,能够很好地适应汉字在“撇、捺”方向的变化。将这两种网格单独,以及相互组合成双网格等情况分别进行手写体识别实验,实验结果验证了对角弹性网格的有效性和双弹性网格的高识别率性。相似文献

9.

低质量汉字的分块搜索两级识别法

刘毅毛震东张冬明张勇东林守勋《计算机辅助设计与图形学学报》2012,24(2):170-175

由于汉字笔画复杂,从视频中提取的汉字图像质量往往较差,采用传统光学字符识别(OCR)的结果不理想.为了解决低质量汉字图像的识别问题,提出一种基于分块搜索的两级识别方法.首先建立汉字图像的分块结构并模仿低质量汉字生成训练集,然后对训练集中各分块图像应用主成分分析提取特征并建立索引.待识别图像应用分块搜索和投票的方式从索引中获取候选汉字集合(一级识别),再根据投票结果的显著性辅以全局结构特征匹配识别汉字(二级识别).实验结果证明,该方法对于低质量汉字图像比普通的OCR方法具有更高的识别率. 相似文献

10.

手写汉字的集群识别 总被引：3，自引：0，他引：3

姜珊孙玉方《中文信息学报》1998,12(4):2-9

为了降低单个汉字的分辨率,论文分析了通用的汉字识别模型,并在此基础上建立了适于多字识别的集群识别模型。为了充分论证集群识别模型的观点,本文从理论证明和实验两方面获得支持根据。实验结果表明基于多字识别模型的集群识别能可靠提高对连续文字的识别效果,是手写汉字识别中很有希望的发展方向。相似文献

11.

基于不对称性的相似汉字识别方法

孙羽菲陈艳张玉志《中文信息学报》2004,18(2):52-58

相似字识别的正确与否对整个识别系统的准确性和可用性都有着极大的影响。在实际应用中,我们发现相似汉字之间的误识存在不对称性,并对这种不对称现象的成因进行了细致的探讨和分析。基于这种不对称性,本文提出了一种分类的部分空间方法来解决相似字的识别问题。相似字按其结构特点被分成若干基本类别,不同类别在相应的部分空间提取不同的特征进行比较,以达到正确识别相似字的目的。实验结果表明了本方法的有效性,相似字识别的准确性得到了很大的提高,其中易错相似字的识别正确率平均提高了4.55个百分点,不易错相似字的识别正确率平均提高了0.38个百分点。相似文献

12.

小类别数手写汉字建模 总被引：4，自引：1，他引：3

薛炳如杨静宇《中文信息学报》1999,13(6):35-41

在手写汉字识别的研究中,鲜有研究者提出建立手写汉字的数学模型,本文在这方面作了一些探讨。建模的目的通常有两个:一是手写汉字的表示或描述,二是手写汉字的识别。本文针对小类别数手写汉字,在骨架图形的基础上,把手写汉字看作孤枝、孤环和部件的集合,并定义三者之间的方位关系,从而建立手写汉字的数学模型。实验表明,该模型用于识别,效果良好。相似文献

13.

关于手写汉字切分方法的思考

邵洁成瑜《微机发展》2006,16(6):184-186

汉字切分是汉字识别系统中必不可少的组成部分,但由于手写体汉字的书写多变而随意,极大地增加了汉字分割的难度。文中回顾了近十年来脱机手写体汉字分割的发展历程及在发展中涌现的一些主要类型的切分方法,分析了每一类方法的优缺点及其包含的各个分支。最后,参考各种方法的优缺点,对今后的手写体汉字分割发展方向进行了展望。相似文献

14.

卷积深度神经网络的手写汉字识别系统

闫喜亮王黎明《计算机工程与应用》2017,53(10):246-250

针对传统两级手写汉字识别系统中手写汉字识别的特征提取方法的限制问题,提出了一种采用卷积神经网对相似汉字自动学习有效特征进行识别的系统方法。该方法采用来自手写云平台上的大数据来训练模型,基于频度统计生成相似子集,进一步提高识别率。实验表明,相对于传统的基于梯度特征的支持向量机和最近邻分类器方法,该方法的识别率有一定的提高。相似文献

15.

面向连续叠写的高精简中文手写识别方法研究

苏统华戴洪良张健马培军邓胜春《计算机科学》2015,42(7):300-304

连续手写识别是中文手写输入技术的核心,自然、快捷地输入中文信息一直是模式识别乃至人工智能领域追求的目标。提出了一种有效克服小屏幕限制的连续叠写汉字识别方法。该方法基于切分-识别集成的解码框架,先使用过切分算法处理输入的书写轨迹;然后启用一种新颖的感知机算法判定字符的边界;随后采用来自字符分类模型、几何模型和语言模型的多种上下文信息进行路径解码。为适应不同类型的移动终端,特别提出了一种高效压缩字符分类模型的方法,以有效减少字符识别过程对存储和内存的占用。该识别方法已在Android平台上部署,并进行了大规模的测试实验。实验结果证实了该识别方法的性能和效率。相似文献

16.

完全基于结构知识的汉字笔画抽取方法 总被引：17，自引：1，他引：16

孙星明杨茂江刘国华胡运发《计算机研究与发展》2000,37(5):543-550

从汉字结构知识出发,提出了一种从汉字图像直接抽取笔画的算法,给出了抽取横、竖、撇、捺４种笔画的完全量化的昨去除不同字体的笔画修饰噪声的规则,该方法较好地解决了各笔画的相交、相连及噪声排队等总理２,综在汉字识别及字体自动生成等汉字信息处理方面有重要作用。相似文献

17.

SVM多值分类器在脱机手写体相似汉字识别中的应用 总被引：7，自引：0，他引：7

封筠王彦芳杨扬王小平刘永军《计算机工程与应用》2004,40(27):200-202

相似字的普遍存在是影响脱机手写体汉字识别率低的主要原因之一。论文研究了支持向量机(SVM)多值分类器在手写相似汉字识别中的应用,所提出的方法采用了小波弹性网格技术提取汉字的特征,通过实验比较了三种不同的SVM分类器组合策略的分类效果。相似文献

18.

基于改进inception的脱机手写汉字识别

陈站邱卫根张立臣《计算机应用研究》2020,37(4):1244-1246,1251

由于字形的复杂多变,脱机手写汉字的识别一直是模式识别的难题,深度卷积神经网络的发展为其提供了一种直接有效的解决方案。研究基于inceptions 结构神经网络的脱机手写汉字识别,提出了一种inception结构的改进方法,它具有结构更加简单、网络深度扩展更加容易、需要的训练参数量更少的优点。该方法在数据集CISIA-HWDB1.1 上进行了实验验证,采用随机梯度下降优化算法,模型达到了96.95%的平均准确率。实验结果表明,使用改进的inception结构在图像分类上具有更好的鲁棒性,更容易扩展到其他应用领域。相似文献

19.

汉字笔段形成规律及其提取方法 总被引：8，自引：0，他引：8

刘峡壁贾云得《计算机学报》2004,27(3):389-395

该文从点阵图像行(列)连通像素段出发，研究汉字图像的笔段构成，发现汉字点阵图像仅由阶梯型笔段和平行长笔段两种类型的笔段构成，并归纳出阶梯型笔段和平行长笔段的形成规律．以笔段形成规律为基础提出了汉字笔段的提取方法，该方法将像素级汉字图像转变为以笔段为单位的图像，有利于汉字识别、汉字细化及汉字字体的自动生成．最后该文给出了印刷体和手写体汉字笔段提取的实验结果．相似文献

20.

基于深度学习的异噪声下手写汉字识别的研究

任晓文王涛李健宇赵祥宁郭一娜《计算机应用研究》2019,36(12)

针对手写汉字字符图像识别率受随机噪声影响的问题,提出了一种基于深度学习与抑制噪声相结合的新算法。该算法主要应用于拥有随机噪声的手写汉字字符图片,是其在Python环境下,利用Caffe平台建立抑制噪声与卷积神经网络相结合的模型,通过模型移除噪声并正确识别手写汉字。另外,新算法去除噪声的同时对字符形态没有改变,保留了汉字的原始信息。结果在其两种不同的噪声（高斯噪声和椒盐噪声）下,逐渐提升其噪声强度,进行多次实验,同时与其他方法对比,最终得到其平均识别率为97.05%。实验结果表明,该模型和算法具有效率快、识别能力强的优点。相似文献