首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
2.
建立公开、权威的蒙古文手写数据库是研究和开发蒙古文手写识别系统的基础。该文在蒙古文编码、构词和语法的研究基础上,公开了一个蒙古文大词汇量脱机手写数据库MHW,其中训练集由5 000个单词构成,每个词采集了20个样本,共包含10万样本,测试集Ⅰ包含5 000样本,测试集Ⅱ包含14 085样本。该文利用蒙古文文字长度可变特征研究了自动错误检测算法,提高了字库的可靠性。在三种常用手写识别模型上评估了字库的性能,其中基于循环神经网络的模型表现出最佳性能,在字典受限条件下测试集Ⅰ的词错误率达到2.20%,测试集Ⅱ达到了5.55%。  相似文献   

3.
基于SVM的脱机手写汉字机器学习识别方法研究   总被引:3,自引:1,他引:3  
提出了一种模糊统计方法的脱机手写体汉字特征提取方法.结合小波网格方法和汉字笔画密度特征方法对汉字进行特征提取,并运用支持向量机方法,通过机器学习对脱机手写汉字识别。仿真实验表明,支持向量机方法在脱机手写汉字识别中有良好的识别性能及模糊统计方法是有效的。  相似文献   

4.
隐马尔科夫模型(HMM)对序列数据有很强的建模能力,在语音和手写识别中都得到了广泛的应用。利用HMM研究蒙古文手写识别,首先需要解决的问题是手写文字的序列化。从蒙古文的构词和书写特点看,蒙古文由多个字素从上到下串联构成。选择字素集合和词的字素分割是手写识别的基础,也是影响识别效果的关键因素。该文根据蒙古文音节和编码知识确定了蒙古文字母集合,共包括1 171个字母。通过相关性处理、HMM排序筛选等手段得到长字素集合,共包括378个字素。对长字素经过人工分解,获得了50个短字素。最后利用两层映射给出了词转字素序列的算法。为了验证长短字素在手写识别中的效果,我们在HTK(hidden Markov model toolkit)环境下利用小规模字库实现了手写识别系统,实验结果表明短字素比长字素有更好的性能。文中给出的字素集合和词转字素序列的算法为后续基于HMM的蒙古文手写识别研究奠定了基础。  相似文献   

5.
王建平  陈军  徐晓冰  王熹徽 《微机发展》2006,16(10):104-107
提出了一种模糊统计方法的脱机手写体汉字特征提取方法,结合小波网格方法和汉字笔画密度特征方法对汉字进行特征提取,并运用支持向量机方法,通过机器学习对脱机手写汉字识别。仿真实验表明,支持向量机方法在脱机手写汉字识别中有良好的识别性能及模糊统计方法是有效的。  相似文献   

6.
《微型机与应用》2015,(8):56-59
针对目前脱机手写字符识别计算量大,对字体字形都有一定的要求,提出了主要以字符矩阵中01变换频率为基础,从字符的整体和局部特征出发进行分析识别的算法。此算法缩减了计算量并对所需局部信息进行放大,在一定程度上避免了传统采用分类器方法的错误传导,提高了字符的识别率,易于实现移植和扩展。  相似文献   

7.
文章介绍了利用K-近邻分类器实现对手写字符的识别,并给出了OpenCV中相应库函数。本文重点介绍如何实现字符识别,对单词及整句识别有所讨论,但不作为重点。  相似文献   

8.
脱机自由手写英文单词的识别   总被引:1,自引:0,他引:1  
介绍了一个基于隐马尔科夫模型的、采用模糊分割方式的脱机手写英文单词识别系统。该系统由图像预处理、特征提取、基于HMM的训练和识别四个模块组成。图像预处理中包括二值化、平滑去噪、倾斜校正和参考线提取。然后通过宽度不固定的滑动窗提取特征,前两组特征是整体形状和象素分布特征,另外又引入了Sobel梯度特征。HMM模型采用嵌入式的Baum-Welch算法训练,这种训练方式无需分割单词。最后用Viterbi算法识别。对字典中的每个单词,采用字母模型线性连接成单词模型。  相似文献   

9.
离线手写汉字的识别仍然是模式识别中的一个最困难的问题,而特征提取是解决这个问题的关键.本文提出一种基于多尺度小波分解的离线手写汉字的特征提取方法.通过表示为灰度图像的手写汉字的多尺度小波分解,能在不同尺度下抽取字符的特征.在较大的尺度下,抽取字符少量的结构特征,可用于在巨大的汉字候选类集合中进行字符的粗归类;在较小的尺度下,抽取字符的细节特征,可用于在较小的汉字候选类集合中进行字符的细归类(识别).这样一种从粗到细的策略,既减少了匹配的时间,又保持了识别的精度.  相似文献   

10.
本文提出了一种新的组合特征.通过时方向线素特征、轮廓特征和有效行特征进行有效组合形成一组新的组合特征.该新的组合特征无需对样本进行细化等操作,减少了前期的预处理工作量,也减少了因细化变形而引起的误识,用BP人工神经网络作为分类器,实验表明效果良好.  相似文献   

11.
黄弋石  梁艳  陆峥嵘 《软件》2013,34(5):67-70,90
为了解决手机的汉字联机识别,我们提供了完整的解决方案。先定义了一套六组基本定义,形成一种特殊的但是很简单的图形描述方法。将汉字楷书的常用字的笔画,进行统计归纳归类,找到有限的笔画组成。使用基本定义,描述楷书的独立笔画,这些描述是互不相同的。回避了传统的复杂的二维图形学的方法。经过穷举法验证,几乎每个常用汉字的拆解的内容,都互不相同,所以从逻辑上可判定这种方法是有效的。也提供并公布对汉字行书、草书的部分解决方案。形成了一个手机汉字连笔识别的体系。  相似文献   

12.
FPTA快速细化算法在脱机手写体汉字识别中的应用   总被引:4,自引:0,他引:4  
阐述了将FPTA快速细化算法应用于脱机手写体汉字识别中,该算法提出了一种11象素支撑窗口,能有效地抑制样本中的“毛刺“,快速提取保持原始汉字样本连通性和拓扑性的骨架,它的处理速度和细化质量明显优于现有的一些细化算法,根据实验结果,该算法是一种有效的汉字样本细化算法。  相似文献   

13.
This paper presents a statistical approach for rule-base generation of handwriting recognition. The proposed method integrates the heuristic feature selection with the statistical evaluation and thus improves the performance of the rule generation as well as of the fuzzy handwriting recognition system. Fuzzy statistical measures are employed to identify relevant features from a given large handwriting database. First an automatic rule-base mechanism is presented. To reduce the time needed for this generation mechanism an additional heuristic feature selection step is introduced. Tests show that this generated rule-base improved the recognition results over previous approaches.  相似文献   

14.
黄弋石  梁艳 《软件》2012,(7):141-144,147
为了识别较为工整的英文联机手写文字,定义了适合每个字母的字元,一共有七组不同的基本子元。使用简单的二维图形学,与简单的数学计算,可以确定每个不同字母的字元性质。使用这些字元,对大小写字母与数字实施具体组合定义,因为每个字符的具体定义内容,完全各不相同,依照逻辑可以推断,能够成功迅速的识别不连笔的较为工整的英文手写字符。这种建模方法,如果移植到类似的不同国家或地区的文字,如果笔画工整,每个字符又互相独立,那么在逻辑上就可以判定很有应用价值。  相似文献   

15.
皮桂林  赵晖 《计算机工程》2012,38(18):147-150
延迟笔画处理是维吾尔文联机手写体单词识别中的难点,样本数据格式为一串具有时序性的序列,造成字母主笔画和延迟笔画在序列位置上多半不连续,很大程度上增加了延迟笔画处理和单词识别的难度。为此,提出一种维吾尔文延迟笔画处理方法,其中包括延迟笔画查找与投影,实验结果证明该方法具有良好的效果,单词识别准确率达到93.71%。  相似文献   

16.
梁艳  黄弋石 《微机发展》2005,15(10):14-15
为使汉字草体计算机输入识别精简化,对汉字草书手写体,实施分类与亚分类等类似处理。参照人的汉字草书书写习惯,提出模糊识别汉字草体手写输入算法。结合各种具体编码约定,可使软件编写思路清晰、减少编程工作量、提高编程工作效率。预见该算法能使最终软件短小有力。该思路可类推地移植到汉字行书、正楷与其他字体,也可移植到英文或其他少数民族文字,但显然具体处理方法不同。  相似文献   

17.
英文手写识别既是模式识别问题又是一个搜索问题,其计算复杂度非常高.针对这个问题,提出了一些新的方法来解决联机英文手写识别问题.首先,运用一些先验知识对所获得的基线进行调整;其次,针对英文识别过程的复杂度太高,提出了快速有效的解码算法——主笔划分层构筑Viterbi算法;最后,将多阶段的分类信息融合到决策过程中,较大幅度地提高了系统的性能.在Unipen训练集和实验室数据集上测试取得了良好的效果.  相似文献   

18.
基于支持向量机的手写体相似字识别   总被引:22,自引:3,他引:19  
本文提出对手写相似汉字进行识别的支持向量机方法。该方法与人工神经网络一样适用于小规模分类,但由于支持向量机依据结构风险最小化原则,因此泛化能力更强。并且,由于支持向量机算法是一个凸二次优化问题,能够保证找到的极值解就是全局最优解。本文用支持向量机算法对三组手写相似汉字进行了识别,取得了较好的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号