共查询到18条相似文献,搜索用时 46 毫秒
1.
2.
建立公开、权威的蒙古文手写数据库是研究和开发蒙古文手写识别系统的基础。该文在蒙古文编码、构词和语法的研究基础上,公开了一个蒙古文大词汇量脱机手写数据库MHW,其中训练集由5 000个单词构成,每个词采集了20个样本,共包含10万样本,测试集Ⅰ包含5 000样本,测试集Ⅱ包含14 085样本。该文利用蒙古文文字长度可变特征研究了自动错误检测算法,提高了字库的可靠性。在三种常用手写识别模型上评估了字库的性能,其中基于循环神经网络的模型表现出最佳性能,在字典受限条件下测试集Ⅰ的词错误率达到2.20%,测试集Ⅱ达到了5.55%。 相似文献
3.
基于SVM的脱机手写汉字机器学习识别方法研究 总被引:3,自引:1,他引:3
提出了一种模糊统计方法的脱机手写体汉字特征提取方法.结合小波网格方法和汉字笔画密度特征方法对汉字进行特征提取,并运用支持向量机方法,通过机器学习对脱机手写汉字识别。仿真实验表明,支持向量机方法在脱机手写汉字识别中有良好的识别性能及模糊统计方法是有效的。 相似文献
4.
隐马尔科夫模型(HMM)对序列数据有很强的建模能力,在语音和手写识别中都得到了广泛的应用。利用HMM研究蒙古文手写识别,首先需要解决的问题是手写文字的序列化。从蒙古文的构词和书写特点看,蒙古文由多个字素从上到下串联构成。选择字素集合和词的字素分割是手写识别的基础,也是影响识别效果的关键因素。该文根据蒙古文音节和编码知识确定了蒙古文字母集合,共包括1 171个字母。通过相关性处理、HMM排序筛选等手段得到长字素集合,共包括378个字素。对长字素经过人工分解,获得了50个短字素。最后利用两层映射给出了词转字素序列的算法。为了验证长短字素在手写识别中的效果,我们在HTK(hidden Markov model toolkit)环境下利用小规模字库实现了手写识别系统,实验结果表明短字素比长字素有更好的性能。文中给出的字素集合和词转字素序列的算法为后续基于HMM的蒙古文手写识别研究奠定了基础。 相似文献
5.
6.
7.
8.
脱机自由手写英文单词的识别 总被引:1,自引:0,他引:1
介绍了一个基于隐马尔科夫模型的、采用模糊分割方式的脱机手写英文单词识别系统。该系统由图像预处理、特征提取、基于HMM的训练和识别四个模块组成。图像预处理中包括二值化、平滑去噪、倾斜校正和参考线提取。然后通过宽度不固定的滑动窗提取特征,前两组特征是整体形状和象素分布特征,另外又引入了Sobel梯度特征。HMM模型采用嵌入式的Baum-Welch算法训练,这种训练方式无需分割单词。最后用Viterbi算法识别。对字典中的每个单词,采用字母模型线性连接成单词模型。 相似文献
9.
离线手写汉字的识别仍然是模式识别中的一个最困难的问题,而特征提取是解决这个问题的关键.本文提出一种基于多尺度小波分解的离线手写汉字的特征提取方法.通过表示为灰度图像的手写汉字的多尺度小波分解,能在不同尺度下抽取字符的特征.在较大的尺度下,抽取字符少量的结构特征,可用于在巨大的汉字候选类集合中进行字符的粗归类;在较小的尺度下,抽取字符的细节特征,可用于在较小的汉字候选类集合中进行字符的细归类(识别).这样一种从粗到细的策略,既减少了匹配的时间,又保持了识别的精度. 相似文献
10.
11.
12.
FPTA快速细化算法在脱机手写体汉字识别中的应用 总被引:4,自引:0,他引:4
阐述了将FPTA快速细化算法应用于脱机手写体汉字识别中,该算法提出了一种11象素支撑窗口,能有效地抑制样本中的“毛刺“,快速提取保持原始汉字样本连通性和拓扑性的骨架,它的处理速度和细化质量明显优于现有的一些细化算法,根据实验结果,该算法是一种有效的汉字样本细化算法。 相似文献
13.
This paper presents a statistical approach for rule-base generation of handwriting recognition. The proposed method integrates the heuristic feature selection with the statistical evaluation and thus improves the performance of the rule generation as well as of the fuzzy handwriting recognition system. Fuzzy statistical measures are employed to identify relevant features from a given large handwriting database. First an automatic rule-base mechanism is presented. To reduce the time needed for this generation mechanism an additional heuristic feature selection step is introduced. Tests show that this generated rule-base improved the recognition results over previous approaches. 相似文献
14.
为了识别较为工整的英文联机手写文字,定义了适合每个字母的字元,一共有七组不同的基本子元。使用简单的二维图形学,与简单的数学计算,可以确定每个不同字母的字元性质。使用这些字元,对大小写字母与数字实施具体组合定义,因为每个字符的具体定义内容,完全各不相同,依照逻辑可以推断,能够成功迅速的识别不连笔的较为工整的英文手写字符。这种建模方法,如果移植到类似的不同国家或地区的文字,如果笔画工整,每个字符又互相独立,那么在逻辑上就可以判定很有应用价值。 相似文献
15.
16.
为使汉字草体计算机输入识别精简化,对汉字草书手写体,实施分类与亚分类等类似处理。参照人的汉字草书书写习惯,提出模糊识别汉字草体手写输入算法。结合各种具体编码约定,可使软件编写思路清晰、减少编程工作量、提高编程工作效率。预见该算法能使最终软件短小有力。该思路可类推地移植到汉字行书、正楷与其他字体,也可移植到英文或其他少数民族文字,但显然具体处理方法不同。 相似文献
17.