首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 54 毫秒
1.
蒙古文的一大特点是字符无缝连接,因此一个蒙古文单词有多种字符划分方式。根据蒙古文这一特点,该文提出了多尺度蒙古文脱机手写识别方法,即让一个手写蒙古文单词图像对应多种目标序列,用多个目标序列同时约束训练模型,使得模型更加精准地学习手写图像的细节信息和蒙古文构词规则。该文提出了“十二字头”码、变形显现码和字素码3种字符划分方法,且拥有相互包含关系,即“十二字头”码可以分解为变形显现码、变形显现码可以进一步分解为字素码。多尺度模型首先用多层双向长短时记忆网络对序列化手写图像进行处理,之后加入第一层连接时序分类器做“十二字头”码序列的映射,然后是第二层连接时序分类器做变形显现码序列的映射,最后是第三层连接时序分类器做字素码序列的映射。用三个连接时序分类器损失函数的和作为模型的总损失函数。实验结果表明,该模型在公开的蒙古文脱机手写数据集MHW上表现出了最佳性能,在简单的最佳路径解码方式下,测试集Ⅰ上的单词识别准确率为66.22%、测试集Ⅱ上为63.97%。  相似文献   

2.
隐马尔科夫模型(HMM)对序列数据有很强的建模能力,在语音和手写识别中都得到了广泛的应用。利用HMM研究蒙古文手写识别,首先需要解决的问题是手写文字的序列化。从蒙古文的构词和书写特点看,蒙古文由多个字素从上到下串联构成。选择字素集合和词的字素分割是手写识别的基础,也是影响识别效果的关键因素。该文根据蒙古文音节和编码知识确定了蒙古文字母集合,共包括1 171个字母。通过相关性处理、HMM排序筛选等手段得到长字素集合,共包括378个字素。对长字素经过人工分解,获得了50个短字素。最后利用两层映射给出了词转字素序列的算法。为了验证长短字素在手写识别中的效果,我们在HTK(hidden Markov model toolkit)环境下利用小规模字库实现了手写识别系统,实验结果表明短字素比长字素有更好的性能。文中给出的字素集合和词转字素序列的算法为后续基于HMM的蒙古文手写识别研究奠定了基础。  相似文献   

3.
用于脱机手写数字识别的隐马尔可夫模型   总被引:9,自引:0,他引:9  
将隐马尔可夫模型(HMM)用于脱机手写数字识别中,系统如何建模是一个值得研究的问题.在考虑手写数字自身特点及特征抽取的基础上,对HMM模型的训练方法及模型参数的选取进行了研究,以提高系统识别率.在银行票据OCR的应用中,与基于神经网络的方法结合使用,使得整张票据的拒识率降低了3%,明显提高了银行票据OCR系统的性能.  相似文献   

4.
王先梅  杨扬  王宏 《计算机应用》2005,25(12):2925-2927
以脱机手写大写金额为研究对象,对其分别提取归一化小波特征、笔划密度特征和黑像素百分比特征,在分别形成独立的HMM分类器的基础上,将其按照一定的规则进行集成。实验结果表明,该方法能有效提高系统的识别率。  相似文献   

5.
6.
本文提出了一种在隐含马尔可夫模型(HMM)框架下建立的识别脱机手写汉字的方法,介绍了以HMM对脱机手写汉字进行建模、识别的整个过程,并给出了实验结果对国标一级3755个汉字的识别率,在两种测试集上分别达到96.4%和91.5%.  相似文献   

7.
脱机自由手写英文单词的识别   总被引:1,自引:0,他引:1  
介绍了一个基于隐马尔科夫模型的、采用模糊分割方式的脱机手写英文单词识别系统。该系统由图像预处理、特征提取、基于HMM的训练和识别四个模块组成。图像预处理中包括二值化、平滑去噪、倾斜校正和参考线提取。然后通过宽度不固定的滑动窗提取特征,前两组特征是整体形状和象素分布特征,另外又引入了Sobel梯度特征。HMM模型采用嵌入式的Baum-Welch算法训练,这种训练方式无需分割单词。最后用Viterbi算法识别。对字典中的每个单词,采用字母模型线性连接成单词模型。  相似文献   

8.
粗糙几何学将粗糙集理论应用于几何学之中,利用图形的上近似变换,在更粗糙的粒度上构造并分析几何图形.本文着重介绍了粗糙几何学的研究动机和理论基础,同时将其应用于脱机手写数字识别,并对粗糙几何未来的研究方向进行了展望.  相似文献   

9.
本文通过分析传统汉字的结构模型所具有的优缺点,提出了建立脱机手写汉字统计模型的理论框架;并利用PCA技术发现大量数据规律性的能力,提出了一种基于PCA技术的脱机手写汉字的统计模型.与传统的结构模型相比,该模型避免了目前还无法解决的准确抽取结构基元的困难,通过以容易抽取的可重构的统计特征作为统计基元,并通过对统计基元变化的整体描述或者说对统计基元相互之间关系的描述,较好地建立了脱机手写汉字的统计模型.根据该模型得到的一些实验结果充分说明了其描述脱机手写汉字的有效性.  相似文献   

10.
文章介绍了利用K-近邻分类器实现对手写字符的识别,并给出了OpenCV中相应库函数。本文重点介绍如何实现字符识别,对单词及整句识别有所讨论,但不作为重点。  相似文献   

11.
FPTA快速细化算法在脱机手写体汉字识别中的应用   总被引:4,自引:0,他引:4  
阐述了将FPTA快速细化算法应用于脱机手写体汉字识别中,该算法提出了一种11象素支撑窗口,能有效地抑制样本中的“毛刺“,快速提取保持原始汉字样本连通性和拓扑性的骨架,它的处理速度和细化质量明显优于现有的一些细化算法,根据实验结果,该算法是一种有效的汉字样本细化算法。  相似文献   

12.
脱机手写体字符识别技术是当前的热点和难点问题,是解决目前大量已有的文档资料录入工作的关键。在系统控制、人工智能、生物医学工程、遥感数据分析、军事目标识别等领域发挥了重要的作用,在国民经济、国防建设、社会发展和社会治安等方面得到广泛的应用。该文将就手写体字符识别技术的国内外研究进展进行综述。  相似文献   

13.
赵建东  高光来  飞龙 《计算机科学》2014,41(1):80-82,104
基于隐马尔科夫模型的语音合成方法是当今语音合成的主流方法,它已被广泛应用于英语、汉语、日语等语音合成系统中。然而基于隐马尔科夫模型的蒙古语的语音合成技术研究还处于空白状态。首次将基于隐马尔科夫模型的语音合成方法用于蒙古语语音合成,并进行了语音合成实验。从最终合成系统的效果来看,合成的语音整体稳定流畅,可懂度高,而且节奏感比较强,主观平均得分为3.80。这为进一步研究基于隐马尔科夫模型的蒙古语语音合成技术奠定了基础。  相似文献   

14.
针对手写阿拉伯单词书写连笔,且相似词较多的特点,该文提出一种新的脱机手写文字识别算法。该算法以固定组件为成分拆分阿拉伯单词,构建自组件特征至单词类别的加权贝叶斯推理模型。算法结合单词组件分割、多级混合式组件识别、组件加权系数估计等,计算单词类别的后验概率并得到单词识别结果。在IFN/ENIT库上的实验,获得了90.03%的单词识别率,证实组件分解对笔画连写具有鲁棒性,组件识别能提高相似词的辨别能力,而且该算法所需训练类别少,易向大词汇量识别扩展。  相似文献   

15.
脱机手写体汉字识别综述   总被引:3,自引:1,他引:3       下载免费PDF全文
何志国  曹玉东 《计算机工程》2008,34(15):201-204
脱机手写体汉字识别是模式识别领域中的难题之一。该文分析影响脱机手写体汉字识别性能的主要方面,如规范化方法、特征提取方法及分类方法,给出了每种方法的适用条件,介绍了目前研究中所使用的数据库。  相似文献   

16.
隐马尔可夫模型在脱机手写体汉字识别中的应用   总被引:6,自引:1,他引:6  
介绍了一种新的脱机手写汉字识别方法--隐马尔可夫模型(HMM)法,该方法对每个汉字建立8个HMM,通过等比重综合方法将8个分类器的计算结果进行综合,从而得到识别结果,实践证明该方法是可行的。  相似文献   

17.
Offline handwritten Amharic word recognition   总被引:1,自引:0,他引:1  
This paper describes two approaches for Amharic word recognition in unconstrained handwritten text using HMMs. The first approach builds word models from concatenated features of constituent characters and in the second method HMMs of constituent characters are concatenated to form word model. In both cases, the features used for training and recognition are a set of primitive strokes and their spatial relationships. The recognition system does not require segmentation of characters but requires text line detection and extraction of structural features, which is done by making use of direction field tensor. The performance of the recognition system is tested by a dataset of unconstrained handwritten documents collected from various sources, and promising results are obtained.  相似文献   

18.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号