首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 312 毫秒
1.
AdaBoost算法在车牌字符识别中的应用   总被引:1,自引:0,他引:1  
季秀霞 《微计算机信息》2007,23(22):262-264
提出了一种基于AdaBoost的车牌字符自动识别算法。AdaBoost是一种构建准确分类器的学习算法,它将一族弱学习算法通过一定规则结合成为一个强学习算法,从而通过样本训练得到一个识别准确率理想的分类器,将之用于车牌字符识别,对车牌图像进行实验,对车牌字符样本进行特征提取,用特征来训练有效分类器,用MATLAB完成了对车牌照数字识别的模拟,结果证实此算法对车牌字符识别有一定准确性,具有良好的效果。  相似文献   

2.
周瑛  牛浏 《数字社区&智能家居》2014,(11):2548-2552,2566
该文首先分析了粒度计算的研究现状和原覆盖算法里面存在的缺点,即测试样本识别时拒识的概率较大以及当所得的覆盖存在交叉时,测试样本的类别确定问题,然后应用基于商空间的粒度计算理论针对覆盖算法的第一个缺点进行改进和优化,即对覆盖算法中的拒识样本进行二次处理。通过改变处理问题的粒度,使覆盖粒度在由粗到细的变化过程中,实现对拒识样本的渐进识别,在更细的空间中减少拒识的样本数,提高识别率。最后在中文文本数据库中使用优化后的覆盖算法,该数据库已进行过预处理。实验结果显示,这种优化后的方法减少了测试样本识别时的拒识样本数量,降低了识别样本时的出错率,有效地提高了实验结果的精度。  相似文献   

3.
多知识综合判决的字符切分算法   总被引:3,自引:0,他引:3  
高性能的印刷体文字识别系统中,在单字识别技术比较成熟的条件下,字符切分成为比较关键的环节。字符切分可以看作是对字符边界正确切分位置的一个决策过程,该决策需要同时考虑字符局部的识别情况和全局的上下文关系。该文通过对中日韩三国文字字符切分的研究,提出一种基于多知识综合判决的字符切分算法。该算法成功应用于AsiaOCR项目,对于东方文字中常见的混排英文问题也能很好处理。实验结果表明,和以前的算法相比,新算法在中日韩三国文字识别系统中的切分错误率平均下降50%。  相似文献   

4.
语音拒识技术是实现一个实用语音识别系统的关键。提出了一种新颖的基于置信度的非特定人语音识别拒识算法,该算法同时考虑了备选假设模型和多候选的信息,适用于拒识不正确的识别结果和词表外(OOV)语音。在一个非特定人英语命令词识别系统中做了一些相关的实验来评估这个算法的性能。实验结果表明,该算法可以有效地去除识别不可靠的语音,提高语音识别的整体性能。  相似文献   

5.
一种新的基于字符形状特征的高效车牌识别算法   总被引:3,自引:1,他引:2  
提出了一种基于字符的凹凸性、弯曲度和交点数等形状特征的车牌字符识别方法,它无须对字符作归一化、细化、倾斜校正这些预处理,也不需要样本图像,降低了字符畸变所产生的误识和拒识,减少了处理时间,提高了识别率。实验结果表明这是一种高效的车牌识别算法,是对现有车牌识别技术的有益补充。  相似文献   

6.
基于轮廓和统计特征的手写体数字识别   总被引:5,自引:0,他引:5  
提出了数字规范化模板特征,并利用这一特征与轮廓分段特征相结合对手写体数字进行识别。首先使用基于轮廓分段特征的分类器进行识别,通过提高拒识率获得高可靠性的分类结果。然后由基于数字规范化模板特征的分类器对前一级分类器的拒识样本分类。实验结果表明分别基于这两个特征的分类器在分类结果上具有较强的互补性。实验的数据为真实支票上采集的10000个手写体数字样本,该方法的识别率为98.06%。  相似文献   

7.
刘阳兴 《计算机应用研究》2011,28(10):3998-4000
针对粘连和搭接字符切分算法的不足,提出一种基于折线切分路径的字符切分算法。该算法利用投影法将粘连搭接字符与非粘连搭接字符分离开,而后结合粘连搭接字符独有的外形特征,通过引入惩罚权重的路径搜索算法快速而准确地得到粘连搭接字符间的折线切分路径;为了避免一些字符在以上的切分过程中被误切碎,利用识别反馈信息对一些字符子图像进行合并。实验结果表明,该算法对印刷体日英混排字符切分有很强的适应性,取得了较理想的切分效果。  相似文献   

8.
粘连断裂字符行的切分识别,是很多OCR 实际应用中存在的主要困难之一. 本文针对粘连断裂的印刷体数字行,提出了一种基于Viterbi 算法的切分识别方案,该方案采用两次切分识别的层次型结构. 在第二次切分识别过程中,首先,在候选切分点区域,结合灰度图像与二值轮廓信息,采用基于Viterbi 算法搜索的非直线路径进行切分,得到有效的切分路径;然后,结合分类器输出的可信度,采用Viterbi 算法来合并前面得到的候选切分图像块,进行动态切分与识别. 实际的金融票据识别系统实验表明,本文提出的印刷体数字行切分识别方法能够较好的克服字符行的粘连与断裂情况,提高了识别系统的识别率和鲁棒性.  相似文献   

9.
针对带表格的中文支票小写金额的自动识别问题,提出了一种多模式切分和识别算法。根据小写金额不同部分的切分和识别难度,采取了3种递进的模式:预切分模式、连写0检测模式和基于识别的切分模式。其中预切分模式用来处理小写金额中不粘连的单字;连写0检测模式用来检测并识别连写的0;基于识别的切分模式用来处理非连写0的粘连部分,在这个模式中采用了遗传算法来加速最优解的搜索过程。利用从银行采集的1053张真实支票样本进行测试,在拒识率为33.6%时,小写金额串的识别率达到66.1%,实验结果证明这种算法可以提高真实支票小写金额的识别率。  相似文献   

10.
基于笔划特征的单字符汉字字体识别   总被引:1,自引:0,他引:1  
在文档电子化的文本自动分析、理解和识别过程中,除了有关文档内容的字符识别外,还必须解决字体识别问题.字体识别不仅是版面分析、理解和恢复的重要依据,还有助于实现高性能字符识别系统.有别于目前基于多个字符组成的文本块的字体识别方法,本文提出了一种基于单个汉字字符的字体识别方法.在单个汉字字符上提取两类特征:笔划属性特征和笔划分布特征,分别构成两个分类器对单个汉字字符进行字体识别,并集成两个分类器的结果得到最终的识别结果.我们使用的笔划属性特征分类器是文本无关的,而笔划分布特征分类器是文本相关的,集成的分类器属于文本相关的字体识别分类器.我们在包含7种字体的样本集上进行了测试,测试结果显示基于单字的字体识别率达到94.48%.  相似文献   

11.
12.
Generally speaking, through the binarization of gray-scale images, useful information for the segmentation of touched or overlapped characters may be lost in many cases. If we analyze gray-scale images, however, specific topographic features and the variation of intensities can be observed in the character boundaries. In this paper, we propose a new methodology for character segmentation and recognition which makes the best use of the characteristics of gray-scale images. In the proposed methodology, the character segmentation regions are determined by using projection profiles and topographic features extracted from the gray-scale images. Then a nonlinear character segmentation path in each character segmentation region is found by using multi-stage graph search algorithm. Finally, in order to confirm the nonlinear character segmentation paths and recognition results, a recognition-based segmentation method is adopted. Through the experiments with various kinds of printed documents, it is convinced that the proposed methodology is very effective for the segmentation and recognition of touched and overlapped characters  相似文献   

13.
在手写体中文信封处理系统中,地址行字符切分是实现地址行识别的关键步骤。本文根据邮政信封地址行字符的特点,有针对性的提出了一种字符切分算法。首先对地址行图像利用投影、求连通区域、笔划穿越数分析等基于字符结构的方法进行初始切分,得到基本字段序列;然后通过对相邻的基本字段进行组合形成多条候选切分路径,再通过识别的可信度和邮政目标地址库的先验知识信息对路径进行评价分析,从而得到最优的切分路径。该算法经过邮政分拣机采集的实际信封图像测试,纯地址行识别正确率达到78.61%,地址行识别与邮政编码识别相结合的分拣正确率达到95.42%。  相似文献   

14.
文本是计算机视觉的许多应用中的一项重要特征,图像中的文本往往包含着比较丰富的信息,将文本图像信息里的文字进行提取和识别,对于图像内容的分析、理解、信息检索等方面具有重要的意义。文本图像的识别分为预处理,文字的切分,细化,特征选择与提取,最后对候选文字进行识别。在文字的切分方面提出了一种改进的投影算法,该算法能在很大程度上提高文字切分的准确度,采用基于数学形态学算法对文字进行细化处理,并在特征选择方面引用了多级分类的算法。  相似文献   

15.
复杂彩色文本图像中字符的提取   总被引:4,自引:1,他引:4  
从复杂彩色文本图像中提取和识别字符已经成为一个既困难又有趣的问题。本文给出了一个具有创新性和实用性的区域生长算法用于彩色图像的分割:彩色图像游程邻接算法CRAG(color run-length adjacency graph algorithm)。我们将该算法用于彩色文本图像,首先得到图像的彩色连通域,再对这些连通域的平均颜色进行颜色聚类,可得到若干个聚类中心,然后根据不同的颜色中心将图像分为相应的彩色层面,最后通过连通域分析判断所需的文字层。该生长算法修改并扩展了传统的BAG算法,并将其运用于彩色印刷体文本图像中,充分利用了彩色图像的颜色和位置信息。实验结果表明新的方法能很好的从彩色印刷图像中提取多种常见的艺术字,并具有较高的提取速度,同时保留了文字和背景图像的原始色彩,便于将来的图像恢复。  相似文献   

16.
Multiresolution-based magnetic resonance (MR) image segmentation has attracted attention for its ability to capture rich information across scales compared with the conventional segmentation methods. In this paper, a new scale-space-based segmentation model is presented,where both the intra-scale and inter-scale properties are considered and formulated as two fuzzy energy functions. Meanwhile, a control parameter is introduced to adjust the contribution of the similarity character across scales and the clustering character within the scale. By minimiT.ing thecombined inter/intra energy function, the multiresolution fuzzy segmentation algorithm is derived.Then the coarse to fine leading segmentation is performed automatically and iteratively on a set of multiresolution images. The validity of the proposed algorithm is demonstrated by the test image and pathological MR images. Experiments show that by this approach the segmentation results,especially in the tumor area delineation, are more precise than those of the conventional fuzzy segmentation methods.  相似文献   

17.
Optical character recognition for cursive handwriting   总被引:5,自引:0,他引:5  
A new analytic scheme, which uses a sequence of image segmentation and recognition algorithms, is proposed for the off-line cursive handwriting recognition problem. First, some global parameters, such as slant angle, baselines, stroke width and height, are estimated. Second, a segmentation method finds character segmentation paths by combining gray-scale and binary information. Third, a hidden Markov model (HMM) is employed for shape recognition to label and rank the character candidates. For this purpose, a string of codes is extracted from each segment to represent the character candidates. The estimation of feature space parameters is embedded in the HMM training stage together with the estimation of the HMM model parameters. Finally, information from a lexicon and from the HMM ranks is combined in a graph optimization problem for word-level recognition. This method corrects most of the errors produced by the segmentation and HMM ranking stages by maximizing an information measure in an efficient graph search algorithm. The experiments indicate higher recognition rates compared to the available methods reported in the literature  相似文献   

18.
如何对急速增长的文档图像进行有效检索是文档图像管理系统的关键技术之一。提出了一种不需要识别文字的检索中文文档图像的方法,该方法在字符分割基础上采用基于粗外围特征粗匹配和基于改进Hausdorff距离相似度测量的两级匹配方法,以适应于时间、准确性的不同要求。同时用对200幅文档图像样本进行了实验,其结果表明,使用该方法对检索印刷体汉字的文档图像具有较高的检索效果,对于数字图书馆中文档图像检索系统的设计,有一定的参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号