首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
文档识别中误切分字符拒识问题的研究   总被引:4,自引:1,他引:4  
自动文档识别中字切分算法如果仅仅依靠大小位置等度量信息,很容易产生误切分图像块,需要字符分类器给出一定的反馈才能准确切分,为此提出了一个新的拒识算法,目标是尽可能准确地拒识非法字符。该文分析了基于距离的分类器的置信度和广义置信度,在此基础上改进了常用的广义置信度映射函数,并设计了一个基于样本学习的拒识规则,提高了拒识算法的适应性。在中日韩三种文档样本上的实验表明,该文算法明显改善了系统性能,对于较低质量的印刷文本识别具有一定的普遍意义。  相似文献   

2.
英文字符特征提取系统   总被引:1,自引:0,他引:1  
庞东虎  金伟杰 《计算机仿真》2007,24(12):208-210
英文字符识别是模式识别的一个重要分支,具有广泛的应用领域.字符识别主要包括文档切分、单词切分、字符识别及后处理几部分.文中描述的是英文字符识别系统实现了从图像扫描到得到识别结果的全过程, 而字符特征提取是文本的重点内容.以五十二个英文字符为研究对象,具体包括了图像预处理、特征提取、建立模板、分类器设计、后处理等步骤.文章对OCR领域中应用比较广泛的网格特征、外围特征、穿越特征等特征和几种距离分类器分别进行比较分析,并进行大量的实验.实验结果表明识别准确率和识别处理时间方面具有良好性能.  相似文献   

3.
中文联机手写文本切分识别要求预合并快速高效。为此,设计一个基于最小风险的多层次线性分类器。该分类器根据笔画及切分块的几何特征,采用分层合并的方式完成预合并过程。通过对联机样本进行的实验证明,该分类器保持欠切分错误率在一个较低水平的同时,有效地控制了过切分的错误率。  相似文献   

4.
粘连断裂字符行的切分识别,是很多OCR 实际应用中存在的主要困难之一. 本文针对粘连断裂的印刷体数字行,提出了一种基于Viterbi 算法的切分识别方案,该方案采用两次切分识别的层次型结构. 在第二次切分识别过程中,首先,在候选切分点区域,结合灰度图像与二值轮廓信息,采用基于Viterbi 算法搜索的非直线路径进行切分,得到有效的切分路径;然后,结合分类器输出的可信度,采用Viterbi 算法来合并前面得到的候选切分图像块,进行动态切分与识别. 实际的金融票据识别系统实验表明,本文提出的印刷体数字行切分识别方法能够较好的克服字符行的粘连与断裂情况,提高了识别系统的识别率和鲁棒性.  相似文献   

5.
离线手写数字识别是光学字符识别的一个重要分支,在银行票据识别、邮政编码识别等领域有着广泛的应用。由于单一分类器在识别率上很难达到要求,人们提出了各种集成分类器识别方案。通过对离线手写数字的特征提取,从特征互补的角度出发,采用了最小距离分类器、树分类器和BP网络分类器进行多分类器互补集成,提出了基于置信度的多分类器互补集成方法。通过实验对比,基于置信度的多分类器互补集成手写数字识别在识别率和识别速度上达到了满意的结果。  相似文献   

6.
基于MQDF的英文OCR多模板分类器   总被引:4,自引:0,他引:4  
针对进一步提高英文OCR分类器的鲁棒性进行了研究,结合传统的单模板MQDF分类器和多模板欧氏距离分类器各自的优点,提出了一种新的基于MQDF的多模板分类器设计方法。与传统分类器的对比测试证明,该文提出的这种新的分类器能够有效地提高多体英文OCR字符的单字首选正确率,并对低质量文本中的模糊和断裂字符也能保持很高的识别率。  相似文献   

7.
基于分类器联合的表情识别   总被引:1,自引:1,他引:0       下载免费PDF全文
提出了一种基于分类器联合的人脸表情识别方法。首先采用CKFD算法在双决策子空间中提取两类表情特征并融合;分别利用最近邻、最小距离和神经网络三种子分类器进行识别;最后运用模糊积分对子分类器的识别结果进行融合。基于JAFFE的实验结果表明,它是一种有效的表情识别方法。  相似文献   

8.
针对手写数字识别提出一种基于模板匹配决策分类器设计方法。就该方法下的模式识别分类器设计进行详细论述,给出该分类器算法实现。该算法在对手写的数字图像进行预处理的基础上从待识别的手写数字图像中提取若干特征量与事先建立的标准模板库中模板对应的特征量进行比较,计算待识别图像和标准模板特征量之间的距离,用最小距离法判定其所属类。实验结果表明,该决策分类器算法实现容易,匹配速度快,保证字符识别的正确率。  相似文献   

9.
多知识综合判决的字符切分算法   总被引:3,自引:0,他引:3  
高性能的印刷体文字识别系统中,在单字识别技术比较成熟的条件下,字符切分成为比较关键的环节。字符切分可以看作是对字符边界正确切分位置的一个决策过程,该决策需要同时考虑字符局部的识别情况和全局的上下文关系。该文通过对中日韩三国文字字符切分的研究,提出一种基于多知识综合判决的字符切分算法。该算法成功应用于AsiaOCR项目,对于东方文字中常见的混排英文问题也能很好处理。实验结果表明,和以前的算法相比,新算法在中日韩三国文字识别系统中的切分错误率平均下降50%。  相似文献   

10.
王虎  吴海辉 《数字社区&智能家居》2007,1(2):1076-1077,1082
阐述了基于图像识别的信息填涂卡文档图像标记阅读机中的识别算法,并提出一种新的信息卡填写方式。对常用的字符识别方法以及特征提取方法进行了描述,并根据实际,采用基于最小距离分类器的模板匹配算法来对手写符号进行识别,结果表明算法能有效地解决信息填涂卡文档图像的手写符号识别问题。  相似文献   

11.
针对手写数字识别提出一种基于模板匹配决策分类器设计方法。就该方法下的模式识别分类器设计进行详细论述,给出该分类器算法实现。该算法在对手写的数字图像进行预处理的基础上从待识剐的手写数字图像中提取若干特征量与事先建立的标准模板库中模板对应的特征量进行比较,计算待识别图像和标准模板特征量之间的距离,用最小距离法判定其所属类。实验结果表明,该决策分类器算法实现容易,匹配速度快,保证字符识别的正确率。  相似文献   

12.
为提高脱机满文手写字体的识别率,提出了基于BP网络的多特征集成分类器识别方法.对扫描成图像的手写满文进行预处理,切分出满文字元;分别提取满文字元的投影特征、链码特征以及端点和交叉点特征,并对这三类特征及其相互组合进行分类识别;通过隐马尔科夫算法对识别结果进行后处理,进一步提高识别的精度.实验结果表明,集成分类器的识别率要比单个特征的识别率要高,同时集成分类器中的特征类别越多,识别效果越好.  相似文献   

13.
鲁棒的多体印刷英文识别系统的实现   总被引:6,自引:1,他引:5  
文章讨论了设计一个实用的多体英文识别系统中解决的主要问题。该系统能识别多达260种字体,包括斜体和黑体等字体,对训练集的识别率达到99%,对实际文本测试的错误率比TH-OCR2000低56%。文章详细阐述了文本行字切分,特征提取和分类器设计,以及后处理所使用的常用技术,对各种技术的特点进行了分析和比较,并提出了一些新的技术。文章对于OCR系统的设计具有一定的指导意义。  相似文献   

14.
该文主要研究了脱机手写数字识别中的特征选择与提取和分类器的设计问题,选取了网格特征和交叉点特征,采用了最小距离分类器和基于Fisher判别的线性分类器,并使用基于置信度分析的方法进行混合集成,提高了识别正确率。  相似文献   

15.
就现有英文字符识别技术成熟的条件下,字符串的切分成为非常关键的环节。其中粘连英文字符串的模式尤为复杂,难以用传统的图像处理方法进行准确地分割。针对该问题,文中提出了一种简单快速的切分算法。该算法通过计算图像的背景域,从而提取出上下凹区域,再采用相邻匹配原则和最小面积选择原则最终确定切分域,从而成功提取出切分线进行准确切分。实验结果表明,该算法对英文字符串切分效果良好,尤其对粘连英文字符串也可以得到较好的分割结果,令人满意。  相似文献   

16.
一类改进的最小距离分类器的增量学习算法   总被引:1,自引:0,他引:1  
提出一种基于改进的最小距离分类器的增量学习算法,消除增量学习过程中产生的分类器内部结构的相互干扰,使分类器既能记住已学习的知识,又能学习新知识.增量学习需要对分类器结构进行调整,必须使用有代表性的已学习样本帮助分类器在学习新知识时复习旧知识.针对正态分布的样本集提出一种筛选算法,只保留有代表性的少量样本,大大减少存储消耗和重新训练的计算开销.实验结果证明该算法对样本的识别准确率高,在有效识别新样本的同时对以前学习的样本也保持较高的识别率,消耗存储空间小.  相似文献   

17.
为了简化系统模型训练方法,提高性别识别系统的整体效率,提出了一种基于改进Citation-KNN算法的说话人性别识别方法。该方法将连续语音切分,训练每段语音的高斯混合模型(Gaussian Mixture Model,GMM)作为多示例包,其所有混合元为相应包中示例;采用改进的Hausdorff距离作为包与包之间的距离测度,通过Citation-KNN算法进行性别识别。该方法以多示例包间距离为分类依据,简化了系统训练,且识别率优于一些传统算法。  相似文献   

18.
非线性迭代PLS信息模式识别算法   总被引:2,自引:0,他引:2       下载免费PDF全文
对偏最小二乘(PLS)回归的基本方法进行了分析研究,提出了基于非线性迭代偏最小二乘(NIPLS)的信息模式识别算法。该算法实现了模式识别中特征提取与分类器设计的有机结合。NIPLS较Fisher判别分析、Bayes判别分析等经典的模式识别算法,具有更强的信息识别能力,且对数据本身的分布要求不高,尤其对于多重共线性资料或解释变量多而样本数量少时更为有效。将该算法应用于土地质量的分类识别,结果表明,该文所建立的算法是有效的、可靠的。  相似文献   

19.
敌方坦克的姿态信息是装甲分队武器目标分配的重要依据,但目前坦克火控系统中并没有姿态识别的模块,为此提出一种基于压缩跟踪和级联分类器的动态视频序列下坦克车体姿态识别方法。将压缩跟踪算法的输出作为级联分类器的输入,缩小姿态识别的范围并减小分类器对不同环境中负样本的依赖;将坦克车体姿态分为12组,训练了12个分类器,在训练中引入了车体的轮廓信息;将多个级联分类器串联工作,识别坦克车体的多个姿态。对比了检测不同姿态的分类器的识别效果,结果表明级联分类器能以一定的精度对在真实环境中的坦克姿态进行识别。  相似文献   

20.
提出基于遗传模糊分类的步态识别方法.采用新的特征提取方法,该方法将目标按人体结构特点划分为多个子区域,利用各个子区域的质心与头部质心形成的距离和夹角对步态特征进行描述.运用模糊聚类算法构建不同距离函数的分类器,并用遗传算法对分类器进行集成,组成的集成融合分类器对步态序列进行识别.实验结果表明该方法具有较高的识别性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号