首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
傅立叶变换在粘连文字图像切分中的应用   总被引:3,自引:0,他引:3  
朱小燕  王松 《计算机学报》1999,22(12):1246-1252
对于已具有相当识别率的手写体文字识别系统来说切分算法已成为一个关键技术之一,它的正确率对系统性能有着极大影响。该文主要对文字图像的傅立叶变换的性质进行了讨论,提出了消除交换中笔画宽度影响的算法。在此基础上建立了基于傅立叶变换的单/多字图像的判定的基本准则以及基于此准则的粘连文字判别算法。实验表明该算法的粘连文字判断正确率达到96%。为粘连文字的正确切分开辟了新的途径。  相似文献   

2.
文本是计算机视觉的许多应用中的一项重要特征,图像中的文本往往包含着比较丰富的信息,将文本图像信息里的文字进行提取和识别,对于图像内容的分析、理解、信息检索等方面具有重要的意义。文本图像的识别分为预处理,文字的切分,细化,特征选择与提取,最后对候选文字进行识别。在文字的切分方面提出了一种改进的投影算法,该算法能在很大程度上提高文字切分的准确度,采用基于数学形态学算法对文字进行细化处理,并在特征选择方面引用了多级分类的算法。  相似文献   

3.
开放环境下的模式识别与文字识别应用中,新数据、新模式和新类别不断涌现,要求算法具备应对新类别模式的能力。针对这一问题,研究者们开始聚焦开放集文字识别(open-set text recognition,OSTR)任务。该任务要求,算法在测试(推断)阶段,既能识别训练集见过的文字类别,还能够识别、拒识或发现训练集未见过的新文字。开放集文字识别逐步成为文字识别领域的研究热点之一。本文首先对开放集模式识别技术进行简要总结,然后重点介绍开放集文字识别的研究背景、任务定义、基本概念、研究重点和技术难点。同时,针对开放集文字识别三大问题(未知样本发现、新类别识别和上下文信息偏差),从方法的模型结构、特点优势和应用场景的角度对相关工作进行了综述。最后,对开放集文字识别技术的发展趋势和研究方向进行了分析展望。  相似文献   

4.
在许多文字识别系统中, 字符切分是预处理阶段的一部分, 其目的是从文本图象中分离出字母图象。而后才能针对切分后的每个字母进行识别。在具有连体特征的文字中, 字符切分就显得特别重要, 因为字符切分的准确与否直接影响字符的识别。维吾尔文就具有这种明显的连体特点, 本文主要讨论了采用抽取投影特征的方法, 实现了多字体维吾尔文的行切分、字切分和字符切分。  相似文献   

5.
一种用于脱机手写体女书字符切分的方法*   总被引:1,自引:0,他引:1  
针对目前国内文字切分主要应用于汉字、英文等,而对于濒危少数民族文字缺乏较为实用的切分工具的问题,提出了一种用于脱机手写体女书字符的切分方法。该方法结合投影法和连通域进行粗切分,对交叉字符采用曲线切分,对粘连字符采用改进的滴水算法切分,经实验证明该方法能够取得较好的切分效果。该方法为女书字符切分提供了新思路。  相似文献   

6.
沿着基线并具有大量附加部分书写是维吾尔文一大特点,这些特点使复杂背景的彩色图像中维吾尔文字行与字的切分和识别成为一个既困难又有趣的问题。本文首先对复杂彩色图像进行灰度化,其次将彩色图像转换为灰度化的边缘图像,再对图像进行局域二值化,然后进行区域检测和边缘调整,初步实现了图像中维吾尔文字行的定位,紧接着根据定位结果从图像中切分出文字行,统计切分后的文字行在水平和垂直方向上的像素累计情况,查找最佳切分点,分离出文字行中的字母独立形式或几个字母连成的连体字母段。实验结果表明,文字行的切分准确率达到96%,字切分准确率达到98%以上。  相似文献   

7.
针对扭曲中文文本图像文字识别率不理想这一问题,提出一种基于连通域的文本图像快速扭曲校正方法。根据汉字结构特征合并连通域,实现切分文字;利用就近聚合文字的方法定位文本行,按行垂直校正每个文字位置,获得被校正的图像。实验结果表明,该方法校正速度快,对严重扭曲的中文文本图像能取得较好的校正效果,校正后图像的OCR识别率明显提高。  相似文献   

8.
灰度图像中字符切分方法的研究   总被引:5,自引:1,他引:5  
字符切分目前已经成为限制OCR技术发展的瓶颈,对于图像质量较差、中英文混排和背景色变化的文本图像,传统切分方法造成的切分错误使得文字识别率大大降低。针对这些问题,本文提出了新型文字切分方法。该方法先将灰度图像的灰度值进行分级处理,再根据分级连通域的概念把整个图像构造成树状结构,然后确定主层次级别,根据一定的规则在部分节点上进行合并、分割等进一步处理,最后得到最优的切分结果。实验结果表明,该方法能够取得比常规切分方法更好的切分效果。  相似文献   

9.
文字的正确识别与否很大程度上取决于能否对文字进行有效的分割。在分析传统手写文字文本图像切分算法的基础上,提出一种基于像素点的文字分割方法。算法具有很强的抗干扰性,能够有效地解决手写过程中的小角度歪斜以及字符笔画断裂和粘连的问题。通过MATLAB的仿真试验,结果表明此方法能够对手写过程中普遍存在歪斜的文字进行有效的分割。  相似文献   

10.
音节是泰语构词和读音的基本单位,泰语音节切分对泰语词法分析、语音合成、语音识别研究具有重要意义。结合泰语音节构成特点,提出基于条件随机场(Conditional Random Fields)的泰语音节切分方法。该方法结合泰语字母类别和字母位置定义特征,采用条件随机场对泰语句子中的字母进行序列标注,实现泰语音节切分。在InterBEST 2009泰语语料的基础上,标注了泰语音节切分语料。针对该语料的实验表明,该方法能有效利用字母类别和字母位置信息实现泰语音节切分,其准确率、召回率和F值分别达到了99.115%、99.284%和99.199%。  相似文献   

11.
液晶屏温度响应特性及其温度控制   总被引:1,自引:0,他引:1  
文章简单介绍了IFT型有源液晶显示器(Am-LCD)显示屏的动态温度特性,在此基础上进一步介绍了模糊控制技术用于液晶屏温度控制的方法,试验结果表明,所采用的控制法则具有很好的过渡特性和抗扰动能力。  相似文献   

12.
提出了曲线化汉字特征的概念,讨论了3类可曲线化的汉字统计特征.利用P形傅里叶算子,对这些曲线化特征作傅里叶变换,可提取到最终的识别特征.实验结果表明,该方法在手写体汉字识别领域具有良好的应用前景,尤其适用于细分类.  相似文献   

13.
首先,对车牌图像进行预处理,针对不同的字符样本采用不同特征提取方法;然后,用提取的特征训练SVM分类器。结果表明,在训练样本较少的情况下,该系统具有较高的识别率和识别速度,并具有很好的分类推广能力。  相似文献   

14.
刘明  米丹 《微处理机》2002,(1):56-58
从一些常用的工具软件入手,从一般的文本录入开始,并与编写《中国电子科技报告》-DZ报告相结合,阐明了在微机上实现简单图文混排的方法与技巧。  相似文献   

15.
汉字的线性分类实验   总被引:1,自引:0,他引:1  
本文通过实验研究了在汉字识别中应用线性分类器的可能性,考察了汉字之间的线性可分性。实验使用了两种主要的线性分类器: Fisher线性判别和感知器。实验检验每一对汉字的线性可分性。实验结果表明,汉字之间的线性分类性是相当好的。尤其是Fisher线性判别,不能成功线性分类的汉字仅占百万分之4.25 。这显示了在汉字识别中应用线性分类器是有着巨大的潜力的。同时,线性分类实验结果还可用来检验所选取特征的好坏,有利于客观的评价特征。  相似文献   

16.
二值化修正法及在繁体手写字库构建中的应用   总被引:2,自引:0,他引:2  
文章建构了一个基于灰度的繁体手写汉字字库建库系统,该系统是由二值化、汉字切分、二值化修正、人工修正切分结果、数据压缩存储等几部分组成。其中二值化算法在最大限度地保证字库的分辨率及质量方面起着重要作用。文章在最大类间方差法(即大津法)及局部阀值法的基础上,结合汉字切分过程的特点,提出了一种二值化修正方法。实验结果表明该方法的效果比起传统的方法有显著提高,能有效地处理字库样本中由于笔迹灰度不均匀所带来的问题。  相似文献   

17.
张燕  唐振民  李燕萍 《计算机工程》2009,35(10):188-189
证实普通话可以分解为辅音音素和单元音音素通过过度音的连接,提出一种单字音特征提取方法。该方法在传统的帧特征提取基础上,对相关帧进行二次处理,得到单字语音中的多个代表帧,将代表帧进行拼接作为单字的特征矢量。这种特征提取方法能更好地表现说话人单字发音中相邻语音帧之间的连续性。仿真实验表明该方法在说话人识别系统的应用中达到较高的识别率,使识别时间进一步缩短。  相似文献   

18.
基于特征行必要-充分性匹配的字符识别方法   总被引:4,自引:0,他引:4  
字符识别系统的性能在很大程度上依赖于所选取的字符特征.提出了一种基于特征行必要-充分性匹配的OCR(optical character recognition)方法.该方法使用字符模板的特征行集,通过对待识字符位图进行必要性和充分性双向匹配来识别字符.并采用基线对齐归一化方法在特征匹配时准确定位,使识别率和识别速度都较为理想.同时,对字符位图特征行的交互选择、测试和调整等方法做了详细介绍.另外,还提出了字符骨架与位图重叠显示的方案,有效地提高了对识别结果校对的速度.最后,通过测试和比较,对识别效率进行了分析.  相似文献   

19.
光字符识别对人类是很简单的,但对计算机来说显得非常困难。自动字符识别在银行、航运、商业、通信、车牌识别等重要领域应用相当广泛。该文的主要任务是开发一个能识别机器印刷英文字符的系统,该系统采用基于反向传播的多层神经网络监督训练算法。通过系统进行多次测试和调试,不断优化网络参数并取得最佳结果,使得构建的新系统能够识别多种字体的字符。实验结果表明,该系统具有较高的识别率和优越的性能。  相似文献   

20.
基于特征选择的字符识别   总被引:4,自引:1,他引:4  
特征选择问题是机器学习和模式识别中的一个重要问题。其本质上是一个多因素优化问题。该文将试验设计与多因素优化问题联系起来,利用正交试验设计的统计特性,从特征集中筛选有效鉴别特征子集。在南京理工大学NUST603HW手写汉字库以及Concordia大学的CENPARMI手写体阿拉伯数字数据库上的试验结果表明,所提出的特征选择方法不仅提高了识别率,而且识别结果十分稳定。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号