首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
在许多文字识别系统中, 字符切分是预处理阶段的一部分, 其目的是从文本图象中分离出字母图象。而后才能针对切分后的每个字母进行识别。在具有连体特征的文字中, 字符切分就显得特别重要, 因为字符切分的准确与否直接影响字符的识别。维吾尔文就具有这种明显的连体特点, 本文主要讨论了采用抽取投影特征的方法, 实现了多字体维吾尔文的行切分、字切分和字符切分。  相似文献   

2.
从维吾尔文的特征和书写规则出发对维吾尔文联机手写单词识别技术进行了探索性研究,并提出一种新的思路:不是直接把单词切分成字母,而是先把单词分割成连体段,然后再分割成字母。这样,可以提高字母切分和字母识别的准确率。按照该思路,提出一种连体段分割算法:根据通过研究维吾尔文的特征和书写规则找出来的一些规则把一个个的笔画,组合成连体段。实验证明了该连体段分割思路和算法的可行性。  相似文献   

3.
维吾尔文字属于左向连写文字,字母之间的连笔与变形使得切分字母很困难,印刷体维吾尔文字母的准确切分是识别的关键.文中试验了一种基于像素积分投影的印刷体维吾尔文字母切分方法,包括使用行水平投影切出文字行与文字基线,通过垂直投影切出单词及单词中不粘连的字母,结合水平投影与垂直投影数据,外加相邻投影谷距、字母宽度与基线像素值等信息,设置了细化的连体段字母切分规则.实验结果表明,该方法能够较为准确的将印刷体维吾尔文字母切分开,为 OCR 系统的准确识别提供了基础  相似文献   

4.
沿着基线并具有大量附加部分书写是维吾尔文一大特点,这些特点使复杂背景的彩色图像中维吾尔文字行与字的切分和识别成为一个既困难又有趣的问题。本文首先对复杂彩色图像进行灰度化,其次将彩色图像转换为灰度化的边缘图像,再对图像进行局域二值化,然后进行区域检测和边缘调整,初步实现了图像中维吾尔文字行的定位,紧接着根据定位结果从图像中切分出文字行,统计切分后的文字行在水平和垂直方向上的像素累计情况,查找最佳切分点,分离出文字行中的字母独立形式或几个字母连成的连体字母段。实验结果表明,文字行的切分准确率达到96%,字切分准确率达到98%以上。  相似文献   

5.
目前针对印刷体维吾尔文档图像的切分研究主要集中在字母切分上,单词切分的文献较少,且存在着标点符号难处理,未合并被拆分书写的单词等问题,同时单词切分准确率有待进一步提高。在对文档图像进行投影处理的基础上,通过[K]均值聚类算法[(K]-means)对文本行中所有连体段之间的间隙进行聚类分析得出最佳的间隙判别阈值,然后对所有连体段进行筛选和粗略识别,并结合对间隙的阈值判别结果来确定单词的精确切分点和获取被拆分书写单词的位置信息。在选取的100张文档图像中测试时,结果表明该方法能有效去除标点符号对切分结果的影响,准确合并被拆分书写的单词,并且平均单词切分准确率保持在99%以上。  相似文献   

6.
针对印刷体维吾尔文文字识别系统中的文字,尤其是连体段字母的切分这一难点问题,提出一种改进的投影切分方法.采用将基线区域像素点置白(像素点索引值置为255),并对其进行垂直投影,取投影值为0的间隙中间位置作为候选切线位置,根据行高度与空白间隙宽度比的统计数据均值设置阈值,以此消除误切分.实验结果证明,该方法可有效提高连体段切分的正确率.  相似文献   

7.
为提高维吾尔文档图像的检索效率,提出一种基于字符空间关系的关键词检索方法.通过对文档图像进行单词切分,提取切分后单词图像的字符空间位置特征,将提取的特征根据单词的连体段数目存储为多个特征文件,根据输入关键词图像的特征寻找对应的特征文件进行查询.从115张印刷体维吾尔文档图像切分后的24460张单词集中选取10张有丰富含...  相似文献   

8.
论文根据维吾尔文的特点和难点,通过分析和研究,实现了维吾尔文印刷体识别技术中的预处理部分.预处理完成的工作有去除噪点、基线评估、倾斜校正、联体段切分、骨架细化等.  相似文献   

9.
为了提高联机手写维吾尔文字母的正确识别率,根据维吾尔文字母的手写特点,提出了中心距离特征CDF(Center Distance Feature)、并基于CDF进行了一系列识别实验。在实验中,该文采集了400个人的手写字母样本,利用CDF的三种不同的实施方案(CDF-2,CDF-4,CDF-8)分别对维吾尔文字的32个母独立形态和128个所有形态进行了识别实验,并对实验结果进行了分析。实验结果表明,CDF是一种非常适合于维吾尔文字母识别的特征,有待于进一步改进和优化。  相似文献   

10.
为了提高联机手写维吾尔文字母的正确识别率,根据维吾尔文字母的手写特点,提出了中心距离特征CDF(Center Distance Feature)、并基于CDF进行了一系列识别实验。在实验中,该文采集了400个人的手写字母样本,利用CDF的三种不同的实施方案(CDF-2,CDF-4,CDF-8)分别对维吾尔文字的32个母独立形态和128个所有形态进行了识别实验,并对实验结果进行了分析。实验结果表明,CDF是一种非常适合于维吾尔文字母识别的特征,有待于进一步改进和优化。  相似文献   

11.
印刷维吾尔文本切割   总被引:1,自引:0,他引:1  
我国新疆地区使用的维吾尔文借用阿拉伯文字母书写。因为阿拉伯文字母自身书写的特点,造成维文文本的切割和识别极其困难。本文在连通体分类的基础上,结合水平投影和连通体分析的方法实现维文文本的文字行切分和单词切分。然后定位单词基线位置,计算单词轮廓和基线的距离,寻找所有可能的切点实现维文单词过切割,最后利用规则合并过切分字符。实验结果表明,字符切割准确率达到99 %以上。  相似文献   

12.
随着手机短信业务普及,智能手机中实现维吾尔文输入、输出已经是新疆地区1000多万少数民族用户迫切的需求。在连续输入的维吾尔文文章或单词中,切分出一个个的字母,供后续的字母识别使用,字母切分是手写输入识别的核心关键技术。手写维文字符串的分割与字符识别密切相关。采用基于识别的分割方法,系统先通过粗略的图像分析寻找所有可能的切点,在分割的过程中引入识别机制来识别分割碎片,将识别结果经过差值运算后置为每个识别对象的识别可信度,利用移动窗口法找到最佳分割路径。在分类器训练时,采用特征提取来估计分类器参数,得到了性质良好的分类器,试验表明,字符切割准确率高达97.3%。  相似文献   

13.
傅立叶变换在粘连文字图像切分中的应用   总被引:3,自引:0,他引:3  
朱小燕  王松 《计算机学报》1999,22(12):1246-1252
对于已具有相当识别率的手写体文字识别系统来说切分算法已成为一个关键技术之一,它的正确率对系统性能有着极大影响。该文主要对文字图像的傅立叶变换的性质进行了讨论,提出了消除交换中笔画宽度影响的算法。在此基础上建立了基于傅立叶变换的单/多字图像的判定的基本准则以及基于此准则的粘连文字判别算法。实验表明该算法的粘连文字判断正确率达到96%。为粘连文字的正确切分开辟了新的途径。  相似文献   

14.
在手写体中文信封处理系统中,地址行字符切分是实现地址行识别的关键步骤。本文根据邮政信封地址行字符的特点,有针对性的提出了一种字符切分算法。首先对地址行图像利用投影、求连通区域、笔划穿越数分析等基于字符结构的方法进行初始切分,得到基本字段序列;然后通过对相邻的基本字段进行组合形成多条候选切分路径,再通过识别的可信度和邮政目标地址库的先验知识信息对路径进行评价分析,从而得到最优的切分路径。该算法经过邮政分拣机采集的实际信封图像测试,纯地址行识别正确率达到78.61%,地址行识别与邮政编码识别相结合的分拣正确率达到95.42%。  相似文献   

15.
随着智能交通的不断发展,车牌识别系统已经成为其中的重要组成部分。车牌识别分为车牌定位、字符分割以及字符识别三个部分。提出了一种新型车牌识别方法。在车牌定位方面,采用双边缘检测车牌定位方法;对于字符分割则提出了寻找连通域与传统投影分割相结合的方法;在字符识别上,将分类器分为三组,同时对于易混淆的字符进行了再次分类,这种做法缩短了训练时间,提高了准确率。实验结果表明,所提出的方法具有识别率高和速度快等特点。  相似文献   

16.
在字符识别领域,对粘连字符的识别是一个被广泛关注的技术难点,而且粘连字符的分割更是产生识别错误的主要原因之一.为了快速准确地进行字符分割,在总结已有方法的特点及不足的基础上,针对电子阅读笔系统的工作特点和实时性要求,提出并实现了一种面向电子阅读笔系统的基于词片识别的分割算法.该方法由于通过对字母组合的识别,降低了传统的基于孤立字符识别方法对于字符切分的要求,而且以中心生长法和改进的峰谷函数为切分工具来进行字符分割,简单实用,因而其在减少因粘连字符切分错误引起的识别错误的同时,不仅降低了运算复杂度,而且适合在阅读笔等嵌入式设备上应用.实验证明,该算法不仅效率高,而且实现简单,还能够降低分割错误带来的识别错误.  相似文献   

17.
提出一种联合两种特征的手写体维文字符识别算法。该算法对手写体维文字符图像进行实值Gabor能量特征和方向线素网格特征的提取,将实值Gabor滤波器的128维能量特征和方向线素的128维网格特征结合起来,使用KNN分类器对两种特征进行联合分类。对手写体维文字符数据库中的样本分别进行手写体维文字符特征识别和维文字符笔迹特征识别。实验结果表明,和采用一种特征的识别算法比较,进一步提高了手写体维文字符的识别率。该算法也可用于手写体阿拉伯文字符的识别。  相似文献   

18.
车牌识别系统研究与实现   总被引:2,自引:2,他引:2  
车牌识别(LPR)系统是智能交通系统中的重要组成部分,该系统分为车牌定位、字符切分和字符识别3个模块。文中基于数学形态学方法和边缘特征分析来进行车牌定位,接着进行二值化、引入多指标联合评价函数判断反色等处理,然后基于连通体分析的方法切分字符。实验表明该系统设计方法是可行的。  相似文献   

19.
一种视频中字符的集成型切分与识别算法   总被引:3,自引:0,他引:3  
杨武夷  张树武 《自动化学报》2010,36(10):1468-1476
视频文本行图像识别的技术难点主要来源于两个方面: 1)粘连字符的切分与识别问题; 2)复杂背景中字符的切分与识别问题. 为了能够同时切分和识别这两种情况中的字符, 提出了一种集成型的字符切分与识别算法. 该集成型算法首先对文本行图像二值化, 基于二值化的文本行图像的水平投影估计文本行高度. 其次根据字符笔划粘连的程度, 基于图像分析或字符识别对二值图像中的宽连通域进行切分. 然后基于字符识别组合连通域得到候选识别结果, 最后根据候选识别结果构造词图, 基于语言模型从词图中选出字符识别结果. 实验表明该集成型算法大大降低了粘连字符及复杂背景中字符的识别错误率.  相似文献   

20.
This paper describes a recognition algorithm for zip code field recognition. The algorithm consists of an initial character segmentation algorithm and a connected-numeral splitting algorithm. The initial character segmentation algorithm employs connected component analysis with component merge technique based on proximity. The numeral splitting algorithm consists of a slant splitting algorithm based on discriminant analysis and two postprocessing algorithms based on local shape analysis. The splitting algorithm is integrated with a statistical classifier to form a segmentation-recognition algorithm to resolve the ambiguity of connected numeral splitting. The performance is tested by recognition experiments on zip code fields collected from real USPS mail envelopes.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号