首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于形心同心圆结构的自由手写体数字神经网络分类器   总被引:1,自引:0,他引:1  
本文提出了一种基于自由手写体数字的形心同心圆结构来提取贯穿特征码的神经网络识别方法。该方法是用自由手写体数字的形心同心圆来抽取其贯穿特征码,将获得的这些模式特征训练改进的BP神经网络分类器,从而达到快速分类的目的。将其应用于自由手写体数字的信函自动分拣系统,单字的识别率达到97%以上,整信的识别率也可达到92%以上,得到了令人满意的结果。  相似文献   

2.
本文提出了一种基于外接同心圆结构提取贯穿特征码的自由手写体数字的神经网络识别。该方法是用自由手写体数字的外接同心圆来提取其贯穿持征码,将获得的模式特征训练改进的BP神经网络分类器,从而达到快速分类的目的。将其应用于邮政编码识别系统,单字的识别率达到97%以上,整信的识别率可达到92%以上,得到了令人满意的结果。  相似文献   

3.
视频文本的自动提取方法   总被引:4,自引:0,他引:4  
提出一种基于彩色边缘检测和游程平滑的视频文本提取方法,首先用彩色边缘检测算子检测出图像中的边缘。然后用多次水平和垂直的游程平滑操作使得文字边缘形成连通区域,并去掉部分孤立的噪声,再通过对连通域的分析和分解定位出文本区域的边界,最后对文本区进行确认.实验表明,本文的视频文本自动提取方法具有较高的文本提取率和较准确的边界定位。  相似文献   

4.
张显杰  张之明 《计算机应用》2022,42(8):2394-2400
手写体文本识别技术可以将手写文档转录成可编辑的数字文档。但由于手写的书写风格迥异、文档结构千变万化和字符分割识别精度不高等问题,基于神经网络的手写体英文文本识别仍面临着许多挑战。针对上述问题,提出基于卷积神经网络(CNN)和Transformer的手写体英文文本识别模型。首先利用CNN从输入图像中提取特征,而后将特征输入到Transformer编码器中得到特征序列每一帧的预测,最后经过链接时序分类(CTC)解码器获得最终的预测结果。在公开的IAM(Institut für Angewandte Mathematik)手写体英文单词数据集上进行了大量的实验结果表明,该模型获得了3.60%的字符错误率(CER)和12.70%的单词错误率(WER),验证了所提模型的可行性。  相似文献   

5.
近来,许多基于书写的方式使人们自然书写的数字笔迹输入成为可能。通常,书写时的污点或修改不仅使文本受污,而且看上去也不舒服,还影响到手写体的识别。本文首先论述笔迹修正的问题。我们提出了去除污点和修改笔迹的修正系统,使文本变得清晰、可识别,以改善手写体的识别率。基于规则的算法可处理大部分如单一笔划的同一笔划重复涂写、笔划间的中间部分重复涂写、改错、修改、插入以及书写顺序错误等情况。实验结果显示,该系统对笔迹标识的修正是有效的,并有希望改善其识别率。  相似文献   

6.
为了解决视频检索中文本定位精确度不高的问题,提出一种基于条件笔画密度提取的文本定位方法。根据文本笔画的特征对视频图像中的文本进行初步定位,用基于条件密度的方法滤去一部分非文本区域,再利用动态形态学对提取的文本区域精确定位并对其优化得到最终的文本区域。实验结果表明,该方法能滤去大部分非文本信息,得到相对精确的文本区域,并且定位效果较好。  相似文献   

7.
本文论述了基于矩阵模型的中文书写文本图表的提取和分割方法。书写文本为行式书写的字符,其中包括手写体字符和图表。每行由在同一线段上的字符组成。支本与图表的行、相邻的字符有关。如果可以从图表中提取,就可识别这些字符线段以及相关的图表,也可识别行、列排序的标题、子标题和字符部件。实验显示,本文的方法具有较高的效率。  相似文献   

8.
面向彩色图像和视频的文本提取新方法   总被引:10,自引:1,他引:10  
随着基于内容检索技术的发展,人们逐渐意识到包含在彩色图像和视频中的文本具有重要的语义作用,并需要采用有效的方法来提取这些文本,文中提出一个全面作用在RGB颜色空间3个分量上的彩色图像边缘检测新算子和一种利用空间频率特征,结合彩色边缘检测与基于区域图像分割方法的彩色图像和视频文本提取新算法。实验表明在彩色图像和视频的文本提取中,文中算子形成的二值边缘图像的文本区域轮廓清晰完整,有利于下一步文本区域与背景的剥离,该算法具有较高的广西区域提取准确率和较好的对于文本字符在尺寸和颜色方面的适应性。  相似文献   

9.
视频和图像文本提取方法综述   总被引:1,自引:0,他引:1  
文本提取在视频和图像中具有重要的应用价值。近年来,大数据时代带来了海量信息检索的迫切需求,大量视频和图像中文本的提取方法涌现出来。回顾了视频和图像中文本提取的算法,从文本提取流程出发,将其分为文本区域检测定位和文本分割两大步骤。在每个步骤中,分析并比较了现有算法的使用范围及相对优缺点,讨论了图像公用数据库,列举了近些年来图像中文本提取的重要应用,指出了当前研究中存在的问题,展望了视频和场景图像文本提取方法的发展趋势。  相似文献   

10.
提出了一种基于Adaboost算法的场景中文文本定位的新方法。首先利用边缘特征进行文本区域的检测,即对数字图像进行边缘提取、二值化处理,然后通过连通域分析去除明显的非字符连通域,并获得候选的文本区域。对场景中文文本区域进行分析,提取了场景中文文本的4类特征,并利用这4类特征经过分类与回归决策树构造了Adaboost强分类器。将候选文本区域送入强分类器,得到正确的文本区域。实验结果表明方法不仅对场景文本图像中字体、大小和颜色多变的文本具有很好的定位效果,而且具有很高的召回率和准确率。  相似文献   

11.
手写体数字识别是多年来的研究热点,也是字符识别中的一个特别问题。由于手写体数字字体变化很大,传统的识别方法很难达到高的识别率。针对传统的数字识别方法的复杂性和局限性,提出了一种基于BP神经网络的手写体数字的识别方法。该方法在提取手写体数字点特征、笔划密度特征基础上,利用改进的BP神经网络进行训练识别。经实验,识别率达94%。实验结果表明,该方法对手写体数字识别效果良好,不仅简化了传统识别的繁杂性,而且提高了识别的准确性。  相似文献   

12.
基于BP神经网络的手写体数字识别   总被引:3,自引:1,他引:2  
手写体数字识别是多年来的研究热点,也是字符识别中的一个特别问题.由于手写体数字字体变化很大,传统的识别方法很难达到高的识别率.针对传统的数字识别方法的复杂性和局限性,提出了一种基于BP神经网络的手写体数字的识别方法.该方法在提取手写体数字点特征、笔划密度特征基础上,利用改进的BP神经网络进行训练识别.经实验,识别率达94%.实验结果表明,该方法对手写体数字识别效果良好,不仅简化了传统识别的繁杂性,而且提高了识别的准确性.  相似文献   

13.
针对在自然场景下,现有的手写体票据字符识别精度低的问题,提出了一种改进的端到端的网络文本识别方法.通过对Visual Geometry Group(VGG)卷积网络进行改进,从而获取深层次的图像特征;通过改进的双向长短时记忆网络(Long Short-Term Memory,LSTM)提取上下文信息,对不同长度的文本序列进行预测,改进的LSTM网络将遗忘门和输入门合并成一个更新门,使得LSTM网络可以获得更长时期的历史信息;使用最优路径的方法对文本进行转录,该方法可以找到概率最大路径,输出这条路径对应的最优序列.实验结果表明,使用该算法进行文本识别,可以使手写体中文和手写体数字准确率达到较好的效果.  相似文献   

14.
沈任道  黎绍发  江焯林 《计算机工程》2009,35(9):214-216,219
针对大多数视频文本边缘丰富且颜色单一、水平排列的特点,通过基于dcriche边缘的方法迅速确定视频图像中可能包含文本的区域,使用基于颜色的方法从中提取精确的二值文本图像.实验结果表明,该文本提取方法适用于背景复杂的视频图像,且与单纯基于颜色的算法相比,在速度和提取效果方面更具优越性.  相似文献   

15.
基于结构特征分类BP网络的手写数字识别   总被引:4,自引:1,他引:4  
手写体数字识别有着重大的使用价值,用多层BP网络来识别手写体数字是手写体数字识别的一大进步,但是,用单纯的BP网络来识别也存在识别精度不高等的问题。将BP网络技术和数字本身的结构特征结合起来,提出了一种基于结构特征分类BP网络的手写体数字识别新方法。首先提取点、环等数字特征值,并根据一些特征进行分类;然后再运用BP神经网络识别,以提高网络的识别能力;最后,选取了500个人的0~9的手写体数字,运用以上算法进行BP神经网络识别,用3000个手写体数字作为训练样本,2000个其他的样本进行测试,网络收敛后,识别率达到96%以上,比原来有一定的提高。  相似文献   

16.
王建平  蔺菲  陈军 《计算机工程》2007,33(10):230-232,248
提出了手写体汉字笔画宽度提取、基于提取出的笔画宽度归一化手写体汉字的方法,给出手写体汉字笔画重构的思想,实现了一种基于手写体汉字笔画提取的汉字重构并最终识别手写体汉字的算法,构建了手写体汉字的识别系统。实验证实,该方法可保证原有笔画特征信息,且能有效地识别手写体汉字。  相似文献   

17.
启发式相关文本提取技术研究   总被引:2,自引:0,他引:2  
随着WEB上图片资源的日益丰富,人们对WEB图片检索的需求也日趋强烈,基于文本检索WEB图片,是人们当前检索WEB图片的主要手段,其中,提取图片的相关文本是实现基于文本的图片检索的基础,现有的相关文本提取技术对WEB的复杂性理解不够,使用固定的模式提取文本,常常以偏概全,提取效果不佳.本文进一步明确了相关文本的概念,使用启发式提取方法,让系统更智能地提取相关文本,实验表明,该技术能提取到绝大部分的相关文本,并且所提取的文本与图片的相关度也很高.  相似文献   

18.
近年来,以生成对抗网络(generative adversarial network, GAN)为基础的文本生成图像方法成为跨媒体融合研究的一大热门领域.文本生成图像方法旨在通过提取更具表征力的文本及图像特征,提升文本描述与生成图像之间的语义一致性.现有方法大多针对在图像全局特征与初始文本语义特征之间进行建模,忽略了初始文本特征的局限性,且没有充分利用具有语义一致性的生成图像对文本特征的指导作用,因而降低了文本生成图像中文本信息的表征性.其次,由于没有考虑到生成目标区域间的动态交互,生成网络只能粗略地划分目标区域,且忽略了图像局部区域与文本语义标签的潜在对应关系.为解决上述问题,提出了一种基于图像-文本语义一致性的文本生成图像方法 ITSC-GAN.该模型首先设计了一个文本信息增强模块(text information enhancement module, TEM),利用生成图像对文本信息进行增强,从而提高文本特征的表征能力.另外,该模型提出了一个图像区域注意力模块(image regional attention module, IRAM),通过挖掘图像子区域之间的关系,增强图像特...  相似文献   

19.
针对自然场景中标志文本提出一种文本定位算法.在彩色图像边缘提取的基础上,利用形态学文本定位获得备选文本区域,再用神经网络对备选文本区域进行分类,最后提取文本区域文字.该算法既考虑文本的形状边缘信息,又考虑文本的颜色信息,充分利用基于边缘的方法和基于神经网络学习的方法的优点.实验结果表明,提出的文本定位算法具有较高的准确率.  相似文献   

20.
本文根据孟加拉数字的特点,用Kirsch算子提取字符图像象素的水平、垂直、右对角线和左对角线特征矢量,采用BP神经网络作分类器进行识别。实验结果显示,对于孟加拉手写体数字具有较高的识别率和较快的识别速度,并对其它手写体数字也有很强的应用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号