首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
从图像中提取文字属于信息智能化处理的前沿课题,是当前人工智能与模式识别领域中的研究热点。由于文字具有高级语义特征,对图片内容的理解、索引、检索具有重要作用,因此,研究图片文字提取具有重要的实际意义。又由于静态图像文字提取是动态图像文字提取的基础,故着重介绍了静态图像文字提取技术,总结了几种已提出的算法,并利用计算机语言学方法对提取出的文字进行后期处理,大大提高了文字提取的正确率。  相似文献   

2.
从图像中提取文字属于信息智能化处理的前沿课题,是当前人工智能与模式识别领域中的研究热点。由于文字具有高级语义特征,对图片内容的理解、索引、检索具有重要作用,因此,研究图片文字提取具有重要的实际意义。又由于静态图像文字提取是动态图像文字提取的基础,故着重介绍了静态图像文字提取技术,总结了几种已提出的算法,并利用计算机语言学方法对提取出的文字进行后期处理,大大提高了文字提取的正确率。  相似文献   

3.
从图像中提取文字属于信息智能化处理的前沿课题,是当前人工智能与模式识别领域中的研究热点.由于文字具有高级语义特征,对图片内容的理解、索引、检索具有重要作用,因此,研究图片文字提取具有重要的实际意义.又由于静态图像文字提取是动态图像文字提取的基础,故着重介绍了静态图像文字提取技术,总结了几种已提出的算法,并利用计算机语言学方法对提取出的文字进行后期处理,大大提高了文字提取的正确率.  相似文献   

4.
图像和视频中的文字获取技术   总被引:6,自引:0,他引:6       下载免费PDF全文
许多图像都包含丰富的文字信息,如用作网页设计的以图像形式存在的标语和视频图像中的字幕。这些文字的自动检测、分割、提取和识别,对图像高层语义内容的自动理解、索引和检索非常有价值,因此引起国内外众多学者的研究兴趣。为使人们对该领域有一个系统的了解,并使该领域研究人员有所借鉴,在对目前国内外图像和视频中文字获取技术相关文献综合理解的基础上,综述了该领域的发展现状,同时从文字检测、抽取和文字识别两个方面,重点讨论了其主要的技术方法及应用优缺点,并结合当前面临的问题,指出今后可进一步研究的方向。  相似文献   

5.
自动从视频图像中提取文字信息,对于监控视频图像内容、添加视频标签和建立视频图像检索系统,有重要的意义。文字检测是文字信息提取系统的前端,是文字信息提取中最关键的一步。近年来,视频图像文字信息检测领域有了新的重要的发展,综述从基于区域和基于纹理的文字检测方法进行归纳、比较和分析,概括了近年来文字检测技术的主要进展。此外,为了突出综合性方法的重要性,对其专门进行了总结。最后对视频图像中的文字检测技术的难点进行总结,并对其发展趋势进行展望。  相似文献   

6.
传统的少数民族文字缺乏利用数字图像处理技术进行分析的研究,水族古文字依靠口传、纸张手抄、刺绣、碑刻、木刻和古籍等传承,文字清晰度不足,数字化读取困难,无法满足信息化时代对濒危水族文字抢救提出的新要求.文中提出一种基于自适应图像增强及区域检测的水族文字提取与分割算法,通过对数变换和伽玛变换处理复杂环境下图像的光照影响,利用中值滤波降低噪声,接着采用Sobel算子提取水书灰度图像的文字边缘细节,通过阈值化、膨胀和腐蚀处理提取文字轮廓,最后通过区域检测与文字定位算法实现水族古文字的提取和分割.实验结果表明该算法能有效降低图像噪声并提取水族文字,分离的水族文字信息较完整,在一定程度上减轻了民族研究者和考古专家的工作量.该算法可以应用于水族文字识别、文物修复和保护、水族文化传承等领域,具有一定的应用前景和实用价值.  相似文献   

7.
基于点模式匹配的视频文字跟踪和笔画提取   总被引:1,自引:0,他引:1       下载免费PDF全文
给出一种在复杂背景下的视频文字跟踪和文字笔画提取方法。用基于Harris角点特征的点模式匹配法跟踪视频序列中静止和运动的文字,以确定文字序列的时间属性,比较了采用图像整体像素匹配和点模式匹配的跟踪精度。用基于多帧融合思想的前景/背景识别算法提取视频文字笔画并作OCR识别。实验结果显示,点模式匹配的跟踪算法比图像整体像素匹配的算法跟踪精度更高,在图像背景复杂、变化快的情况下,基于多帧融合的文字笔画提取方法优于传统的二值化方法。  相似文献   

8.
为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方法,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘。应用投影法最终确定视频字幕所在区域。最后,利用OCR识别技术对提取出来的文字区域进行识别,完成视频中文字的提取。以上方法的结合保证了提出算法的正确率和鲁棒性。  相似文献   

9.
基于二值化聚类的图像文字提取算法   总被引:2,自引:0,他引:2  
戴维  张申生 《计算机应用》2009,29(1):57-59,7
为解决渐变色给文字提取聚类算法带来的问题,研究与实现了基于二值化聚类的图像文字提取算法。图像通过一系列预处理后,得到了利于聚类的二值图像,根据背景图像区域特征,对图像进行聚类分块,再利用文字图像区域特征,聚类识别出文字区域。实验表明,该算法在各类图像上取得了理想的效果。  相似文献   

10.
为解决传统的基于Harris角点的图像文字检测算法易受非文字角点干扰,检测准确率低的问题,提出一种基于多尺度Harris图像文字检测算法.该算法在多个尺度下提取角点,并利用分块方法分析文字局部特征,有效剔除了非文字角点.使用多次迭代逐步剔除非文字区域角点,精确提取备选块中的文字角点;通过区域融合形成文字区域,用轮廓跟踪法标识文字区域.实验结果表明,该算法明显提高了图像/视频文字检测的稳定性和准确率.  相似文献   

11.
《信息与电脑》2019,(22):28-30
在智能自动化领域,具有群体智能特征的蚁群算法引起了人们的广泛关注。目前,在文字识别方面的研究仍较少,而在当今社会很多方面都需要用到文字图像边缘的检测与文字识别,在文字信息泛滥的时代,利用人工识别技术检测识别图片、纸张、广告牌、视频等媒介上的文字已经变得不太现实。为了准确、高效地检测识别出文字,在学习了蚁群算法的基本原理之后,改进了传统的蚁群算法,并将其应用于图像分割、提取文字领域,同时结合图像文字识别技术OCR和纹理特征检测文字图像边缘,由此提高文字检测识别的准确性。  相似文献   

12.
种耀华  张久文  董敏 《计算机应用》2012,32(Z2):182-185
采用了非下采样Contourlet变换(NSCT)与动态阈值二值化相结合的方法对图像内的文字信息进行提取。首先对图像进行空间多分辨率变换,再利用NSCT得到图像的高频子带信息和低频子带信息。因高频子带含有丰富的纹理细节信息,而低频子带则含有图像的概貌信息,故将低频子带去除,再结合K-means算法对高频子带进行分类和能量变换,并选取动态阈值对子带进行二值化处理,筛除背景信息。最后综合各分辨率图像的实验结果进行定位,得到了文字区域。实验结果表明该方法能够准确捕获图像文字区域,提取得到理想的图像文字信息,并且具有对文字大小以及噪声鲁棒性好,对图像通用性强的优点。  相似文献   

13.
文本是计算机视觉的许多应用中的一项重要特征,图像中的文本往往包含着比较丰富的信息,将文本图像信息里的文字进行提取和识别,对于图像内容的分析、理解、信息检索等方面具有重要的意义。文本图像的识别分为预处理,文字的切分,细化,特征选择与提取,最后对候选文字进行识别。在文字的切分方面提出了一种改进的投影算法,该算法能在很大程度上提高文字切分的准确度,采用基于数学形态学算法对文字进行细化处理,并在特征选择方面引用了多级分类的算法。  相似文献   

14.
复杂背景下维吾尔文字符的分割算法   总被引:4,自引:0,他引:4       下载免费PDF全文
在视频或图像中包含丰富的文字信息,这些文字信息与视频或图像的内容密切相关,因此可以作为视频片断或者图像的内容标识和索引。以视频维吾尔文为例,首先用Canny算子将彩色图像转换为灰度化的边缘图像,其次对图像中的文字进行定位,再对图像进行边缘点彩色分割,然后进行文字图像行区域和列区域的检测,最后基于候选文本区的特征从不同复杂度的彩色图像中提取文本信息,实验结果表明了算法的有效性。  相似文献   

15.
基于蚁群优化算法的复杂背景图像文字检测方法   总被引:2,自引:0,他引:2  
李敏花  柏猛 《计算机应用》2011,31(7):1844-1846
针对复杂背景图像中的文字检测问题,提出一种基于蚁群优化算法的复杂背景图像文字检测方法。该方法首先采用蚁群优化算法提取图像边缘;然后在边缘图像上提取特征,采取由粗到精多级检测、验证的策略进行文字检测。与基于Soble算子、Canny算子等方法的对比实验结果表明,所提出的基于蚁群优化算法的文字检测方法可有效地实现复杂背景图像中的文字检测。  相似文献   

16.
研究了图像定位的问题,由于存在污渍干扰等影响图像定位,针对以往单一特征进行图像文字定位及识别的系统中容易受到各种环境因素干扰的缺陷,提出了一种利用轴对称窗口进行边缘检测的图像文字检测算法。首先将利用轴对称滑动窗口提取水平和竖直方向上的边缘特征,利用连通域确定初始的图像文字位置;通过对可能的图像文字区域进行颜色色调验证,区域内垂直方向直方图投影,从而确定最终的图像文字位置。由于利用多种特征综合检测图像文字进行仿真。仿真结果表明改进方法能准确检测出复杂场景下图像文字所在区域。  相似文献   

17.
Canny边缘算子在简牍文字修复中的应用   总被引:1,自引:0,他引:1  
本文以长沙简牍博物馆所收藏的简牍文物为研究模型,对简牍文字的提取和修复进行了研究.提出了使用Canny边缘检测算子来提取文字的轮廓信息.然后再通过设置灰度阀值和人机交互相结合的方式对文字轮廓进行修复,最后再对文字轮廓进行填充,从而实现了简牍文字的提取与修复.试验表明,该方法对简牍图像的文字信息具有良好的修复效果.  相似文献   

18.
场景文字包含了重要的场景图像的语义信息。因此将场景图像中出现的文字抽取出来,将会对场景图像的内容分析、检索和浏览提供有益的帮助。提出的场景文字提取方法,是在边缘检测的基础上,使用分层块过滤的方法在不同尺度上过滤背景,产生场景文字区域,然后对聚合出来的文字区域根据笔划颜色和笔划宽度方面的特征进行二值化分割得到二值化文字图像,这些二值化后的文字区域图像可以作为OCR引擎的输入进行识别,从而达到提取场景图像语义信息的目的。分层块过滤的方法能较好地过滤背景聚合产生文字区域,利用文字的笔划特征也能有效地分割出文字笔划像素。实验结果也证明了方法的有效性。  相似文献   

19.
文字广泛存在于各种文档图像和自然场景图像之中,蕴含着丰富且关键的语义信息。随着深度学习的发展,研究者不再满足于只获得图像中的文字内容,而更加关注图像中文字的理解,故以文字为中心的图像理解技术受到越来越多的关注。该技术旨在利用文字、视觉物体等多模态信息对文字图像进行充分理解,是计算机视觉和自然语言处理领域的一个交叉研究方向,具有十分重要的实际意义。本文主要对具有代表性的以文字为中心的图像理解任务进行综述,并按照理解认知程度,将以文字为中心的图像理解任务划分为两类,第1类仅要求模型具备抽取信息的能力,第2类不仅要求模型具备抽取信息的能力,而且要求模型具备一定的分析和推理能力。本文梳理了以文字为中心的图像理解任务所涉及的数据集、评价指标和经典方法,并进行对比分析,提出了相关工作中存在的问题和未来发展趋势,希望能够为后续相关研究提供参考。  相似文献   

20.
文字识别的难点和关键在于特征提取,文章把文字版面看作是含有特殊纹理信息的图像,利用Gabor变换,通过纹理分析提取出文字的全局特征。文字特征提取后,对其使用SVM进行训练学习。实验结果表明本方法能够较有效地提取出字符特征,并能有效地对字符进行分类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号