首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
从图像中提取文字属于信息智能化处理的前沿课题,是当前人工智能与模式识别领域中的研究热点。由于文字具有高级语义特征,对图片内容的理解、索引、检索具有重要作用,因此,研究图片文字提取具有重要的实际意义。又由于静态图像文字提取是动态图像文字提取的基础,故着重介绍了静态图像文字提取技术,总结了几种已提出的算法,并利用计算机语言学方法对提取出的文字进行后期处理,大大提高了文字提取的正确率。  相似文献   

2.
从图像中提取文字属于信息智能化处理的前沿课题,是当前人工智能与模式识别领域中的研究热点.由于文字具有高级语义特征,对图片内容的理解、索引、检索具有重要作用,因此,研究图片文字提取具有重要的实际意义.又由于静态图像文字提取是动态图像文字提取的基础,故着重介绍了静态图像文字提取技术,总结了几种已提出的算法,并利用计算机语言学方法对提取出的文字进行后期处理,大大提高了文字提取的正确率.  相似文献   

3.
近年来,数字图像的数量急剧上涨。通常数字图像中所包含的文字信息对于图片内容的理解、索引和检索具有重要意义。该文介绍了计算机对图像中文字自动识别和提取的主要步骤和技术难点;并提出了在静态图像文字提取技术中的几个设想。  相似文献   

4.
图片中含有丰富的文字信息,这有利于正确理解图像内容,并对构建基于图片内容进行检索的系统具有重要意义。本文将基于自然场景中的文字特征的文本检测技术,进行了分类分析,并对国内外的研究现状进行了阐述。  相似文献   

5.
文本是计算机视觉的许多应用中的一项重要特征,图像中的文本往往包含着比较丰富的信息,将文本图像信息里的文字进行提取和识别,对于图像内容的分析、理解、信息检索等方面具有重要的意义。文本图像的识别分为预处理,文字的切分,细化,特征选择与提取,最后对候选文字进行识别。在文字的切分方面提出了一种改进的投影算法,该算法能在很大程度上提高文字切分的准确度,采用基于数学形态学算法对文字进行细化处理,并在特征选择方面引用了多级分类的算法。  相似文献   

6.
该文研究了一种从甲骨文图片、图像中提取甲骨文字轮廓的算法,该算法充分考虑了甲骨文字的图像特征和文字特征,采用数据挖掘中的K-mean聚类算法对甲骨文图像中的数据进行分析,消除了在甲骨文字的采集过程中的失真现象,从而形成正确的文字轮廓,更方便于甲骨文字的提取、编辑和使用。  相似文献   

7.
《信息与电脑》2019,(22):28-30
在智能自动化领域,具有群体智能特征的蚁群算法引起了人们的广泛关注。目前,在文字识别方面的研究仍较少,而在当今社会很多方面都需要用到文字图像边缘的检测与文字识别,在文字信息泛滥的时代,利用人工识别技术检测识别图片、纸张、广告牌、视频等媒介上的文字已经变得不太现实。为了准确、高效地检测识别出文字,在学习了蚁群算法的基本原理之后,改进了传统的蚁群算法,并将其应用于图像分割、提取文字领域,同时结合图像文字识别技术OCR和纹理特征检测文字图像边缘,由此提高文字检测识别的准确性。  相似文献   

8.
传统的少数民族文字缺乏利用数字图像处理技术进行分析的研究,水族古文字依靠口传、纸张手抄、刺绣、碑刻、木刻和古籍等传承,文字清晰度不足,数字化读取困难,无法满足信息化时代对濒危水族文字抢救提出的新要求.文中提出一种基于自适应图像增强及区域检测的水族文字提取与分割算法,通过对数变换和伽玛变换处理复杂环境下图像的光照影响,利用中值滤波降低噪声,接着采用Sobel算子提取水书灰度图像的文字边缘细节,通过阈值化、膨胀和腐蚀处理提取文字轮廓,最后通过区域检测与文字定位算法实现水族古文字的提取和分割.实验结果表明该算法能有效降低图像噪声并提取水族文字,分离的水族文字信息较完整,在一定程度上减轻了民族研究者和考古专家的工作量.该算法可以应用于水族文字识别、文物修复和保护、水族文化传承等领域,具有一定的应用前景和实用价值.  相似文献   

9.
视频文字信息在基于语义的视频分析、检索、提取中占有重要地位。根据视频中文字和背景的灰度变化程度不同,提出一种基于梯度离散余弦变换的视频文字定位方法:先对视频帧进行NX V分块,计算每一块的离散余弦变换系数,然后求出梯度算子的幅值,利用得到的幅值作为块强度进行平滑滤波以及形态学处理,最后对图像进行水平和垂直方向投影,统计字幕条数,并利用文本框标识文字区域,进而达到对视频文字定位的目的。仿真结果表明这种视频文字定位方法对于静态文字和滚动字幕的定位均是可行的,且其算法的运行速度快、效率高,特别是对于笔画较少的文字定位准确,不会出现遗漏现象。  相似文献   

10.
种耀华  张久文  董敏 《计算机应用》2012,32(Z2):182-185
采用了非下采样Contourlet变换(NSCT)与动态阈值二值化相结合的方法对图像内的文字信息进行提取。首先对图像进行空间多分辨率变换,再利用NSCT得到图像的高频子带信息和低频子带信息。因高频子带含有丰富的纹理细节信息,而低频子带则含有图像的概貌信息,故将低频子带去除,再结合K-means算法对高频子带进行分类和能量变换,并选取动态阈值对子带进行二值化处理,筛除背景信息。最后综合各分辨率图像的实验结果进行定位,得到了文字区域。实验结果表明该方法能够准确捕获图像文字区域,提取得到理想的图像文字信息,并且具有对文字大小以及噪声鲁棒性好,对图像通用性强的优点。  相似文献   

11.
提出了从复杂背景视频图像中提取文字并识别的一套算法,利用自适应迭代算法提取视频中维吾尔文字,针对维吾尔文字的一些特点,利用合适的预处理方法保留维吾尔文字中的各种点及特殊笔画,同时有效地消除了复杂背景带来的噪声。考虑维吾尔文字书写的特点,利用滑动窗口法提取文字特征避免了文字分割,将产生的特征向量输入到隐马尔可夫模型(Hidden Morkov Model)中进行训练和识别。  相似文献   

12.
启发式相关文本提取技术研究   总被引:2,自引:0,他引:2  
随着WEB上图片资源的日益丰富,人们对WEB图片检索的需求也日趋强烈,基于文本检索WEB图片,是人们当前检索WEB图片的主要手段,其中,提取图片的相关文本是实现基于文本的图片检索的基础,现有的相关文本提取技术对WEB的复杂性理解不够,使用固定的模式提取文本,常常以偏概全,提取效果不佳.本文进一步明确了相关文本的概念,使用启发式提取方法,让系统更智能地提取相关文本,实验表明,该技术能提取到绝大部分的相关文本,并且所提取的文本与图片的相关度也很高.  相似文献   

13.
近年来,篡改文本图像在互联网的广泛传播为文本图像安全带来严重威胁。然而,相应的篡改文本检测(TTD,tamperedtextdetection)方法却未得到充分的探索。TTD任务旨在定位图像中所有文本区域,同时根据纹理的真实性判断文本区域是否被篡改。与一般的文本检测任务不同,TTD任务需要进一步感知真实文本和篡改文本分类的细粒度信息。TTD任务有两个主要挑战:一方面,由于真实文本和篡改文本的纹理具有较高的相似性,仅在空域(RGB)进行纹理特征学习的篡改文本检测方法不能很好地区分两类文本;另一方面,由于检测真实文本和篡改文本的难度不同,检测模型无法平衡两类文本的学习过程,从而造成两类文本检测精度的不平衡问题。相较于空域特征,文本纹理在频域中的不连续性能够帮助网络鉴别文本实例的真伪,根据上述依据,提出基于空域和频域(RGB and frequency)关系建模的篡改文本检测方法。采用空域和频域特征提取器分别提取空域和频域特征,通过引入频域信息增强网络对篡改纹理的鉴别能力;使用全局空频域关系模块建模不同文本实例的纹理真实性关系,通过参考同幅图像中其他文本实例的空频域特征来辅助判断当前文本实例...  相似文献   

14.
自动从视频图像中提取文字信息,对于监控视频图像内容、添加视频标签和建立视频图像检索系统,有重要的意义。文字检测是文字信息提取系统的前端,是文字信息提取中最关键的一步。近年来,视频图像文字信息检测领域有了新的重要的发展,综述从基于区域和基于纹理的文字检测方法进行归纳、比较和分析,概括了近年来文字检测技术的主要进展。此外,为了突出综合性方法的重要性,对其专门进行了总结。最后对视频图像中的文字检测技术的难点进行总结,并对其发展趋势进行展望。  相似文献   

15.
一种Web主题文本通用提取方法   总被引:2,自引:0,他引:2  
为构建大规模中文文本语料库,提出了一种简单、有效、通用的中文Web主题文本提取方法。该方法巧妙地利用中文文本长度和标点符号序列,配合少量判别规则,便可准确地将主题文本从网页中提取出来。由于本方法不涉及具体的HTML标记分析,其通用性较强。实验结果表明该提取方法具有快速性和准确性,达到了构建大规模中文文本语料库的要求。  相似文献   

16.
由于视频中固化的字幕影响了不同语种间视频的交流和处理,为此提出了一种基于CEMA算法和纹理修复技术的自动检测与去除视频内字幕的方法。首先,运用CEMA算法检测出视频中的字幕,然后,结合纹理修复技术,将检测出来的字幕从原图中去除,同时,恢复原图中被字幕所遮挡的背景区域。实验结果表明,该方法能较好地检测和去除视频图像内的字幕。  相似文献   

17.
目的 目前基于卷积神经网络(CNN)的文本检测方法对自然场景中小尺度文本的定位非常困难。但自然场景图像中文本目标与其他目标存在很强的关联性,即自然场景中的文本通常伴随特定物体如广告牌、路牌等同时出现,基于此本文提出了一种顾及目标关联的级联CNN自然场景文本检测方法。方法 首先利用CNN检测文本目标及包含文本的关联物体目标,得到文本候选框及包含文本的关联物体候选框;再扩大包含文本的关联物体候选框区域,并从原始图像中裁剪,然后以该裁剪图像作为CNN的输入再精确检测文本候选框;最后采用非极大值抑制方法融合上述两步生成的文本候选框,得到文本检测结果。结果 本文方法能够有效地检测小尺度文本,在ICDAR-2013数据集上召回率、准确率和F值分别为0.817、0.880和0.847。结论 本文方法顾及自然场景中文本目标与包含文本的物体目标的强关联性,提高了自然场景图像中小尺度文本检测的召回率。  相似文献   

18.
文本生成图像算法对生成图像的质量和文本匹配度有很高的要求. 为了提高生成图像的清晰度, 在现有算法的基础上改进生成对抗网络模型. 加入动态记忆网络、细节校正模块(DCM)、文本图像仿射组合模块(ACM)来提高生成图片的质量. 其中动态记忆网络可以细化模糊图像并选择重要的文本信息存储, 以提高下一阶段生成图像的质量. DCM纠正细节, 完成合成图像中缺失部分. ACM编码原始图像特征, 重建与文本描述无关的部分. 改进后的模型实现了两个目标, 一是根据给定文本生成高质量的图片, 同时保留与文本无关的内容. 二是使生成图像不再较大程度依赖于初始图像的生成质量. 通过在CUB-200-2011鸟类数据集进行研究实验, 结果表明相较之前的算法模型, FID (Frechet inception)有了显著的改善, 结果由16.09变为10.40. 证明了算法的可行性和先进性.  相似文献   

19.
针对贸易文本区别于普通文本的不同特性,提出了基于贸易政策文本的主题挖掘模型,对世界贸易组织的贸易政策审议报告进行研究,归纳出文本的主要内容和主题变化趋势,为商务部和中国驻世贸组织使团提供有价值的信息辅助,从而使得快速有效的处理大量的文本成为可能。通过大量的实验,表明了主题挖掘模型的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号