首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
基于笔画和Adaboost的两层视频文字定位算法   总被引:2,自引:1,他引:2  
程豪  黄磊  刘昌平  谭怒涛 《自动化学报》2008,34(10):1312-1318
在定位和验证的两级框架下提出了一种新的视频文字定位算法. 在定位模块中, 充分利用字符的笔画属性, 引入对字符区域有很强的响应的笔画算子; 经笔画提取, 密度过滤, 区域分解得候选文本行. 在验证模块中, 提取对文字有较强鉴别能力的边缘方向直方图特征, 使用Adaboost算法训练的分类器对候选文本行进行筛选. 实验结果表明, 该算法具有较强的鲁棒性, 在不同类型的视频帧中都能得到较好的定位结果.  相似文献   

2.
视频中的文字为视频的检索、编码、分类等提供了许多重要的信息。论文介绍了一种基于先验知识和机器学习的文本定位方法。利用彩色视频图像的边缘信息和先验知识得到备选文本区域;用多通道Gabor滤波器提取备选区域特征,通过BP网络验证备选文本区域。  相似文献   

3.
视频文本的自动提取方法   总被引:4,自引:0,他引:4  
提出一种基于彩色边缘检测和游程平滑的视频文本提取方法,首先用彩色边缘检测算子检测出图像中的边缘。然后用多次水平和垂直的游程平滑操作使得文字边缘形成连通区域,并去掉部分孤立的噪声,再通过对连通域的分析和分解定位出文本区域的边界,最后对文本区进行确认.实验表明,本文的视频文本自动提取方法具有较高的文本提取率和较准确的边界定位。  相似文献   

4.
视频和图像中的文本通常在基于内容的视频数据库检索、网络视频搜索,图像分割和图像修复等中起到重要作用,为了提高文本检测的效率,给出了一种基于多种特征自适应阈值的视频文本检测方法.方法是在Michael算法的基础上,利用文本边缘的强度,密度,水平竖直边缘比3个特征计算自适应局部阈值,用阈值能较好去除非文本区域,提取文本边缘,检测并定位文本,减少了Michael算法单一特征阈值的不利影响.在文本定位阶段引入了合并机制.减少了不完整区域的出现.实验结果表明有较高的精度和召回率,可用于视频搜索、图像分割和图像修复等.  相似文献   

5.
视频图像中包含着许多重要的文字信息。图像和视频文本信息的提取包括文本检测、定位、跟踪、提取、增强和识别等几个部分。将文本的检测、定位与提取,作为文本区域提取的整体来讨论。以文本的检测算法为重点研究对象,提出了应用小波模极大值算法来解决视频图像中文本区域的检测。实验表明,小波模极大值算法所得到的文本区域与其它算法相比具有更好的评价指标。  相似文献   

6.
针对新闻视频帧中文本区域的定位提取问题,提出了一种有效的字幕定位提取方法。通过灰度差分和变异灰度直方图对新闻视频帧字幕区域定位,再经改进的二维最大熵阈值方法对分割出的文字区域进行二值化,得到可识别的文字图片。最后对文本定位和OCR识别情况进行了算法对比。实验表明:与传统的投影法和最大熵方法相比,该方法可有效地提高文本定位的查全率和OCR的识别率。  相似文献   

7.
针对光照不均和背景复杂度所导致的自然场景文本检测中文本的漏检和错检现象,提出一种基于笔画角度变换和宽度特征的自然场景文本检测方法。分析发现与非文本相比,文本具有较稳定的笔画角度变换次数和笔画宽度,针对这两个特性提出笔画外边界优劣角变换次数和增强笔画支持像素面积比两种特征。前者分段统计笔画外轮廓角度变换次数;后者计算笔画宽度稳定区域在笔画总面积的占比,用来分别反映笔画角度和宽度变化稳定特性。为降低文本漏检率,采用多通道最大稳定极值区域(maximally stable extremal regions,MSER)检测,合并所有候选区域,提取候选区域的笔画特征和纹理特征,利用支持向量机完成文本和非文本区域分类。在ICDAR2015数据库上,算法的精确率和召回率分别达到79.3%和72.8%,并在一定程度上解决了光照不均和复杂背景的问题。  相似文献   

8.
自动提取图像中的文本对图像视频检索具有重要意义.提出了一种基于颜色和笔画特征,应用无监督聚类方法进行复杂背景下的文本分割算法.首先在对文本行图像增强的基础上,应用颜色约减和直方图确定文本颜色.然后提取颜色和笔画特征,应用k-均值聚类算法分割出文本和背景像素.最后应用后处理优化分割结果.实验表明,该算法具有较好的分割效果.  相似文献   

9.
沈任道  黎绍发  江焯林 《计算机工程》2009,35(9):214-216,219
针对大多数视频文本边缘丰富且颜色单一、水平排列的特点,通过基于dcriche边缘的方法迅速确定视频图像中可能包含文本的区域,使用基于颜色的方法从中提取精确的二值文本图像.实验结果表明,该文本提取方法适用于背景复杂的视频图像,且与单纯基于颜色的算法相比,在速度和提取效果方面更具优越性.  相似文献   

10.
针对视频帧图像背景复杂、字体大小变化较大等特点,提出一种改进的视频帧中文本区域定位算法。算法设计并实现一个交叉点检测算法,利用交叉点密度等边缘特征去除大部分非文字边缘以降低背景边缘对文本区域的影响,并对剩余边缘进行膨胀以形成候选文本区域,结合文本区域特征和支持向量机算法区分文本区域和非文本区域。实验表明,该算法可以提取视频帧中90%以上的文本区域,并且文本区域定位准确率达92.0%。  相似文献   

11.
由于视频中固化的字幕影响了不同语种间视频的交流和处理,为此提出了一种基于CEMA算法和纹理修复技术的自动检测与去除视频内字幕的方法。首先,运用CEMA算法检测出视频中的字幕,然后,结合纹理修复技术,将检测出来的字幕从原图中去除,同时,恢复原图中被字幕所遮挡的背景区域。实验结果表明,该方法能较好地检测和去除视频图像内的字幕。  相似文献   

12.
Video text detection and segmentation for optical character recognition   总被引:1,自引:0,他引:1  
In this paper, we present approaches to detecting and segmenting text in videos. The proposed video-text-detection technique is capable of adaptively applying appropriate operators for video frames of different modalities by classifying the background complexities. Effective operators such as the repeated shifting operations are applied for the noise removal of images with high edge density. Meanwhile, a text-enhancement technique is used to highlight the text regions of low-contrast images. A coarse-to-fine projection technique is then employed to extract text lines from video frames. Experimental results indicate that the proposed text-detection approach is superior to the machine-learning-based (such as SVM and neural network), multiresolution-based, and DCT-based approaches in terms of detection and false-alarm rates. Besides text detection, a technique for text segmentation is also proposed based on adaptive thresholding. A commercial OCR package is then used to recognize the segmented foreground text. A satisfactory character-recognition rate is reported in our experiments.Published online: 14 December 2004  相似文献   

13.
提出了一种基于Adaboost算法的场景中文文本定位的新方法。首先利用边缘特征进行文本区域的检测,即对数字图像进行边缘提取、二值化处理,然后通过连通域分析去除明显的非字符连通域,并获得候选的文本区域。对场景中文文本区域进行分析,提取了场景中文文本的4类特征,并利用这4类特征经过分类与回归决策树构造了Adaboost强分类器。将候选文本区域送入强分类器,得到正确的文本区域。实验结果表明方法不仅对场景文本图像中字体、大小和颜色多变的文本具有很好的定位效果,而且具有很高的召回率和准确率。  相似文献   

14.
一种视频文本自动定位、跟踪和识别的方法   总被引:3,自引:0,他引:3       下载免费PDF全文
视频数据中的文本能提供重要的语义信息。本文提出了一种视频文本自动定位、跟踪和识别的方法,首先用基于小波和LH检测视频帧文本所在的位置,然后用运动估计的方法,跟踪后继帧文本的位置,再用多帧平均的方法增强文本区域,最后经过二值化处理和连通分量分析,将文本字符送入OCR软件进行识别。实验结果表明,该方法简单易行,能快速地定位和跟踪文本区域,定位精度和识别效果良好。  相似文献   

15.
自动从视频图像中提取文字信息,对于监控视频图像内容、添加视频标签和建立视频图像检索系统,有重要的意义。文字检测是文字信息提取系统的前端,是文字信息提取中最关键的一步。近年来,视频图像文字信息检测领域有了新的重要的发展,综述从基于区域和基于纹理的文字检测方法进行归纳、比较和分析,概括了近年来文字检测技术的主要进展。此外,为了突出综合性方法的重要性,对其专门进行了总结。最后对视频图像中的文字检测技术的难点进行总结,并对其发展趋势进行展望。  相似文献   

16.
为了准确有效地定位出图像中的维吾尔文本区域,提出了一种基于通道增强最大稳定极值区域(Maximally Stable Extremal Region,MSER)和卷积神经网络(Convolutional Neural Network,CNN)的图像文本区域定位方法。应用通道增强MSER提取候选区域,根据文本特征的启发式规则以及CNN分类结果去除非文本和重复区域,通过区域融合算法得到词级别文本区域,根据该区域的色彩相近程度和空间关系召回遗漏的文本区域,并通过CNN网络对召回的区域分类融合,定位出图像文本区域。实验结果表明,该方法可以准确有效地定位文本区域,具有鲁棒性和应用性。  相似文献   

17.
Textual data is very important in a number of applications such as image database indexing and document understanding. The goal of automatic text location without character recognition capabilities is to extract image regions that contain only text. These regions can then be either fed to an optical character recognition module or highlighted for a user. Text location is a very difficult problem because the characters in text can vary in font, size, spacing, alignment, orientation, color and texture. Further, characters are often embedded in a complex background in the image. We propose a new text location algorithm that is suitable in a number of applications, including conversion of newspaper advertisements from paper documents to their electronic versions, World Wide Web search, color image indexing and video indexing. In many of these applications, it is not necessary to extract all the text, so we emphasize on extracting important text with large size and high contrast. Our algorithm is very fast and has been shown to be successful in extracting important text in a large number of test images.  相似文献   

18.
为实现新闻视频图像中标注文本的快速检测与定位,提出了一种有效的字幕定位方法。该方法通过灰度差分统计对视频帧中文字区域进行行定位,再利用行定位信息得到的子图像在垂直方向的投影进行列定位,最后对预处理结果进行过滤和合并得到文字区域定位的精确结果。实验结果表明:该方法效果良好,不受文字大小影响,不受图像背景复杂度限制,方便快捷。  相似文献   

19.
基于多帧图像的视频文字跟踪和分割算法   总被引:8,自引:2,他引:6  
视频中文字的提取是视频语义理解和检索的重要信息来源.针对视频中的静止文字时间和空间上的冗余特性,以文字区域的边缘位图为特征对检测结果作精化,并提出了基于二分搜索法的快速文字跟踪算法,实现了对文字对象快速有效的定位.在分割阶段,除了采用传统的灰度融合图像进行文字区域增强方法,还结合边缘位图对文字区域进行进一步的背景过滤.实验表明,文字的检测精度和分割质量都有很大提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号