首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
基于小波变换的图像中维吾尔文字定位   总被引:3,自引:0,他引:3       下载免费PDF全文
在对维吾尔文字结构特点分析的基础上,研究维吾尔文字在小波变换中的特征,依据这些特征提出基于小波变换的视频图像中维吾尔文字定位的方法。用具有良好的时频局部和变尺度特性的小波分析方法,提取出纹理清晰、具有不同空间分辨率、不同方向的边缘子图像,用数学形态学的方法对提取出的细节图像进行进一步的形态运算,消除噪声,得到最终的文本目标区域。实验表明该方法简单有效,适合于背景较复杂的维吾尔文字定位。  相似文献   

2.
复杂背景下维吾尔文字符的分割算法   总被引:4,自引:0,他引:4       下载免费PDF全文
在视频或图像中包含丰富的文字信息,这些文字信息与视频或图像的内容密切相关,因此可以作为视频片断或者图像的内容标识和索引。以视频维吾尔文为例,首先用Canny算子将彩色图像转换为灰度化的边缘图像,其次对图像中的文字进行定位,再对图像进行边缘点彩色分割,然后进行文字图像行区域和列区域的检测,最后基于候选文本区的特征从不同复杂度的彩色图像中提取文本信息,实验结果表明了算法的有效性。  相似文献   

3.
针对视频帧图像背景复杂、字体大小变化较大等特点,提出一种改进的视频帧中文本区域定位算法。算法设计并实现一个交叉点检测算法,利用交叉点密度等边缘特征去除大部分非文字边缘以降低背景边缘对文本区域的影响,并对剩余边缘进行膨胀以形成候选文本区域,结合文本区域特征和支持向量机算法区分文本区域和非文本区域。实验表明,该算法可以提取视频帧中90%以上的文本区域,并且文本区域定位准确率达92.0%。  相似文献   

4.
视频和图像中的文本通常在基于内容的视频数据库检索、网络视频搜索,图像分割和图像修复等中起到重要作用,为了提高文本检测的效率,给出了一种基于多种特征自适应阈值的视频文本检测方法.方法是在Michael算法的基础上,利用文本边缘的强度,密度,水平竖直边缘比3个特征计算自适应局部阈值,用阈值能较好去除非文本区域,提取文本边缘,检测并定位文本,减少了Michael算法单一特征阈值的不利影响.在文本定位阶段引入了合并机制.减少了不完整区域的出现.实验结果表明有较高的精度和召回率,可用于视频搜索、图像分割和图像修复等.  相似文献   

5.
陈烽  杨怀 《计算机仿真》2024,(2):192-195+226
视频图像不同栅格位置或不同压缩区域被合成为篡改图像时会出现特征块效应的差异,改变原视频的关键信息。为了准确识别图像中被篡改的像素点,提出基于边缘异常识别的视频图像篡改检测方法。通过离散余弦变换,将能量全部集中到图像的低频系数内,描述出视频的边缘等细节。利用能量比与频域熵间关系得出图像中能量的可疑度,结合预测掩膜概率图划分出发生篡改的位置区域。利用Sobel边缘检测边缘点,量化边缘点特征判断出边缘是否异常,当出现异常对其跟踪直至目标消失,检测出视频图像中的篡改位置区域。实验结果表明,所提方法能够精准检测出视频图像被篡改位置,且耗时低于1ms,应用优势显著。  相似文献   

6.
基于聚类与边缘检测的自然场景文本提取方法   总被引:1,自引:0,他引:1  
为了解决复杂自然场景、光照不均匀及背景纹理丰富图像中文本的有效提取,提出一种基于K-means聚类与边缘检测结合的自然场景文本提取方法.该方法通过改进K-means聚类算法,实现文本区域的分割;然后对分割后的图像进行二值子图分解,将分解后的各子图像的连通区域进行标记与分析,得到候选的字符区域;最后利用文本区域的边缘特征对候选字符区域过滤,实现文本字符的提取.实验结果表明,该方法能有效提取出复杂背景、光照影响及背景纹理丰富图像中的文本字符区域.  相似文献   

7.
面向彩色图像和视频的文本提取新方法   总被引:10,自引:1,他引:10  
随着基于内容检索技术的发展,人们逐渐意识到包含在彩色图像和视频中的文本具有重要的语义作用,并需要采用有效的方法来提取这些文本,文中提出一个全面作用在RGB颜色空间3个分量上的彩色图像边缘检测新算子和一种利用空间频率特征,结合彩色边缘检测与基于区域图像分割方法的彩色图像和视频文本提取新算法。实验表明在彩色图像和视频的文本提取中,文中算子形成的二值边缘图像的文本区域轮廓清晰完整,有利于下一步文本区域与背景的剥离,该算法具有较高的广西区域提取准确率和较好的对于文本字符在尺寸和颜色方面的适应性。  相似文献   

8.
基于Matlab GUI的维吾尔文字符识别系统的设计   总被引:2,自引:0,他引:2  
基于建立对视频中维吾尔文字符的识别提取系统,以视频中维吾尔字符为对象,首先对维吾尔文字符进行了字符检测,以便确定其维吾尔文字符在视频中的大小、位置,其次对所确定的维吾尔文字符进行字符定位以便作进一步的处理,然后运用Canny算子将其提取出的维吾尔文字符进行彩色图像转换为灰度化的边缘图像,最后利用Matlab GUI设计了维吾尔文字符的识别系统,实现了视频中维吾尔文字符的检测、字符定位、图像抖动、对比度调整、灰度化、边缘检测、提取字符等功能.实验结果均显示出该算法的优良性能,并证明了该识别系统性能的稳定性和极其良好的扩展性,为维吾尔文字符的识别研究提供了一个简单有效的仿真平台.  相似文献   

9.
基于颜色聚类和多帧融合的视频文字识别方法   总被引:1,自引:0,他引:1  
易剑  彭宇新  肖建国 《软件学报》2011,22(12):2919-2933
提出一种基于颜色聚类和多帧融合的视频文字识别方法,首先,在视频文字检测模块,综合考虑了文字区域的两个显著特征:一致的颜色和密集的边缘,利用近邻传播聚类算法,根据图像中边缘颜色的复杂程度,自适应地把彩色边缘分解到若干边缘子图中去,使得在各个子图中检测文字区域更为准确.其次,在视频文字增强模块,基于文字笔画强度图过滤掉模糊的文字区域,并综合平均融合和最小值融合的优点,对在不同视频帧中检测到的、包含相同内容的文字区域进行融合,能够得到背景更为平滑、笔画更为清晰的文字区域图像.最后,在视频文字提取模块,通过自适应地选取具有较高文字对比度的颜色分量进行二值化,能够取得比现有方法更好的二值化结果;另一方面,基于图像中背景与文字的颜色差异,利用颜色聚类的方法去除噪声,能够有效地提高文字识别率.实验结果表明,该方法能够比现有方法取得更好的文字识别结果.  相似文献   

10.
许肖  顾磊 《计算机科学》2016,43(4):313-317
针对复杂背景下的文本检测问题,提出了显著性检测与中心分割算法相结合的文本检测技术。对于输入的图像,首先分别使用前景与背景作为标准的显著性检测方法,背景检测时将图像的四边分别作为基准,前景检测时将背景检测中得到的非背景区域作为基准,最终可得到较准确的备选文本区。然后使用中心分割算法,得到精确的边缘图。由于显著性图备选区域准确边缘细节缺失,而边缘图边缘精确但无法得出备选文本区,因此将两者进行融合处理,得到最终文本区域。实验表明,所提出的方法有较好的检测效果。  相似文献   

11.
提出了一种将垂直颜色边缘与分块多帧分析的文本定位与增强的方法。根据文本的垂直颜色边缘特征进行粗筛选,获得和跟踪文本候选区;然后通过分块多帧分析对文本进行增强。实验表明,该方法能有效去除复杂背景,提高视频文本的识别率。  相似文献   

12.
基于多帧图像的视频文字跟踪和分割算法   总被引:6,自引:2,他引:6  
视频中文字的提取是视频语义理解和检索的重要信息来源.针对视频中的静止文字时间和空间上的冗余特性,以文字区域的边缘位图为特征对检测结果作精化,并提出了基于二分搜索法的快速文字跟踪算法,实现了对文字对象快速有效的定位.在分割阶段,除了采用传统的灰度融合图像进行文字区域增强方法,还结合边缘位图对文字区域进行进一步的背景过滤.实验表明,文字的检测精度和分割质量都有很大提高.  相似文献   

13.
为了准确有效地定位出图像中的维吾尔文本区域,提出了一种基于通道增强最大稳定极值区域(Maximally Stable Extremal Region,MSER)和卷积神经网络(Convolutional Neural Network,CNN)的图像文本区域定位方法。应用通道增强MSER提取候选区域,根据文本特征的启发式规则以及CNN分类结果去除非文本和重复区域,通过区域融合算法得到词级别文本区域,根据该区域的色彩相近程度和空间关系召回遗漏的文本区域,并通过CNN网络对召回的区域分类融合,定位出图像文本区域。实验结果表明,该方法可以准确有效地定位文本区域,具有鲁棒性和应用性。  相似文献   

14.
如何自动选取种子点的位置是基于区域生长法分割文字的关键问题。该算法通过横向线段检测算子提取出文字条中所有的横向线段;统计线段在饱和度、亮度上像素点的分布,根据统计分布使用Otsu法提取出纯净的文字基线,将它作为区域生长种子点的位置;通过生长法则分割文字。实验在四类不同的背景集中测试算法,其中花卉测试集的字母提取率达到72.31%。  相似文献   

15.
基于LBP和FSVM的视频文字定位方法   总被引:1,自引:0,他引:1       下载免费PDF全文
李丽洁  李金  宋阳  王磊 《计算机工程》2011,37(24):144-146
提出一种基于局部二值模式(LBP)和模糊支持向量机(FSVM)的视频文字定位方法。利用边缘信息和形态学操作进行文字粗检测,采用投影直方图和启发式规则形成候选文字区域,提取LBP作为纹理特征,用FSVM对候选文字区域进行精确定位,生成最终的文字块。实验结果表明,该方法具有较好的视频文字定位能力且鲁棒性较强。  相似文献   

16.
一种基于边缘检测和线条特征的视频字符检测算法   总被引:10,自引:0,他引:10  
刘洋  薛向阳  路红  郭跃飞 《计算机学报》2005,28(3):427-432,F003
叠加在视频帧中的字符串为多媒体数据的高层语义分析提供了重要信息.该文提出了一种基于边缘的视频字符检测算法.利用字符区域内边缘的分布和强度的特点,对Canny边缘检测算子进行改进,使其根据图像内容自动确定分割阈值,确保获得高质量的字符边缘;然后,提取字符线条的关键特征,过滤非字符线条并用神经网络分类器判断最终的字符区域.实验结果表明该文算法在保持高速度和高查全率的同时,有效地降低了虚警,克服了基于边缘的字符检测算法的普遍缺点.  相似文献   

17.
In video indexing and summarization, videotext is the very compact and accurate information. Most videotext detection and extraction methods only deal with the static videotext on video frames. Few methods can handle motion videotext efficiently since motion videotext is hardly extracted well. In this paper, we propose a two-directional videotext extractor, called 2DVTE. It is developed as an integrated system to detect, localize and extract the scrolling videotexts. First, the detection method is carried out by edge information to classify regions into text and non-text regions. Second, referring to the localization on scrolling videotext, we propose the two-dimensional projection profile method with horizontal and vertical edge map information. Considering the characteristics of Chinese text, the vertical edge map is used to localize the possible text region and horizontal edge map is used to refine the text region. Third, the extraction method consists of dual mode adaptive thresholding and multi-seed filling algorithm. In the dual mode adaptive thresholding, it produces the non-rectangle pattern to divide the background and foreground more precisely. Referring to the multi-seed filling algorithm, it is based on the consideration of the minimum and maximum length and four directions of the stroke while the previous method only considers the minimum length and two directions of the stroke. With this multi-seed exploitation on strokes, precise seeds are obtained to produce more sophisticated videotext. Considering high throughput and the low complexity issue, we can achieve a real-time system on detecting, localizing, and extracting the scrolling videotexts with only one frame usage instead of multi-frame integration in other literatures. According to the experiment results on various video sequences, all of the horizontal and vertical scrolling videotexts can be extracted precisely. We also make comparisons with other methods. In our analysis, the performance of our algorithm is superior to other existing methods in speed and quality.  相似文献   

18.
由于视频中固化的字幕影响了不同语种间视频的交流和处理,为此提出了一种基于CEMA算法和纹理修复技术的自动检测与去除视频内字幕的方法。首先,运用CEMA算法检测出视频中的字幕,然后,结合纹理修复技术,将检测出来的字幕从原图中去除,同时,恢复原图中被字幕所遮挡的背景区域。实验结果表明,该方法能较好地检测和去除视频图像内的字幕。  相似文献   

19.
A new method for detecting text in video images is proposed in this article. Variations in background complexity, font size and color, make detecting text regions in video images a difficult task. A pyramidal scheme is utilized to solve these problems. First, two downsized images are generated by bilinear interpolation from the original image. Then, the gradient difference of each pixel is calculated for three differently sized images, including the original one. Next, three K-means clustering procedures are applied to separate all the pixels of the three gradient difference images into two clusters: text and non-text, separately. The K-means clustering results are then combined to form the text regions. Thereafter, projection profile analysis is applied to the Sobel edge map of each text region to determine the boundaries of candidate text regions. Finally, we identify text candidates through two verification phases. In the first verification phase, we verify the geometrical properties and texture of each text candidate. In the second verification phase, statistical characteristics of the text candidate are computed using a discrete wavelet transform, and then the principal component analysis is further used to reduce the number of dimensions of these features. Next, the optimal decision function of the support vector machine, obtained by sequential minimal optimization, is applied to determine whether the text candidates contain texts or not.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号