首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
基于形态学的视频文本自动检测   总被引:2,自引:0,他引:2  
视频数据中的文本可提供重要的语义信息。该方法首先用形态算子提取视频帧的高频分量,再通过区域标记、连通分量分析、形态后处理等一系列步骤对视频帧进行滤波,得到视频文本检测结果,最后再对其进行二值化处理,把文本字符从复杂背景中分离出来。这种算法能快速地定位文本区域,且不受文本颜色、语种、字体大小、排列方向、文本形变的影响。实验表明,该算法对视频文本进行检测定位精度较高,分割效果良好。  相似文献   

2.
针对视频帧图像背景复杂、字体大小变化较大等特点,提出一种改进的视频帧中文本区域定位算法。算法设计并实现一个交叉点检测算法,利用交叉点密度等边缘特征去除大部分非文字边缘以降低背景边缘对文本区域的影响,并对剩余边缘进行膨胀以形成候选文本区域,结合文本区域特征和支持向量机算法区分文本区域和非文本区域。实验表明,该算法可以提取视频帧中90%以上的文本区域,并且文本区域定位准确率达92.0%。  相似文献   

3.
视频和图像中的文本通常在基于内容的视频数据库检索、网络视频搜索,图像分割和图像修复等中起到重要作用,为了提高文本检测的效率,给出了一种基于多种特征自适应阈值的视频文本检测方法.方法是在Michael算法的基础上,利用文本边缘的强度,密度,水平竖直边缘比3个特征计算自适应局部阈值,用阈值能较好去除非文本区域,提取文本边缘,检测并定位文本,减少了Michael算法单一特征阈值的不利影响.在文本定位阶段引入了合并机制.减少了不完整区域的出现.实验结果表明有较高的精度和召回率,可用于视频搜索、图像分割和图像修复等.  相似文献   

4.
面向彩色图像和视频的文本提取新方法   总被引:10,自引:1,他引:10  
随着基于内容检索技术的发展,人们逐渐意识到包含在彩色图像和视频中的文本具有重要的语义作用,并需要采用有效的方法来提取这些文本,文中提出一个全面作用在RGB颜色空间3个分量上的彩色图像边缘检测新算子和一种利用空间频率特征,结合彩色边缘检测与基于区域图像分割方法的彩色图像和视频文本提取新算法。实验表明在彩色图像和视频的文本提取中,文中算子形成的二值边缘图像的文本区域轮廓清晰完整,有利于下一步文本区域与背景的剥离,该算法具有较高的广西区域提取准确率和较好的对于文本字符在尺寸和颜色方面的适应性。  相似文献   

5.
针对视频中文本信息在视频序列和视频索引中的重要性,本文提出了一种基于文字混合特征的文本定位算法.该算法首先对视频序列中每隔25帧的单帧图像进行边缘检测和投影处理来提取文本块,然后用支持向量基进行筛选,排除非文本块的干扰,最后利用视频序列中相邻帧之间的相关性来搜索剩余帧中的文本块.本文的算法在提高检测速度的同时保证了较高的检测准确度.  相似文献   

6.
视频图像中包含着许多重要的文字信息。图像和视频文本信息的提取包括文本检测、定位、跟踪、提取、增强和识别等几个部分。将文本的检测、定位与提取,作为文本区域提取的整体来讨论。以文本的检测算法为重点研究对象,提出了应用小波模极大值算法来解决视频图像中文本区域的检测。实验表明,小波模极大值算法所得到的文本区域与其它算法相比具有更好的评价指标。  相似文献   

7.
视频数据中的文本能提供重要的语义信息。针对视频中的文本检测问题,提出了用基于边缘信息和LH的方法检测视频帧文本所在的位置,方法简单,能快速地定位文本区域,且不受文本颜色、语种、文本字体大小的限制。检测和分割效果良好。  相似文献   

8.
视频和图像文本提取方法综述   总被引:1,自引:0,他引:1  
文本提取在视频和图像中具有重要的应用价值。近年来,大数据时代带来了海量信息检索的迫切需求,大量视频和图像中文本的提取方法涌现出来。回顾了视频和图像中文本提取的算法,从文本提取流程出发,将其分为文本区域检测定位和文本分割两大步骤。在每个步骤中,分析并比较了现有算法的使用范围及相对优缺点,讨论了图像公用数据库,列举了近些年来图像中文本提取的重要应用,指出了当前研究中存在的问题,展望了视频和场景图像文本提取方法的发展趋势。  相似文献   

9.
目的 数字视频区域篡改是指视频帧图像的某个关键区域被覆盖或被替换,经过图像编辑和修补之后,该关键区域的修改痕迹很难通过肉眼来分辨。视频图像的关键区域承载了视频序列的关键语义信息。如果该篡改操作属于恶意的伪造行为,将产生非常严重的影响和后果。因此,视频区域篡改的检测与定位研究具有重要的研究价值和应用前景。方法 数字图像的复制粘贴篡改检测已经取得较大的研究进展,相关研究成果也很多。但是,数字视频区域篡改的检测与定位不能直接采用数字图像的复制—粘贴篡改取证算法。数字视频区域篡改检测与定位是数字视频被动取证研究领域中的一个新兴的研究方向,近年来越来越多的学者在该领域开展研究工作。目前,数字视频的区域篡改检测与定位研究还缺少完善的理论支撑和通用的检测与定位算法。在广泛调研最近几年的最新研究成果的基础上,对数字视频区域篡改的被动取证概念及重要性进行了介绍,将现有的数字视频区域篡改被动取证算法分为4类:基于噪声模式的算法、基于像素相关性的算法、基于视频内容特征的算法和基于抽象统计特征的算法。然后,对这些区域篡改检测与定位的算法进行对比分析,并介绍现有的视频区域篡改软件和算法,以及篡改检测算法的测试数据库。最后,对本研究领域存在的问题和挑战进行总结,并对未来的研究趋势进行展望。结果 选取了20篇文献中的18种算法,分别介绍每种算法的算法原理,并对这些算法进行对比分析。大部分的算法都宣称可以检测并定位出篡改可疑区域,但是检测和定位的精度、计算复杂度都各有差异。其中,基于时空域的像素相关性分析的算法具有较好的检测和定位效果,并且支持运动背景视频中的运动目标删除篡改检测和定位。基于光流平滑性异常的算法和基于运动目标检测的算法都是基于公开的视频篡改测试库进行比较测试的,两种算法都具有较好的检测和定位效果。基于隐写分析特征提取的集成分类算法虽然只能实现时域上的篡改定位,不能实现更精细的空域篡改定位,但是该算法为基于机器学习的大规模视频篡改取证研究提供了新思路和可能的发展方向,具有较大的指导意义。结论 由于视频编码压缩引入噪声,以及视频区域篡改软件工具和技术的改进,视频区域篡改检测和定位仍是一个极具挑战的课题。未来几年,基于视频内容特征和抽象统计特征的视频区域篡改检测和定位算法,有可能结合深度学习算法,得到进一步的研究和发展;相关的理论算法、系统模型和评价标准等研究成果将逐步完善。  相似文献   

10.
提出一种基于红外和可见光视频融合的夜间行人检测算法。算法融合可见光和红外两种视频信息,使行人检测结果更直观,能够提供视觉丰富的环境信息。首先,通过时空滤波技术和目标热成像特征对红外视频进行滤噪,然后根据红外视频中的亮度信息用区域种子生长算法进行运动目标分割,再根据区域形状及颜色信息进行目标筛选,最后将红外和可见光视频融合起来增强检测结果,使视频中提供的信息更加丰富。  相似文献   

11.
一种视频文本自动定位、跟踪和识别的方法   总被引:3,自引:0,他引:3       下载免费PDF全文
视频数据中的文本能提供重要的语义信息。本文提出了一种视频文本自动定位、跟踪和识别的方法,首先用基于小波和LH检测视频帧文本所在的位置,然后用运动估计的方法,跟踪后继帧文本的位置,再用多帧平均的方法增强文本区域,最后经过二值化处理和连通分量分析,将文本字符送入OCR软件进行识别。实验结果表明,该方法简单易行,能快速地定位和跟踪文本区域,定位精度和识别效果良好。  相似文献   

12.
基于多帧图像的视频文字跟踪和分割算法   总被引:8,自引:2,他引:6  
视频中文字的提取是视频语义理解和检索的重要信息来源.针对视频中的静止文字时间和空间上的冗余特性,以文字区域的边缘位图为特征对检测结果作精化,并提出了基于二分搜索法的快速文字跟踪算法,实现了对文字对象快速有效的定位.在分割阶段,除了采用传统的灰度融合图像进行文字区域增强方法,还结合边缘位图对文字区域进行进一步的背景过滤.实验表明,文字的检测精度和分割质量都有很大提高.  相似文献   

13.
一种基于边缘检测和线条特征的视频字符检测算法   总被引:10,自引:0,他引:10  
刘洋  薛向阳  路红  郭跃飞 《计算机学报》2005,28(3):427-432,F003
叠加在视频帧中的字符串为多媒体数据的高层语义分析提供了重要信息.该文提出了一种基于边缘的视频字符检测算法.利用字符区域内边缘的分布和强度的特点,对Canny边缘检测算子进行改进,使其根据图像内容自动确定分割阈值,确保获得高质量的字符边缘;然后,提取字符线条的关键特征,过滤非字符线条并用神经网络分类器判断最终的字符区域.实验结果表明该文算法在保持高速度和高查全率的同时,有效地降低了虚警,克服了基于边缘的字符检测算法的普遍缺点.  相似文献   

14.
新闻视频中基于主持人识别的新闻故事探测   总被引:3,自引:1,他引:3  
新闻视频由一个个内容相互独立的新闻故事组成。新闻故事探测是新闻视频浏览、基于内容检索等操作的前提。该文根据新闻视频的特殊结构和新闻节目主持人固定的特征,采用基于人脸检测的主持人镜头识别和基于语音的主持人识别来分割新闻视频中的新闻故事。实验表明,该方法能准确地探测出新闻视频中的新闻故事。  相似文献   

15.
随着数字获取技术的发展,数字媒体文档的获取越来越方便,并已成为人们现代生活中不可缺少的组成部分。功能强大的视频编辑软件为视频复制粘贴提供了方便,因此视频伪造检测具有重大现实需求。利用传统的图像伪造检测算法逐帧对视频进行伪造检测计算量大、耗时冗长,且不能保证检测结果的时空一致性。本文提出了一种基于稠密SIFT流的帧内复制粘贴视频伪造盲检测算法。所提算法自适应地在内容最小变化位置把视频划分为多个视频段,提取每个视频段的关键帧;在关键帧利用匹配SIFT关键点定位初始疑似复制粘贴伪造区域,通过SIFT关键点和均值漂移分割区域的位置依赖关系细化疑似伪造区域;采用稠密SIFT流把关键帧检测结果过渡至非关键帧,最终实现视频的复制粘贴伪造盲检测。实验结果表明,所提视频伪造盲检测方法能够高效地检测出帧内复制粘贴的视频伪造区域。  相似文献   

16.
摄像机的运动信息是视像内容检索中的一种重要特征。文中介绍了两种基于全局运动的摄像机运动检测方案。首先提取视像中的运动特征作为原始数据,然后分别使用了迭代最小二乘法和支持向量机分类的方法进行摄像机运动的检测,通过对试验结果的对比,前一种方案可更有效地完成摄像机运动类型的判断。  相似文献   

17.
智能视频监控系统中的干扰检测及分类   总被引:1,自引:1,他引:0  
针对智能视频监控系统中的干扰检测问题,提出了一种新的检测方法,并将干扰类型进行了分类.该方法对智能视频监控系统中的遮挡、失焦、亮度异常、偏色和噪声污染五种干扰分别提取检测特征,实现了对不同类型干扰的分类检测.同时,该方法采用了自适应更新阈值的方法,降低了检测方法的复杂度,提高了其实用性.实验结果表明:在能够满足监控系统实时性的要求下,与经典方法相比本文方法的检测性能较好,适用范围较广,分类正确率达到了92.2%.  相似文献   

18.
一种新的利用多帧结合检测视频标题文字的算法   总被引:5,自引:0,他引:5  
视频中的标题文字通常在视频信息索引和检索中起到重要作用.提出了一种新的视频标题文字的检测算法.首先采用一种新的多帧结合技术来降低图像背景的复杂度,它基于时间序列对多帧图像进行最小(或最大)像素值搜索,搜索的具体方式由Sobel边缘图来决定.然后以块为单位来进行文字与非文字的分类,即用一扫描窗口对图像进行扫描,以Sobel边缘为特征,判断其是否为文字。一个2级的金字塔被用来检测不同大小的文字.最后,提出一种新的迭代的文字区域分解方法,它能够更精确地定位文字区域的边界.实验结果表明,这种文字检测算法能够取得很高的精度和召回率.  相似文献   

19.

跨媒体网络视频热点话题检测成为新的研究热点.然而,描述视频的文本信息较少,使得文本语义特征空间稀疏,导致文本语义特征间关联强度较弱,增加了挖掘热点话题的难度.现有方法主要通过视觉信息丰富文本语义特征空间.然而,由于视觉与文本信息间的异构性,导致同一话题下文本与视觉语义特征差异较大,这进一步降低了同一话题下文本语义间的关联强度,也给跨媒体网络视频热点话题检测带来巨大挑战.因此,提出一种新的跨媒体语义关联增强方法.首先,通过双层注意力,从单词和句子2个级别捕捉文本核心语义特征;其次,通过理解视觉内容,生成大量与视频内容高度相关的文本描述,丰富文本语义空间;然后,分别通过文本语义相似性和视觉语义相似性,构建文本语义图和视觉语义图,并构造时间衰减函数,从时间维度建立跨媒体数据间的相关性,以此增强文本与视觉语义间的关联强度,平滑地将2种语义图融合为混合语义图,实现跨媒体语义互补;最后,通过图聚类方法检测出热点话题.大量实验结果表明,提出的模型优于现有方法.

  相似文献   

20.
王志明  张丽  包宏 《计算机工程》2012,38(19):183-187
为克服单个可见光摄像头检测准确率低的问题,提出一种融合双通道视频的人员检测系统.由可见光摄像头和红外热像仪分别获取同一场景的可见光和红外线视频数据,使用自适应学习速率的神经网络背景模型在2个通道中分别检测运动区域.通过图像配准对2个通道的结果进行“或”融合,并采用高斯滤波以消除噪声,利用积分图像快速检测近似长方形响应的人体区域.实验结果表明,该系统对行人和骑自行车人员的检测准确率达到98%,比单一通道具有更高的可靠性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号