首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到12条相似文献,搜索用时 62 毫秒
1.
自动分割及跟踪视频运动对象的一种实现方法   总被引:29,自引:3,他引:29       下载免费PDF全文
随着MPEG-4压缩标准的制定,分割及跟踪视频运动对象的研究显得极其重要。在MPEG-4视频编码标准中,为了实现基于视频内容的交互功能,其视频序列的每一帧由视频对象面(VOP)来表示。为了生成视频对象面,需要对视频序列中的运动对象进行有效的分割;并跟踪运动对象随时间的变化,为此提出并实现了一种用于分割及跟踪视频运动对象的时空联合方法。该方法首先采用连续帧间差的4次统计量假设检验,确定运动对象的位置,自动地分离出运动区域与背景区域;在运动区域内,采用数学形态学的分水线算法来精确地提取运动对象的轮廓;最后,将提取到的运动对象作为模板,对后续的视频序列,用Hausdorff距离度量,来跟踪并提取后续帧中运动对象。实验结果表明,该方法能有效地分割和跟踪视频运动对象,且能有效减少计算复杂度,其调整参数也较少。  相似文献   

2.
准确定位字符区域是字符识别的第一步,针对高速运动拍摄图像对比度差、噪声干扰严重、字符区域范围变化大、要求在线识别且时间短等特点,研究了一套特殊的数学形态学和图像滤波算法,算法利用字符局部信息对区域内的字符进行二值化处理,后进行连通运算和数学形态学闭运算,使相邻字符连成一个字符串区域,最后根据侯选区域的先验信息,快速定位出被识别字符的准确位置.研究表明,在高速运动中拍摄80*60mm大小的物体,图像大小为640*480,利用ROI区域,可以实现100%的目标区域精确定位,定位时间小于20ms,为后续字符的准确分割和识别奠定了良好的基础.  相似文献   

3.
基于小波形态学的文本自动检测   总被引:1,自引:0,他引:1  
视频数据中的文本能提供重要的语义信息。论文针对视频中的文本分割问题,提出一种分割方法,用具有良好时频局部和变尺度特性的小波分析方法,提取出纹理清晰、具有不同空间分辨率、不同方向的边缘子图象,然后,用数学形态学的方法对提取出的细节图象进行进一步的形态运算,消除无用的信息,得到最终的文本目标区域。实验表明该方法简单有效,适合于背景较复杂的文本分割。  相似文献   

4.
视频文本的自动提取方法   总被引:4,自引:0,他引:4  
提出一种基于彩色边缘检测和游程平滑的视频文本提取方法,首先用彩色边缘检测算子检测出图像中的边缘。然后用多次水平和垂直的游程平滑操作使得文字边缘形成连通区域,并去掉部分孤立的噪声,再通过对连通域的分析和分解定位出文本区域的边界,最后对文本区进行确认.实验表明,本文的视频文本自动提取方法具有较高的文本提取率和较准确的边界定位。  相似文献   

5.
一种视频中字符的集成型切分与识别算法   总被引:3,自引:0,他引:3  
杨武夷  张树武 《自动化学报》2010,36(10):1468-1476
视频文本行图像识别的技术难点主要来源于两个方面: 1)粘连字符的切分与识别问题; 2)复杂背景中字符的切分与识别问题. 为了能够同时切分和识别这两种情况中的字符, 提出了一种集成型的字符切分与识别算法. 该集成型算法首先对文本行图像二值化, 基于二值化的文本行图像的水平投影估计文本行高度. 其次根据字符笔划粘连的程度, 基于图像分析或字符识别对二值图像中的宽连通域进行切分. 然后基于字符识别组合连通域得到候选识别结果, 最后根据候选识别结果构造词图, 基于语言模型从词图中选出字符识别结果. 实验表明该集成型算法大大降低了粘连字符及复杂背景中字符的识别错误率.  相似文献   

6.
基于点模式匹配的视频文字跟踪和笔画提取   总被引:1,自引:0,他引:1       下载免费PDF全文
给出一种在复杂背景下的视频文字跟踪和文字笔画提取方法。用基于Harris角点特征的点模式匹配法跟踪视频序列中静止和运动的文字,以确定文字序列的时间属性,比较了采用图像整体像素匹配和点模式匹配的跟踪精度。用基于多帧融合思想的前景/背景识别算法提取视频文字笔画并作OCR识别。实验结果显示,点模式匹配的跟踪算法比图像整体像素匹配的算法跟踪精度更高,在图像背景复杂、变化快的情况下,基于多帧融合的文字笔画提取方法优于传统的二值化方法。  相似文献   

7.
提出一种改进的基于潜在语义索引的文本聚类算法。算法引入潜在语义索引理论,改进传统的SOM算法。用潜在语义索引理论表示文本特征向量,挖掘文本中词与词之间隐藏的语义结构关系,从而消除词语之间的相关性,实现特征向量的降维。改进传统的SOM算法的局限性,准确给出聚类类别数目的值。实验结果表明,本算法的聚类效果更好,聚类时间更少。  相似文献   

8.
一种压缩域上的快速标题文字探测算法及其应用   总被引:1,自引:0,他引:1  
王伟强  高文  高文 《计算机学报》2001,24(6):620-626
提出了一种在MPEG压缩流上基于模型的快速标题文字探测算法。对标题文字叠加模型的分析表明,视频流各分量值在标题文字区将属于特定的 范围区间。基于该特征,该文给出了一种利用色度分量统计特征在压缩域上检测标题的快速算法,并对算法的加速以及模型建立方法进行了讨论,该技术被成功地应用到自动创建图片目录,实现了用户通过极少目的图片对一天新闻节目内容的快速浏览。实验结果表明算法不仅具有理想的正确率96.6%与查全率100%,而且具有超实时的探测速度。  相似文献   

9.
针对大量视频图像中出现的各种文字信息,本文提出了一种基于离散余弦变换(DCT)的文字提取算法。该方法首先将图像分割为等大小基本块,然后对各小块提取DCT特征。在此基础上,利用图像对比度,设计了一种动态阈值分割方法,可将文字信息和背景信息进行分离。然后依据最小外接矩形算法,获得初始文字检测结果。最终使用Voronoi Diagram算法对初始区域进行合并得到最终文字区域检测结果。算法可以快速而精确定位文字所对应的区域,并且能适用于各种背景条件下的视频图像。  相似文献   

10.
基于笔画提取和颜色模型的视频文字分割算法   总被引:1,自引:0,他引:1       下载免费PDF全文
程豪  黄磊  刘金刚 《计算机工程》2009,35(4):193-195
提出综合利用视频文字时空、笔画、颜色和几何特征的文字分割算法,快速准确地从复杂背景的视频图像中分割出文字。利用多帧融合进行图像增强,基于笔画宽度特征,使用笔画特征算子提取文字笔画,根据笔画图标注的文字区域建立颜色模型,提取文字颜色层,并用改进的连通域分析法去除文字颜色层中的同色背景和噪声。实验结果表明,该算法比传统算法能更好解决复杂背景的视频文字分割问题。  相似文献   

11.
在MPEG视频上的语义视频对象分割改进算法   总被引:2,自引:0,他引:2  
随着MPEG-4,MPEG-7等标准的提出,如何提取语义视频对象已成为当前视频压缩和检索领域共同的研究课题。特别是MPEG-7对视频对象的形状检索提出了具体要求。针对顾创等人的WaterShed算法不能很好处理现有MPEG-1视频数据的缺陷,提出改进算法,从而能够在MPEG视频流中提取到具有光滑轮廓的语义视频对象,算法主要有以下两点改进:提出将类成员数作为分类算法的参数;有压缩域和解码后的图像上先后进行两次分割。实验结果表明,改进算法在鲁棒性和分割结果精度上比原算法有较大的改进,其分割结果可用于轮廓检索和重要视频对象检索。  相似文献   

12.
基于颜色聚类和多帧融合的视频文字识别方法   总被引:1,自引:0,他引:1  
易剑  彭宇新  肖建国 《软件学报》2011,22(12):2919-2933
提出一种基于颜色聚类和多帧融合的视频文字识别方法,首先,在视频文字检测模块,综合考虑了文字区域的两个显著特征:一致的颜色和密集的边缘,利用近邻传播聚类算法,根据图像中边缘颜色的复杂程度,自适应地把彩色边缘分解到若干边缘子图中去,使得在各个子图中检测文字区域更为准确.其次,在视频文字增强模块,基于文字笔画强度图过滤掉模糊的文字区域,并综合平均融合和最小值融合的优点,对在不同视频帧中检测到的、包含相同内容的文字区域进行融合,能够得到背景更为平滑、笔画更为清晰的文字区域图像.最后,在视频文字提取模块,通过自适应地选取具有较高文字对比度的颜色分量进行二值化,能够取得比现有方法更好的二值化结果;另一方面,基于图像中背景与文字的颜色差异,利用颜色聚类的方法去除噪声,能够有效地提高文字识别率.实验结果表明,该方法能够比现有方法取得更好的文字识别结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号