首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
异常行为检测在智能监控系统领域中有广泛的应用前景。本文针对此应用领域,提出了一种结合光流特征和梯度直方图特征的视频异常行为检测及定位方法。首先利用视频背景提取算法进行前景提取和标注,实现对前景信息的分割。然后利用光流和梯度直方图特征提取算法对前景图像分别提取光流和梯度直方图特征,其次,使用支持向量机对数据进行训练和测试。最后结合光流幅度信息与前景标记信息对判断出来的异常行为进行定位。实验结果表明,与先前算法相比,本文算法可以检测出异常行为,并且能够对异常帧进行异常行为定位。   相似文献   

2.
基于模糊同质性映射的文本检测方法   总被引:2,自引:0,他引:2  
视频图像中的文本是从语义层次对视频图像内容进行描述的非常有效信息,文本检测为基于语义的图像检索提供了条件。该文提出了一种基于模糊逻辑和同质映射相结合的文本检测方法,首先利用最大信息熵准则将原始图像模糊化;然后构造基于边缘信息和纹理信息的图像同质性,并利用它将图像映射到模糊同质性空间;最后在模糊同质性空间通过纹理分析检测文本区域。与直接在图像空间域中提取特征的文本检测方法相比,该方法对复杂背景视频图像的文本检测取得了更好的效果,并且适用于多种类型的视频图像中文本的检测。  相似文献   

3.
检测并提取视频图像中的文本信息对视频图像和内容的理解意义重大。以现有的文本检测算法为基础,提出一种基于角点与BP神经网络相结合的文本检测算法。该算法首先应用多尺度角点算法提取文本角点信息并初步定位文本行,接着提取文本特征,最后应用BP神经网络精确定位文本。实验结果表明,此算法与经典方法相比具有更高的正确率和鲁棒性,视频中文本的正确检测率达到90.3%。  相似文献   

4.
本文提出一种基于小波压缩域的图像/视频字符自动检测定位方法.对于基于小波变换的压缩格式图像/视频,仅部分解压即可实现具有复杂背景的字符区域定位.与其他定位方法相比,明显降低计算复杂度,对字符尺寸的鲁棒性,检测精度显著提高.初步实验结果验证了该方法的有效性和快速性.  相似文献   

5.
一种基于变异灰度直方图的视频字幕检测定位方法   总被引:9,自引:1,他引:8  
为实现视频图像中字幕的快速检测与定位,本文提出一种变异灰度直方图VGH.文章给出VGH的定义,对其中的特征及其与图像中字幕的映射关系作了分析,并在此基础上给出视频字幕的检测与定位方法.该方法将垂直子图像转换为基于行的VGH (VGHR),将水平子图像转换为基于列的VGH (VGHC),通过对其中的凹谷特征和梳状凸台特征的识别,实现对字幕的检测与定位.文章最后给出某些实验结果,表明了算法的有效性.  相似文献   

6.
本文提出了一种基于Laplace变换的视频图像水平文本检测算法.首先用Laplace变换对图像滤波,并根据梯度信息用K-均值方法对像素点聚类,得到候选文本区;然后用投影算法对候选文本区进行边缘精确,得到候选文本块;最后分析候选文本块的几何特性,进行文本验证.本文算法在公共数据库上的测试结果表明了算法的可行性和有效性.  相似文献   

7.
李晓光  李晓华  沈兰荪 《电子学报》2005,33(12):2170-2173
压缩域人脸检测在图像/视频信息处理中具有重要意义.本文提出了一种基于多级梯度能量特征的DCT (Discrete Cosine Transform)压缩域人脸检测算法.依据DCT压缩图像色差信号的直流系数进行肤色分割,减小检测范围.在分割为肤色的区域提取多级梯度能量特征,即利用不同大小的检测窗口提取归一化的特征向量,表示不同大小的人脸.特征向量输入到级联分类器中分类,确定是否表示人脸.级联分类器由若干简单分类器和一个神经网络分类器构成.简单分类器利用一些先验知识排除大部分明显不是人脸的特征向量,通过简单分类器的特征由神经网络最终确定是否表示人脸.多级梯度能量特征与DCT域图像缩放相结合实现了对不同大小人脸的快速检测.对多级梯度能量特征的定义,减少了检测算法中压缩域图像缩放的次数,从而大幅度减少了计算复杂度,提高了检测速度.实验结果表明提出的多级梯度能量特征可有效描述DCT域人脸模式,同时也证明了该算法的快速有效性.  相似文献   

8.
为了解决车牌定位过程中拍摄图像背景复杂,噪声大,检测准确率偏低的问题,提出简便有效抗干扰强的车牌定位算法.首先将彩色图像转换为灰度图像,其次设定灰度门限区分图像目标和背景,进行二值化处理,然后使用Sobel边缘检测算子计算图像梯度幅度值,检测图像边缘点,采用局部图像平滑技术中值滤波对图像去除干扰,最后根据车牌区域纹理信息较其它区域丰富的特征,采用投影法,通过水平和垂直方向上投影分布特征的反复提取,准确检测定位车牌.实验结果表明,该方法定位出的车牌区域图像清晰度和准确度较高.  相似文献   

9.
基于最小二乘支持向量机的图像边缘检测研究   总被引:4,自引:3,他引:4       下载免费PDF全文
刘涵  郭勇  郑岗  刘丁 《电子学报》2006,34(7):1275-1279
本文研究了基于最小二乘支持向量机(LS-SVM)的图像边缘检测技术,利用LS-SVM对图像像素邻域的灰度值进行曲面拟合,通过采用多项式核函数、高斯核函数推导出图像的梯度和零交叉算子,并结合梯度算子和零交叉算子实现了图像边缘定位.通过实验获取了不同核函数的最佳卷积核的大小,同时采用遗传算法对不同核函数的参数进行寻优以获得最佳的边缘检测性能.通过与Canny方法的实验比较,验证了本文提出的边缘检测方法是有效的.  相似文献   

10.
视频数据中的文本是视频语义理解和检索的重要信息来源.文中对视频中文本的检测、定位、提取、增强和识别进行了研究.提出了应用小波模极大值算法检测视频帧文本所在的位置,用由粗到精的多层定位方法以及金字塔模型,对于多尺度的静止和滚动中英文文字进行提取,最后对文本区域进行二值化.实验表明文中方法取得了良好的效果.  相似文献   

11.
Video text information plays an important role in semantic-based video analysis, indexing and retrieval. Video texts are closely related to the content of a video. Usually, the fundamental steps of text-based video analysis, browsing and retrieval consist of video text detection, localization, tracking, segmentation and recognition. Video sequences are commonly stored in compressed formats where MPEG coding techniques are often adopted. In this paper, a unified framework for text detection, localization, and tracking in compressed videos using the discrete cosines transform (DCT) coefficients is proposed. A coarse to fine text detection method is used to find text blocks in terms of the block DCT texture intensity information. The DCT texture intensity of an 8×8 block of an intra-frame is approximately represented by seven AC coefficients. The candidate text block regions are further verified and refined. The text block region localization and tracking are carried out by virtue of the horizontal and vertical block texture intensity projection profiles. The appearing and disappearing frames of each text line are determined by the text tracking. The final experimental results show the effectiveness of the proposed methods.  相似文献   

12.
In this paper, we propose a novel framework to extract text regions from scene images with complex backgrounds and multiple text appearances. This framework consists of three main steps: boundary clustering (BC), stroke segmentation, and string fragment classification. In BC, we propose a new bigram-color-uniformity-based method to model both text and attachment surface, and cluster edge pixels based on color pairs and spatial positions into boundary layers. Then, stroke segmentation is performed at each boundary layer by color assignment to extract character candidates. We propose two algorithms to combine the structural analysis of text stroke with color assignment and filter out background interferences. Further, we design a robust string fragment classification based on Gabor-based text features. The features are obtained from feature maps of gradient, stroke distribution, and stroke width. The proposed framework of text localization is evaluated on scene images, born-digital images, broadcast video images, and images of handheld objects captured by blind persons. Experimental results on respective datasets demonstrate that the framework outperforms state-of-the-art localization algorithms.  相似文献   

13.
赵慧民  赖剑煌  蔡君  陈小玲 《电子学报》2013,41(6):1153-1158
 针对视频水印在帧内篡改检测方面定位精度的不足,通过压缩感知对MPEG-4(Moving Picture Experts Group-4)视频内容的特征表示,提出一种新的视频水印生成方法及其帧内篡改检测算法.该算法由压缩感知DCT(Discrete Cosine Transform)测量矩阵对I-VOP(Intra-Video Object Plane)图像提取U、V特征参数,生成基于内容的压缩感知视频水印数据并嵌入到图像Y分量的DCT中高频系数中实现帧内篡改检测.实验结果表明,与Hash视频水印算法比较,压缩感知视频水印数据具有更好的恢复能力,且水印算法对视频帧内篡改定位精度更高.  相似文献   

14.
提出了一种基于色彩距离最小化和最大 色彩差(MCD)的场景文本定位方法。首先,使用多次K均值 聚类和色彩距离最小化的方法,从不同复杂程度的场景图像中提取文本 连通区域;考虑到色彩聚类方法容易受光照影响,使用基于MCD最大色彩差的方法,提取 文本连通区域作为补充,由于将 色彩与梯度信息相结合,在一定程度上能克服光照的影响;将得到的连通区域通过设 定的字符合并规则,构建文本行; 候选文本行中通常包含错误检测的非文本行,为了提高文本检测的正确率,最后采用基于特 征提取和机器学习的方法,验证 候选文本行,得到文本定位结果。将本文方法在ICDAR2011和ICDAR2013公共数 据库上实验,对于ICDAR2011数据集,本文 获得的召回率、准确率和F指标分别为0.66、0.77;对于ICDAR2013数据集,本文获得的召回率、准确率和F 指标分别为0.65、0.77。将本文方法与 其它文本检测算法比较,结果表明本文方法的可行性、有效性。  相似文献   

15.
16.
毋立芳  赵宽  简萌  王向东 《信号处理》2019,35(11):1871-1879
关键帧检测是有效的视频内容分析的关键环节。常用的基于手工特征的方法运行效率高但很难有效表征关键帧特征,因而性能不好。基于深度特征的方法因为网络结构复杂,导致效率不高。在体育比赛类视频中,关键帧常为比赛转播中镜头变化的最后一帧。但广播视频中除了包含比赛视频还包括很多其他类型的镜头如中场休息、渐变镜头等。因此检测最后一帧包含很多比赛无关内容。针对这一问题,本文提出了一种手工特征与深度特征相结合的视频关键帧检测方法。首先基于颜色直方图特征进行镜头边界检测获取最后一帧。进一步基于直方图相似性提出一种类似聚类的方法得到候选关键帧。最后,基于深度神经网络对候选关键帧进行分类,得到真正的关键帧。在冰壶比赛视频和篮球比赛视频上的对比实验结果表明,相对于传统的背景差分法、光流法等,本文提出方法能够快速、可靠地提取关键帧。   相似文献   

17.
为解决复杂背景对场景文字自动定位算法干扰的问题,该文利用视觉显著性抑制背景且突出前景的特点,以方向梯度直方图特征、方向梯度直方图统计特征、梯度幅度特征和梯度曲线特征的弱分类器,结合提升框架提出一种背景抑制算法。该文算法的目标是抑制自然图像中复杂背景且突出前景文字,作为场景文字自动定位算法的预处理阶段增强算法效果。在ICDAR2011场景文字定位竞赛数据库和实验室场景中文数据库中实验结果表明,该文算法较好地抑制自然场景中复杂背景,并有效提升场景文字自动定位算法的性能。  相似文献   

18.
一种用于网络动画过滤的文字提取方法   总被引:1,自引:1,他引:1  
网络动画中往往包含丰富的字符信息,如果能够将这些字符信息加以提取和识别,将对网络动画的有效过滤具有重要意义。论文介绍了一种新的基于类边缘文本提取算法及其实现,该算法利用DCT方法提取出字符的类边缘信息,然后采用基于映射方法进行定位。实验结果表明,该方法能够准确、有效地定位和提取网络动画中的文字区域。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号