首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
视频汉字提取与识别在视频分析与检索等领域有着重要作用,文章分析了基于时空分布特征的字幕区域检测方法,并采用射线束法实现了字幕行列分割,最后采用SVM方法实现了视频文字识别。  相似文献   

2.
部分图片、影视和动漫作品中,固化在图像帧里的文字标签和字幕影响使用的效果.在图像引用时,往往需要一个整洁的背景环境.本文正是基于图片文字标签以及视频字幕的特点,综合运用边缘检测以及灰度聚类等方法对文本进行定位和提取,最后通过图像修复技术实现文字内容的去除.经过大量的实验表明,该方法能够有效地提取并去除文字标签和字幕等文字内容.  相似文献   

3.
为实现视频图像中人工文本的快速定位,提出了一种有效的字幕定位方法.该方法首先对视频帧进行灰度变换,去除冗余颜色信息,利用自适应阈值Canny算子对文本区域进行边缘检测,再将得到的子图像在水平方向进行投影行定位,最后对行定位结果进行文字区域精确化.结果表明:该方法能避免人为设置阈值不当使得在不同背景情况下产生伪边缘或边缘漏检,能够有效定位文本,不受文字字体、大小等因素的影响.  相似文献   

4.
由于自然场景中的图像背景复杂、文字排列不规则、光照条件不确定等因素文字检测难度较大,且传统检测方法的效果并不理想。在研究文字分割检测方法PSENet(Progressive Scale Expansion Network)的基础上,提出了一种针对自然场景文字检测的改进方法。该方法由卷积神经网络提取特征模块,再通过渐进式规模扩张对文字区域进行分割检测。改进点主要是使用高精度的语义分割网络RefineNet(Refinement Network)对卷积网络特征提取模块进行优化,且增加较多的残差连接及链式池化,提高网络对文字区域的检测精度。通过对数据集ICDAR2015的实验结果对比表明所提出的改进算法在精度方面略高于改进前,且能更好地解决文字粘连问题。  相似文献   

5.
提出通过图表标题信息来检测在线生物文献中核磁共振图像的新方法.学术文献中每张图表都有对应的图表标题,而图表一般由多个嵌图组成,图表标题中不同文本是对不同嵌图的文字解释.将图表标题分割成与嵌图匹配的嵌图标注,利用嵌图标注来完成核磁共振图像的检测.依托正则语言理论,寻找图表标题中指向嵌图的图像指针,图像指针将图表标题分割成嵌图标注并与对应嵌图进行匹配.在分析嵌图标注的基础上,提出嵌图混合标注方法,根据图表仅包含同类型嵌图和包含不同类型嵌图2种情况,分别采用嵌图标注或者整个未分割标题作为图像识别的文本特征.实验结果表明,该方法可以很好地识别在线生物文献中的核磁共振图像.  相似文献   

6.
根据文字图像信息的特点,提出用自适应门限谷点检测方法处理字迹扩散的文字,改善图像的视觉效果,提高对劣化、退化文字图像判读的正确性.  相似文献   

7.
镜头切换检测是视频检索研究领域中一项基本的、重要的技术.然而传统的镜头边界检测方法都只考虑了视频相邻两帧的信息,没有充分考虑到视频序列中前后的连续性,从而容易导致误检测.基于此,提出了一种基于类间距离和准则对镜头边界进行检测的新方法,该方法能够充分利用视频序列中的连续性信息,克服传统镜头边界检测方法的不足,有效地提高了检出率及精确率.大量实验表明,该方法是行之有效的.  相似文献   

8.
基于直线抽取的数字视频全局文字提取的研究   总被引:1,自引:0,他引:1  
提出一种基于相位编组提取数字视频文字区域的算法.本算法首先基于相位编组抽取视频帧中的直线,然后过滤掉弱边缘直线;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘.进一步提出了像素密度α的概念,并指出文字区域的像素密度α应在某一阈值范围之内(αmin≤α≤αmax),通过像素密度α滤去了非文字区域,最后应用投影法最终确定文字区域.以上方法的结合保证了本算法的正确率和鲁棒性.最后选用不同类型的视频素材对本算法进行了实验,表明本算法具有较好的正确率和较快的计算速度.  相似文献   

9.
为减少监控视频的存储容量,便于用户迅速查看视频关键信息,提出一种适于监控视频内容检索的关键帧提取方法.首先,使用背景差分法检测含有运动物体的关键视频段,记录其起始帧和结束帧,然后,在关键视频段中基于联合直方图的方法进行关键帧的粗提取,最后,根据监控视频帧序列的连续性特征,通过图像的信息熵进一步精确提取关键帧.实验结果表明,该方法能有效地提取出监控视频中的关键帧,大大减少了视频数据的存储量,且便于用户浏览关键信息.  相似文献   

10.
根据文字图像信息的特点,提出用自适应门限谷点检测方法处理字迹扩散处理字迹扩散的文字,改善图像的视觉效果,提高对劣化、退化文字图像判读的正确性。  相似文献   

11.
基于小波重构的视频图像文本检测方法   总被引:1,自引:0,他引:1  
提出一种基于小波重构的视频图像文本提取方法.原始图像经小波分解重构得到特征图像,在特征图像上使用固定尺寸的文本检测器提取图像区域的属性特征,利用神经网络分类器确定该图像区域的属性.实验表明,本方法与基于边缘特征的文本提取方法相比,具有更好的性能.  相似文献   

12.
视频字幕提取是建立视频信息索引的有效手段,字幕区的检测和定位是新闻视频字幕提取过程中影响识别效率的关键问题。利用新闻视频字幕区在视频帧序列中的变化规律,通过计算视频字幕帧之间的时间相关性能够实现新闻视频字幕场景的快速分割。对经过场景分割同主题新闻视频帧序列中的字幕,以像素的帧序列方差描述其字幕区时间不变性,提出了一种基于帧序列颜色分析的视频字幕区定位提取方法,并通过实验验证了方法的有效性。  相似文献   

13.
自动定位彩色图像中的文本   总被引:2,自引:0,他引:2  
提出一种适用于万维网搜索、彩色图像索引和视频索引等多种应用的彩色图像文本定位方法.算法采用多尺度图像分割方法把彩色图像分割为一系列可能包含文本的图像块,用连通区域方法确定每一个文本图像块中文本的精确位置和大小.采用多颜色图像分解方法提取具有相似颜色的连通区域,通过聚类相邻的连通区域得到文本的位置和范围.利用一个图像数据库来测试本文算法,试验表明算法具有较高的正确率.  相似文献   

14.
BSP-16处理器具有功能强大的硬件结构和软件系统,非常适合应用于实时视频监视系统。本文首先根据视频图像编码原理及H.264建议的要求,提出了基于BSP-16的实时视频监视系统的构架。  相似文献   

15.
以有机化学的教学为例提出了基于面向对象技术的通用CAI集成系统的解决方案,介绍了开发集成系统过程中的设计思想和关键技术,利用该系统集成制作出的CAI课件具有文本、视频和音频等多媒体表现能力。  相似文献   

16.
提出了一种基于时空上下文特征和相关向量机的视频滚动字幕检测算法.可检测视频关键帧中的角点,并估计出角点上的稀疏光流;在对光流场优化的基础上,提出一种新的融合静态和动态特性的滚动字幕统计描述方法,进而结合多个关键帧特征建立起滚动字幕的时空上下文联系;引入相关向量机进行决策.实验结果表明,该算法优于现有4种典型方法,综合性能也略好于基于支持向量机的方法.  相似文献   

17.
周界入侵识别已经慢慢成为智能视频监控系统的一项所必需的功能,使用鱼眼镜头作为视频采集节点的光学系统,较大型的监控场合只需布置少量的视频采集节点便可得到无盲区的周界环境信息。采用图像拼接技术和识别技术将服务器端收集到的信息拼接成全景视频图像并进行入侵行为识别,从而有效避免了针对多节点独立进行入侵识别的并行运算,可大大减轻系统对多CPU运算平台的依赖性,提高系统的可靠性。现场测试结果表明,使用该方案设计的周界入侵识别系统,可有效保证不出现识别盲区,在使用同一识别算法和同等级识别延时的前提下,大大降低对监控系统服务器的配置要求,特别是对处理器个数的要求。  相似文献   

18.
一种语义级文本协同图像识别方法   总被引:1,自引:1,他引:0  
为解决单纯依赖图像低级视觉模态信息进行图像识别准率低的问题. 考虑到许多图像中存在文本信息,提出了利用图像中的文本信息辅助图像识别的语义级文本协同图像识别方法. 该方法通过文本定位方法定位到图像中的文本块,对其进行分割、二值化、提取特征等处理;然后获取语义,提取图像底层视觉信息,计算两模态的相关性,从而得到协同后验概率; 最后,得到联合后验概率,并取其中最大联合后验概率对图像进行识别. 在自建体育视频帧数据库中,通过与以朴素贝叶斯为代表的单模态方法进行比较,方法在3种不同视觉特征下均具有更高的准确率. 实验结果表明,文本协同方法能够有效辅助图像识别,具有更好的识别性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号