首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 63 毫秒
1.
基于文字穿越线和笔画连通性的 视频文字提取方法   总被引:2,自引:0,他引:2  
 视频文字自动提取对提高视频内容的整体理解程度具有重要意义.在复杂背景下,现有提取方法难以稳健地定位文字和有效抑制背景干扰.我们提出一种复杂背景下稳健的视频文字提取方法,首先利用小波变换和非监督聚类方法获得候选文字区域;其次,引入穿越线及其幅度谱概念,通过提取穿越线特征进行聚类定位单行文字;最后,充分考虑到文字笔画的连通性,引入重线概念,通过检测重线获取文字像素关键点,从关键点出发进行区域生长,结合启发式规则,完成二值化过程.实验表明,该方法能够在复杂背景下得到较理想的文字二值化图像,不受文字颜色、字体、大小等因素的影响,性能优于文献[7]和文献[8]提出的方法.  相似文献   

2.
本文提出了一种基于小波分析和区域连通性分析的视频文字定位方法。首先从视频流中获取视频帧,并对其进行灰度化等预处理,其次对预处理后的图像进行db小波变换,获取其水平和垂直的高频分量HH,然后对高频分量进行Log边缘检测和形态学操作,初步筛选候选文字区域,再然后利用区域连通性的判别方法,精确定位文字区域,最后输出文本区域并标注。  相似文献   

3.
由于维吾尔文自身的特点,大多数已发表过的算法不能直接应用到视频中的这类文字。首先对视频帧的笔画滤波响应做全局阈值处理,然后利用维吾尔文在基线上横笔画居多的特征,通过水平投影找到基线位置,在基线上下方确定上下文本线。最后用垂直投影和启发式规则确定文本框。实验结果表明该算法对这类文字比较有效。  相似文献   

4.
王志明  田破荒 《通信技术》2009,42(2):168-170
在复杂背景下,传统的视频文字自动定位方法难以稳健地定位文字。丈章提出一种基于小波变换和穿越线的视频文字定位方法,该方法分为两个阶段,在第一阶段,利用小波变换和非监督聚类方法来获得候选文字区域;在第二阶段,引入穿越线和及其幅度谱概念,通过提取穿越线特征进行聚类来定位单行文字。实验表明,该方法能够在复杂背景下有效定位文字,不受文字颜色、字体、大小等因素的影响,性能优于文献和文献提出的方法。  相似文献   

5.
针对文本图像拍摄质量低下,而导致OCR系统识别率不稳定的问题,本文提出了一种基于文字笔画结构的文本图像校正算法,主要是在图像的预处理中对待处理像素点进行基于文字笔画结构的特征分析,实现目标和背景像素的校正,再结合局部二值化算法进行处理,分析其噪音分布特点采用邻域去噪进一步优化处理结果。实验表明,本文算法能够很好的适用于处理质量低下的文本图像,处理效果从视觉图像和识别率上都能满足应用需求。  相似文献   

6.
基于笔画特征的叠加文字检测方法   总被引:2,自引:0,他引:2  
提出一种利用笔画线条的统计特征基于支持向量机进行图像中叠加文字检测的方法。该算法首先通过一种改进的线段检测算子提取出笔画线段;然后对笔画线条通过区域合并定位出候选文字块;接着对候选文字块提取一个反映文字笔画线条空间分布特点的32维特征,并通过支持向量机建立的模型对候选文字块进行确认分类。以汉字为例的初步实验表明所提出笔画纹理特征对较多字符构成的文字区域具有很好的性能。  相似文献   

7.
复杂背景是影响场景文字自动定位算法性能的重要因素。为消除背景干扰,本文首先根据谱残差理论获取显著性区域,然后利用基于笔画特征的点对梯度方向差比例图与基于傅里叶谱统计特征的后验概率图取得显著性区域的文字置信图,最后借助图模型融合视觉显著性图、文字置信图与HSI颜色特征最终达到抑制自然图像背景并突出前景文字的效果。在ICDAR2011场景文字定位竞赛数据库与实验室场景中文数据库中的实验结果表明,本算法可较好的抑制自然图像中复杂背景,并有效提升算法的性能。  相似文献   

8.
针对背景相对静止、主要检测对象为行人的视频监控序列,提出了一种基于连通性检测的目标提取算法,它把形态学滤波与连通性检测相结合,对分割后的二值化图像进行噪声干扰去除,在获得若干连通区域后,利用面积、外界矩形及其特征对连通区域进行识别,通过区域重心标注目标在各帧位置,实现目标提取.实验结果表明,该算法简单可靠,具有实时性,易于硬件实现,可应用于实际系统.  相似文献   

9.
文本图像的快速二值化方法   总被引:26,自引:0,他引:26       下载免费PDF全文
对应用广泛的Kamel-Zhao和Bernsen二值化方法分析其存在的问题并提出了一种基于局部的文本图像快速二值化算法(简称LEVBB算法).实验结果证明,该算法运算速度快,保持笔划连通性好,抗噪声能力强,并已在实际的车辆牌照识别系统中取得理想效果.  相似文献   

10.
为了从"三互能力"角度评价武器装备体系的整体作战能力,提出了基于矩阵范数的体系连通性评估的新方法,以体系组成系统之间的连通性作为体系能力的评价指标,通过描述武器装备体系的体系结构产品构建体系的连通性矩阵,并求解矩阵谱范数,得到体系连通性的定量评估结果,示例与敏感性分析验证了该方法的有效性和适用性.  相似文献   

11.
基于行间距编码的文本数字水印算法   总被引:1,自引:0,他引:1  
梁旭  远志永  黄明 《信息技术》2008,32(3):38-41
利用Java技术实现了一种保护电子文档的基于行间距编码的文本水印算法.描述了水印的编码方式、水印嵌入的算法、水印提取的算法及文本水印技术的应用前景.通过利用电子文档的文本空间域的特征,隐藏了水印信息,实现了保护电子文档版权的目的.  相似文献   

12.
视频数据中的文本是视频语义理解和检索的重要信息来源.文中对视频中文本的检测、定位、提取、增强和识别进行了研究.提出了应用小波模极大值算法检测视频帧文本所在的位置,用由粗到精的多层定位方法以及金字塔模型,对于多尺度的静止和滚动中英文文字进行提取,最后对文本区域进行二值化.实验表明文中方法取得了良好的效果.  相似文献   

13.
提出了一种基于边缘的视频文字检测算法.利用Canny算子对图像进行边缘检测,然后根据文字边缘线条的特征,过滤非字符的边缘线条.最后利用文字线条区域的相似性,设置综合阈值,得到最终的文字区域.实验结果表明该算法不仅对规则排列的文字有较高的查全率.对不规则排列及扭曲的文字也能够准确定位.并对光照、阴影等条件不敏感.  相似文献   

14.
针对目前一般采用的基于视图的知识模型方法或统计模型方法存在的问题,提出了一种基于小波变换及特征提取器的方法,并进行系统设计和检测,实验证明了该方法的有效性。  相似文献   

15.
提出了一种基于色彩距离最小化和最大 色彩差(MCD)的场景文本定位方法。首先,使用多次K均值 聚类和色彩距离最小化的方法,从不同复杂程度的场景图像中提取文本 连通区域;考虑到色彩聚类方法容易受光照影响,使用基于MCD最大色彩差的方法,提取 文本连通区域作为补充,由于将 色彩与梯度信息相结合,在一定程度上能克服光照的影响;将得到的连通区域通过设 定的字符合并规则,构建文本行; 候选文本行中通常包含错误检测的非文本行,为了提高文本检测的正确率,最后采用基于特 征提取和机器学习的方法,验证 候选文本行,得到文本定位结果。将本文方法在ICDAR2011和ICDAR2013公共数 据库上实验,对于ICDAR2011数据集,本文 获得的召回率、准确率和F指标分别为0.66、0.77;对于ICDAR2013数据集,本文获得的召回率、准确率和F 指标分别为0.65、0.77。将本文方法与 其它文本检测算法比较,结果表明本文方法的可行性、有效性。  相似文献   

16.
领域术语自动抽取及其在文本分类中的应用   总被引:11,自引:1,他引:11       下载免费PDF全文
本文提出了一种基于信息熵的领域术语抽取方法,在给定领域分类语料的前提下,该方法既考虑了领域术语在不同领域类别间分布的不均匀性,又考虑了其在特定领域类别内分布的均匀性,并针对语料的不平衡性进行了正规化.人工评测显示该方法能更准确有效地抽取领域术语.本文还将该算法应用于文本分类,用于代替传统特征选择算法,实验表明,该算法能够显著提高文本分类的精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号