共查询到16条相似文献,搜索用时 63 毫秒
1.
基于文字穿越线和笔画连通性的 视频文字提取方法 总被引:2,自引:0,他引:2
视频文字自动提取对提高视频内容的整体理解程度具有重要意义.在复杂背景下,现有提取方法难以稳健地定位文字和有效抑制背景干扰.我们提出一种复杂背景下稳健的视频文字提取方法,首先利用小波变换和非监督聚类方法获得候选文字区域;其次,引入穿越线及其幅度谱概念,通过提取穿越线特征进行聚类定位单行文字;最后,充分考虑到文字笔画的连通性,引入重线概念,通过检测重线获取文字像素关键点,从关键点出发进行区域生长,结合启发式规则,完成二值化过程.实验表明,该方法能够在复杂背景下得到较理想的文字二值化图像,不受文字颜色、字体、大小等因素的影响,性能优于文献[7]和文献[8]提出的方法. 相似文献
2.
3.
由于维吾尔文自身的特点,大多数已发表过的算法不能直接应用到视频中的这类文字。首先对视频帧的笔画滤波响应做全局阈值处理,然后利用维吾尔文在基线上横笔画居多的特征,通过水平投影找到基线位置,在基线上下方确定上下文本线。最后用垂直投影和启发式规则确定文本框。实验结果表明该算法对这类文字比较有效。 相似文献
4.
在复杂背景下,传统的视频文字自动定位方法难以稳健地定位文字。丈章提出一种基于小波变换和穿越线的视频文字定位方法,该方法分为两个阶段,在第一阶段,利用小波变换和非监督聚类方法来获得候选文字区域;在第二阶段,引入穿越线和及其幅度谱概念,通过提取穿越线特征进行聚类来定位单行文字。实验表明,该方法能够在复杂背景下有效定位文字,不受文字颜色、字体、大小等因素的影响,性能优于文献和文献提出的方法。 相似文献
5.
针对文本图像拍摄质量低下,而导致OCR系统识别率不稳定的问题,本文提出了一种基于文字笔画结构的文本图像校正算法,主要是在图像的预处理中对待处理像素点进行基于文字笔画结构的特征分析,实现目标和背景像素的校正,再结合局部二值化算法进行处理,分析其噪音分布特点采用邻域去噪进一步优化处理结果。实验表明,本文算法能够很好的适用于处理质量低下的文本图像,处理效果从视觉图像和识别率上都能满足应用需求。 相似文献
6.
7.
复杂背景是影响场景文字自动定位算法性能的重要因素。为消除背景干扰,本文首先根据谱残差理论获取显著性区域,然后利用基于笔画特征的点对梯度方向差比例图与基于傅里叶谱统计特征的后验概率图取得显著性区域的文字置信图,最后借助图模型融合视觉显著性图、文字置信图与HSI颜色特征最终达到抑制自然图像背景并突出前景文字的效果。在ICDAR2011场景文字定位竞赛数据库与实验室场景中文数据库中的实验结果表明,本算法可较好的抑制自然图像中复杂背景,并有效提升算法的性能。 相似文献
8.
9.
对应用广泛的Kamel-Zhao和Bernsen二值化方法分析其存在的问题并提出了一种基于局部的文本图像快速二值化算法(简称LEVBB算法).实验结果证明,该算法运算速度快,保持笔划连通性好,抗噪声能力强,并已在实际的车辆牌照识别系统中取得理想效果. 相似文献
10.
11.
12.
视频数据中的文本是视频语义理解和检索的重要信息来源.文中对视频中文本的检测、定位、提取、增强和识别进行了研究.提出了应用小波模极大值算法检测视频帧文本所在的位置,用由粗到精的多层定位方法以及金字塔模型,对于多尺度的静止和滚动中英文文字进行提取,最后对文本区域进行二值化.实验表明文中方法取得了良好的效果. 相似文献
13.
提出了一种基于边缘的视频文字检测算法.利用Canny算子对图像进行边缘检测,然后根据文字边缘线条的特征,过滤非字符的边缘线条.最后利用文字线条区域的相似性,设置综合阈值,得到最终的文字区域.实验结果表明该算法不仅对规则排列的文字有较高的查全率.对不规则排列及扭曲的文字也能够准确定位.并对光照、阴影等条件不敏感. 相似文献
14.
针对目前一般采用的基于视图的知识模型方法或统计模型方法存在的问题,提出了一种基于小波变换及特征提取器的方法,并进行系统设计和检测,实验证明了该方法的有效性。 相似文献
15.
提出了一种基于色彩距离最小化和最大 色彩差(MCD)的场景文本定位方法。首先,使用多次K均值 聚类和色彩距离最小化的方法,从不同复杂程度的场景图像中提取文本 连通区域;考虑到色彩聚类方法容易受光照影响,使用基于MCD最大色彩差的方法,提取 文本连通区域作为补充,由于将 色彩与梯度信息相结合,在一定程度上能克服光照的影响;将得到的连通区域通过设 定的字符合并规则,构建文本行; 候选文本行中通常包含错误检测的非文本行,为了提高文本检测的正确率,最后采用基于特 征提取和机器学习的方法,验证 候选文本行,得到文本定位结果。将本文方法在ICDAR2011和ICDAR2013公共数 据库上实验,对于ICDAR2011数据集,本文 获得的召回率、准确率和F指标分别为0.66、0.77;对于ICDAR2013数据集,本文获得的召回率、准确率和F 指标分别为0.65、0.77。将本文方法与 其它文本检测算法比较,结果表明本文方法的可行性、有效性。 相似文献