首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
基于聚类与边缘检测的自然场景文本提取方法   总被引:1,自引:0,他引:1  
为了解决复杂自然场景、光照不均匀及背景纹理丰富图像中文本的有效提取,提出一种基于K-means聚类与边缘检测结合的自然场景文本提取方法.该方法通过改进K-means聚类算法,实现文本区域的分割;然后对分割后的图像进行二值子图分解,将分解后的各子图像的连通区域进行标记与分析,得到候选的字符区域;最后利用文本区域的边缘特征对候选字符区域过滤,实现文本字符的提取.实验结果表明,该方法能有效提取出复杂背景、光照影响及背景纹理丰富图像中的文本字符区域.  相似文献   

2.
字符图像的分割是票据自动处理系统中一个预处理过程,提取字符的质量对识别系统有很大的影响。我国支票大写金额图像背景中存在定位线和背景纹理,还有各式各样的印章对笔画信息的干扰。该文解决了复杂背景下二值化问题,采用形态学方法去除定位线,根据目标与背景的灰度和双边缘特征分析进行二值化处理,利用用户填写字符串时的书写习惯去除孤立印章碎块,基于区域增长的后处理过程来修补前期处理过程中断裂的笔画。该方法在真实支票图像的获取上,取得了较为满意的结果。  相似文献   

3.
针对工业烟尘在图像分割过程中容易受到背景中运动干扰物、复杂场景环境的影响,提出了一种基于背景建模与特征匹配的工业烟尘图像分割方法.通过建立背景模型并对背景进行实时更新,构造出准确的背景图像;通过差分累积出烟尘动态区域,采用形态学填充的方法,得到粗分割烟尘区域,通过特征匹配的方法,去除干扰,得到相对完整的烟尘分割区域;对实际钢铁行业的烟尘排放视频进行验证实验,并与其他分割方法进行了对比,结果表明:所提方法能够较好地区分出背景干扰物和烟尘,能够相对完整地分割烟尘区域,具有一定的适用性和抗干扰能力和较好的实用性.  相似文献   

4.
银行支票中小写金额图像的提取   总被引:2,自引:0,他引:2  
支票图像的分割与识别是目前文档自动处理领域中讨论的一个热点问题。其中字符图像的分割是预处理过程中的一个重要环节,对识别系统有很大的影响。在我国的支票图像中常含有较深的印章图像叠加在被分割的字符上,增加了字符分割的难度。本文以支票中小写金额的图像为例,提出了字符的逐层分割方法以及用于判断印章图像是否去除的评判准则。首先去除图像中的底纹和定位格线;然后通过迭代的方法选取阈值去除印章图像;最后采用基于连通区的区域增长算法提取字符图像,去除碎块。在2725张实地采集的我国现行支票上的实验结果表明,本文的方法能够有效的去除印章图像,分割出字符。  相似文献   

5.
针对目前的打印文件识别方法受限于样本中必须有相同字符的问题,提出一种基于字符图像分割的打印文件识别方法。通过k-means算法对字符图像进行分割,分别对不同区域提取局部二值模式纹理特征,从而消除字符结构对识别结果的影响。研究了单一区域的特征集和组合特征集的分类识别效果,实验结果表明,该方法在样本中无相同字符的情况下,能够得到较高的识别准确率。  相似文献   

6.
二代身份证的自动分割方法研究   总被引:1,自引:0,他引:1  
为了解决由于采集身份证图像时光照不均匀给二值化造成的困难,将基于概率的数字图像光照不均匀校正算法应用于对身份证图像的光照校正。该算法在对一个区域中的背景进行提取时,采取统计的方法,先计算该区域中像素亮度的均值和标准差,然后根据统计值进行背景灰度计算。这样有利于排除噪声点的干扰,鲁棒性更强。采用水平投影确定字符所在行的区域后,利用垂直投影确定单个字符的位置。实验验证了所提方法能有效地进行二值化并准确分割出身份证上的字符。  相似文献   

7.
一种身份证图像自动识别中文字定位与分割的方法   总被引:4,自引:1,他引:4  
针对扫描后的身份证图像存在纹理及背景等强烈干扰,详细探讨了利用数字图像处理技术对身份证上的文字信息进行定位与分割的一种方法。该方法通过对身份证的特征的研究,利用水平投影与垂直投影相结合的方法,首先确定出文字的大致区域,然后利用模板框准确的定位出文字的位置。实例表明所提出的方法行之有效。  相似文献   

8.
基于纹理分析的精确车牌定位算法   总被引:1,自引:1,他引:0  
在车牌识别(LPR)系统的实现过程中,最关键的部分就是车牌图像的提取以及车牌字符图像的分割。介绍了一种基于车牌区域字符的纹理特征和统计规律的车牌定位方法。由于光照、复杂背景等因素都会对车牌定位产生不良影响,而利用车牌字符纹理丰富的特征寻找车牌区域就可以避开这些不良影响。这种算法不仅排除了光照、复杂背景等因素的影响,而且对于拍摄到车牌的大小、车牌在图像中的位置和倾斜角度没有太多限制。实验证明这种算法具有定位准、适应性强的特点。  相似文献   

9.
提出了一种基于胃镜图像的计算机辅助病灶检测方法。首先,引入超像素理论,将胃镜图像分割成大小均匀且包含相似像素的若干区域;然后,分别提取颜色特征和纹理特征,并将其融合作为特征描述符;最后,采用二级串联分类器进行胃镜图像内干扰区域的去除以及病灶区域的识别。实验结果表明,本方法病灶检测正确率(AUC)可达到91.588%。  相似文献   

10.
基于色彩分割与体态纹理分析的车牌定位方法   总被引:6,自引:0,他引:6  
介绍了一种基于色彩分割、体态分析及数学形态学纹理分析的车牌定位方法。该方法利用车牌与背景的色彩特征.在HSV空间内根据车牌颜色的三分量取值范围和色彩距离阚值进行色彩分割以初步过滤背景。对分割后得到的与车牌底色相符合的连通区域再根据车牌体态特征和车牌字符纹理特征,应用数学形态学处理及连通域体态分析等手段,逐步过滤干扰区域,最终定位正确的车牌位置。该方法充分考虑了车牌与背景的色彩、体态及纹理特征的差别,实验证明在复杂背景下具有很强的适应性与鲁棒性。  相似文献   

11.
基于小波变换的图像中维吾尔文字定位   总被引:3,自引:0,他引:3       下载免费PDF全文
在对维吾尔文字结构特点分析的基础上,研究维吾尔文字在小波变换中的特征,依据这些特征提出基于小波变换的视频图像中维吾尔文字定位的方法。用具有良好的时频局部和变尺度特性的小波分析方法,提取出纹理清晰、具有不同空间分辨率、不同方向的边缘子图像,用数学形态学的方法对提取出的细节图像进行进一步的形态运算,消除噪声,得到最终的文本目标区域。实验表明该方法简单有效,适合于背景较复杂的维吾尔文字定位。  相似文献   

12.
研究了字符边缘色彩信息对车牌定位的作用.在HSV色彩空间中,字符边缘处色度、饱和度处于特定的较窄范围,分别提取出车牌底色色彩像素点和字符色色彩像素点,再利用图像水平方向纹理得到车牌底色纹理,最后排除没有字符色像素点相邻的底色纹理像素点.实验结果表明,该方法适应性强、定位速度快,可在定位的同时确定车牌颜色.  相似文献   

13.
基于字符边缘颜色多分量信息的车牌定位方法   总被引:2,自引:2,他引:0       下载免费PDF全文
李刚  黄席樾  刘政  周勇  朱彬  白正文 《计算机工程》2009,35(18):176-178
针对复杂环境下的车牌定位,提出利用车牌字符边缘颜色多分量信息特征的定位算法,分别提取车牌底色像素点和字符色像素点,排除没有字符色像素点相邻的底色纹理像素点。由于字符色与底色的相互影响,字符边缘处色度、饱和度分量都有较窄的范围,可缩小车牌的搜索区域。结果证明该特征有助于车牌的准确定位,可确定车牌颜色,同时运算多在二值图上进行,速度快。  相似文献   

14.
Current image matting methods based on color sampling use color to distinguish between foreground and background pixels. However, they fail when the corresponding color distributions overlap. Other methods that define correlation between neighboring pixels based on color aim to propagate the opacity parameter α from known pixels to unknown pixels. However, strong edges of textured regions may block the propagation of α. In this paper, a new matting strategy is proposed that delivers an accurate matte by considering texture as a feature that can complement color even if the foreground and background color distributions overlap and the image is a complex one with highly textured regions. The texture feature is extracted in such a way as to increase distinction between foreground and background regions. An objective function containing color and texture components is optimized to find the best foreground and background pair among a set of candidate pairs. The effectiveness of proposed method is compared quantitatively as well as qualitatively with other matting methods by evaluating their results on a benchmark dataset and a set of complex images. The evaluations show that the proposed method presented the best among state of the art matting methods.  相似文献   

15.
Wavelet transforms have been widely used as effective tools in texture segmentation in the past decade. Segmentation of document images, which usually contain three types of texture information: text, picture and background, can be regarded as a special case of texture segmentation. B-spline wavelets possess some desirable properties such as being well localized in time and frequency, and being compactly supported, which make them an effective tool for texture analysis. Based on the observation that text textures provide fast-changed and relatively regular distributed edges in the wavelet transform domain, an efficient document segmentation algorithm is designed via cubic B-spline wavelets. Three-means or two-means classification is applied for classifying pixels with similar characteristics after feature estimation at the outputs of high frequency bands of spline wavelet transforms. We examine and evaluate the contributions of different factors to the segmentation results from the viewpoints of decomposition levels, frequency bands and wavelet functions. Further performance analysis reveals the advantages of the proposed method.  相似文献   

16.
彩色扫描文档图像中图文分割算法   总被引:1,自引:0,他引:1  
针对彩色扫描文档图像的背景噪声以及文本区的纹理干扰,提出一种利用图像处理技术、结合彩色文档图像自身特点、对文档插图区域进行定位与分割的方法.首先生成一组减弱了文本区纹理信息的多尺度特征缩图;然后采用基于连通度的标记分割法去掉文本区域信息,确定图像区域;最后融合多尺度缩图信息实施图文分割.实验结果表明:该方法对于提高扫描文档图像的压缩比是行之有效的.  相似文献   

17.
A new method for detecting text in video images is proposed in this article. Variations in background complexity, font size and color, make detecting text regions in video images a difficult task. A pyramidal scheme is utilized to solve these problems. First, two downsized images are generated by bilinear interpolation from the original image. Then, the gradient difference of each pixel is calculated for three differently sized images, including the original one. Next, three K-means clustering procedures are applied to separate all the pixels of the three gradient difference images into two clusters: text and non-text, separately. The K-means clustering results are then combined to form the text regions. Thereafter, projection profile analysis is applied to the Sobel edge map of each text region to determine the boundaries of candidate text regions. Finally, we identify text candidates through two verification phases. In the first verification phase, we verify the geometrical properties and texture of each text candidate. In the second verification phase, statistical characteristics of the text candidate are computed using a discrete wavelet transform, and then the principal component analysis is further used to reduce the number of dimensions of these features. Next, the optimal decision function of the support vector machine, obtained by sequential minimal optimization, is applied to determine whether the text candidates contain texts or not.  相似文献   

18.
马磊  刘江 《计算机应用》2010,30(11):2980-2982
新算法首先根据文档图像的特点分割图像文本区域,并将文档图像中字符的边缘信息使用纹理谱进行描述,计算纹理谱图像的直方图。相对于直接使用灰度直方图进行图像检索,该算法具有更好的区分度。实验结果表明,该方法具有很高的查准率,并对剪切、旋转操作表现出很好的稳定性,适合文档图像检索。  相似文献   

19.
提出了一种基于YUV颜色空间与支持向量机的复杂背景文本区域定位方法。算法将图像由RGB颜色空间转换至YUV颜色空间;利用最小二乘法对图像的色调直方图曲线进行拟合并确定最佳拟合阶次,利用拟合后的曲线对图像进行颜色分层聚类;对分解出的各颜色图层分别进行处理,得到备选文本连通域;提取备选文本连通域的小波纹理特征并利用SVM进行文本判别。实验结果表明,提出的方法定位准确率在65%以上,可以有效地实现复杂背景下图像文本区域的定位。  相似文献   

20.
为了方便维文图像的切分和识别工作, 提出将基于凸多边形的最小面积外接矩形法和基线拟合法相结合的检测和校正图像方法。首先提取边缘像素生成凸多边形, 利用基于凸多边形的最小面积外接矩形法实现初步的倾斜校正, 再根据维文沿基线书写的特点, 将图像细化后采用基线拟合的方法完成维文文本的精确校正。实验结果表明, 该方法能够精确地检测出文本图像的倾斜角并校正, 是行之有效的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号