首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
提出了一种基于二维小波分解的背景图像文本提取算法.该算法首先对图像进行二维小波变换,设置滑动窗扫描高频子带,计算滑动窗内图像的小波纹理特征,采用k-均值聚类算法将图像分为文本区域、简单背景区域和复杂背景区域,最后对文本区域进行形态运算,精确地定位文本区域.实验结果表明,该算法能够准确地从背景图像中提取出不同语种、字体、大小和排列方式的文本信息.  相似文献   

2.
针对场景图像中的中文文本定位问题,提出一种基于汉字特点的中文文本定位算法。算法首先对图像提取MSER(最大稳定极值区域),然后通过剪枝策略对存在嵌套关系的MSER进行取舍,得到候选笔画区域;计算候选区域的笔画宽度,作为闭操作的结构元参数并对图像进行动态闭操作,以消除同一汉字笔画之间的间隙,得到候选汉字区域;利用结构和角点规则过滤掉非汉字区域,并用颜色规则聚类得到候选文本区域;最后基于图像文本大都横向或纵向排列的规律,通过分析各组连通区的分布情况,对候选文本区域进行确定。在测试数据集上的实验表明,算法对于汉字与背景色差明显、汉字成行或成列排列等场景文本具有定位稳定性和准确性。  相似文献   

3.
自动定位彩色图像中的文本   总被引:2,自引:0,他引:2  
提出一种适用于万维网搜索、彩色图像索引和视频索引等多种应用的彩色图像文本定位方法.算法采用多尺度图像分割方法把彩色图像分割为一系列可能包含文本的图像块,用连通区域方法确定每一个文本图像块中文本的精确位置和大小.采用多颜色图像分解方法提取具有相似颜色的连通区域,通过聚类相邻的连通区域得到文本的位置和范围.利用一个图像数据库来测试本文算法,试验表明算法具有较高的正确率.  相似文献   

4.
提出了一种基于Adaboost的视频文本定位的新方法。首先我们提取视频图像中的连通域,经过对视频文本区域分析,提取了视频文本的5类特征,然后利用这5类特征经过分类与回归决策树构造了Adaboost强分类器,最后将候选文本区域送入强分类器,得到正确的文本区域。实验结果表明本方法不仅对视频帧图像中字体、大小和颜色多变的文本具有很好的定位效果而且还实现了视频文本定位要求的快速性和准确性的特点。  相似文献   

5.
基于小波重构的视频图像文本检测方法   总被引:1,自引:0,他引:1  
提出一种基于小波重构的视频图像文本提取方法.原始图像经小波分解重构得到特征图像,在特征图像上使用固定尺寸的文本检测器提取图像区域的属性特征,利用神经网络分类器确定该图像区域的属性.实验表明,本方法与基于边缘特征的文本提取方法相比,具有更好的性能.  相似文献   

6.
针对基于视觉特征的ROI提取算法的不足和图像噪声的影响,借鉴图像分块的思想,提出了一种基于背景像素点统计模型进行ROI提取的算法。该算法基于图像分块,消除了噪声作为显著视觉特征时对ROI提取的影响。将该算法运用于室内监控图像中的ROI提取实验。结果表明,所提算法能实现多种情况下感兴趣区域的自动准确提取。  相似文献   

7.
通过对视频图像进行快速、准确的文本定位与识别,有利于提高视频信息处理的效率与准确率.采用Gabor滤波器实现在横、竖、撇、捺四个方向上的视频图像的纹理特征的提取,再通过RBM逐层增量深度学习算法构建深度置信网络,实现对提取的纹理特征图像中文本区域的定位.论文同时研究了利用形态学处理方法和OCR字符库实现对视频图像文本识别的可行性,并分析了识别效果.测试结果表明,本文提出的深度学习算法与形态学字符识别方法相结合,不但能够实现对视频图像文本区域的准确定位,还有利于提高字符识别的效率和准确率.  相似文献   

8.
为了解决最大稳定极值区(MSER)提取过程中产生的大量重复文本区域和非文本区域难以被剔除影响算法精度的问题,提出了一种基于树修剪和多特征融合的场景文本检测方法。首先提取出边缘叠加的MSER作为文本候选区域;其次设计了一种MSER树修剪算法剔除重复文本区域;然后采用贝叶斯分类器融合多特征剔除非文本区域;最后设定了一系列相似性标准合并文本区域。ICDAR 2011数据集(f=76.8%)上的实验结果低于目前最好的算法\[19\],但算法在速度上具有明显的优势。  相似文献   

9.
基于背景分割技术提出了一种复杂背景下水面运动目标提取算法。在算法的第1阶段,采用统计差分图像方法分割出无运动的岸上背景区域,同时获得场景中的运动区域,包括水面及水面运动目标。在算法的第2阶段,根据水面区域在HSI色彩空间中的统计信息,运用基于Mahalanobis距离的决策方法,分析得到运动区域中的水面部分.图像中最后留下的部分即是运动目标。实验表明,该算法能够稳定地实现对水面目标的提取及跟踪。  相似文献   

10.
为了提取自然图像中的主要视觉信息以便更好地对图像进行压缩,提出了一种新的基于感兴趣区域的图像压缩方法.该方法使用一个基于视觉生理和心理物理实验结果的视觉注意计算模型计算图像中的感兴趣区域,并用JPEG算法对感兴趣区域和背景区域采用不同的压缩比进行压缩,对部分图像进行了初步实验.结果表明,用该方法压缩后图像的字节数和每像素比特数等参数均好于JPEG算法;同时压缩后图像在视觉上对比突出了感兴趣区域,有利于对感兴趣区域的观察.  相似文献   

11.
如何从海量的图像里将文本图像挑选出来是网络图像处理领域的研究热点.为了达到更好的文本图像识别效果,文章从文本图像的文字特征出发,提出了一种基于连通区域矩阵的文本图像识别方法.首先对图像进行二值化,计算二值化后图像的连通区域矩阵,然后根据连通区域矩阵提取出图像的8维特征值,最后使用BP神经网络来对图像进行训练和识别.实验证实,该方法在保证较高识别率的同时,明显降低了误识率.  相似文献   

12.
如何快速准确地提取标定板图像的特征点坐标是摄像机标定中的关键问题之一.该文针对摄像机以特定的空间角度成像的标定问题,提出了一种用于摄像机标定的图像特征点提取算法.此算法对图像进行区域选取,并对区域图像进行大津阈值分割,击中击不中细化,象素统计等处理,得到特征点的坐标值.实验结果表明该方法可以快速有效地获取特征点的坐标,...  相似文献   

13.
基于边缘检测终止条件的区域生长算法   总被引:1,自引:0,他引:1  
提出了一种边缘检测和区域生长分割算法相结合的病灶区域提取的新方法.通过最大最小曲线流保留边缘算法对图像进行平滑去噪,利用区域生长算法对图像进行分割.采用Canny算子做为分割的终止条件.实验证明,该方法能够精确的提取出病灶区域.  相似文献   

14.
针对刑侦图像的自动目标提取问题,提出一种基于最小卡方统计的图像阈值化分割算法。该算法在图像一维直方图的基础上,利用卡方统计计算原图像与二值化后图像之间的相似性程度,从而获取最佳的分割阈值,提取图像中的目标区域。在实际刑侦图像库上的测试结果表明,该算法可以有效提取不同类型刑侦图像中的目标区域。  相似文献   

15.
基于全景视觉机器人定位的路标提取方法   总被引:1,自引:0,他引:1  
针对全景图像像素点过多、图像复杂导致单一图像分割算法难以提取出图像中人工路标的问题,提出了一种用HSV阈值分割法与OTSU最大类间方差法相结合的算法.通过对两种算法的结合使用,可以更有效地滤除图像中的干扰区域及干扰点,从而将路标从图像中提取出来.利用三角定位法的相交圆法计算出移动机器人的坐标,完成对移动机器人的定位.结果表明,该方法能够提取出全景图像中的路标,有效地避免了错误提取的情况,具有一定的可行性.  相似文献   

16.
基于改进FCM和径向基函数插值的图像修复   总被引:1,自引:0,他引:1  
图像破损区域的检测提取是图像修复过程中的关键预处理步骤,模糊C均值聚类算法(FCM)在聚类过程中易受到初始聚类中心影响并陷入局部最优.提出一种基于差分演化的改进模糊C均值聚类算法(DEFCM),该方法通过建立图像的灰度-梯度直方图获取聚类数目,作为差分演化算法(DE)问题的维数,结合改进的FCM自适应提取图像破损区域,在此基础上,利用径向基函数插值方法(RBF)对图像进行修复.经实验验证,该方法能解决FCM算法陷入局部最优的问题,能正确、稳定的提取灰度图像的多种破损区域,RBF通过对破损区域的插值得到缺失信息,实现图像的修复.  相似文献   

17.
如何高效地从图像、视频等多媒体数据中挖掘网络舆情事件的关联主题给网络舆情的有效监管带来了重大挑战.研究图像和视频截图等多媒体数据中文本信息的抽取方法,并在此基础上实现舆情关联主题的检测.选择新浪微博中的3个典型舆情事件为研究对象,设计网络爬虫收集事件中的文本、图像和视频多模态数据;采用连接文本提议网络(connectionist text proposal network,CTPN)的文字检测算法实现文本信息定位,利用DenseNet网络和连接时序分类(connectionist temporal classification,CTC)相结合的方法进行文本提取;提出多粒度潜在狄利克雷分布(multi granularity-latent Dirichlet allocation,MG-LDA)和jieba分词相结合的舆情关联主题提取方法.实验结果表明,所提出的方法可准确提取多媒体数据中不同格式、不同分辨率、不同颜色、不定位置和不同角度的文本信息,为精确把握舆情演化态势提供有力的数据支撑.  相似文献   

18.
针对铅锌浮选气泡暗颜色、细节弱、分割难的特征,提出了一种新的图像分割算法。该算法分成三个部分: 气泡边界增强: 基于分形学改进分数阶微分算法,主要是根据图像的纹理特性自动确定分数阶微分的非整数阶数,以自适应分数阶微分算法增强气泡边缘; 气泡亮点区域提取: 在改进传统的水平集算法基础上,进行精确的气泡亮点区域的提取,克服了全局自动阈值算法在提取气泡亮点时存在的缺陷; 图像分割: 利用内外标记修正梯度图像, 最后运用分水岭算法对浮选图像进行分割。对于不同铅锌矿大小气泡图像的实验,并通过与多种传统的图像分割算法分析比较,实验结果表明新算法不仅提高了浮选气泡图像的分割精度,并且有效地减少了传统图像分割算法的过分割问题,本文算法对于浮选气泡具有良好的分割效果。  相似文献   

19.
为解决不均匀光照下图像二值化问题,提出一种基于最大类间方差法(OTSU算法)的改进二值化算法,将图片分为明亮区域和阴暗区域两部分,分别计算两部分最大类间方差对应的阈值,通过分析阴暗区域特征,判断每一像素点位于明亮区域还是阴暗区域,从而确定每一点的阈值。实验结果表明,该算法可以解决OTSU算法处理光照不均匀图像丢失信息问题,可广泛应用于光照不均匀条件下的文本图像二值化处理,针对特殊情况较好,相对于其他算法适用性更强,本算法可通过提高OTSU算法的运算速度,缩减算法的运行时间。该研究提取信息较为完整,可以作为字符识别及缺陷检测等工作的预处理方法,提高识别精度。  相似文献   

20.
形态金字塔图像分割算法   总被引:1,自引:2,他引:1  
提出了一种数学形态金字塔图像分割算法,使用形态金字塔算法将图像逐级分解,在不同分辨率空间中对细节信息进一步处理,分割出不同特征区域.SAR图像实验结果表明该算法可以作为一类带通滤波器,提取不同特征区域,实现图像的多分辨率分割.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号