首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
一种语义级文本协同图像识别方法   总被引:1,自引:1,他引:0  
为解决单纯依赖图像低级视觉模态信息进行图像识别准率低的问题. 考虑到许多图像中存在文本信息,提出了利用图像中的文本信息辅助图像识别的语义级文本协同图像识别方法. 该方法通过文本定位方法定位到图像中的文本块,对其进行分割、二值化、提取特征等处理;然后获取语义,提取图像底层视觉信息,计算两模态的相关性,从而得到协同后验概率; 最后,得到联合后验概率,并取其中最大联合后验概率对图像进行识别. 在自建体育视频帧数据库中,通过与以朴素贝叶斯为代表的单模态方法进行比较,方法在3种不同视觉特征下均具有更高的准确率. 实验结果表明,文本协同方法能够有效辅助图像识别,具有更好的识别性能.  相似文献   

2.
为了提高在建工地对施工现场扬尘污染情况的监测与识别能力,提出一种基于灰度共生矩阵的建筑工地扬尘识别方法.利用大律法对施工场地视频图像进行二值化处理,得到区分背景图像与需监测图像的最佳阈值.构建灰度共生矩阵,将预处理后的图像按照像素值进行矩阵化分割,提取特征值.最后,通过训练好的朴素贝叶斯分类器进行污染图像识别.实例验证...  相似文献   

3.
提出一种基于背景规范化的照相文本图像二值方法.通过方差计算确定文本图像的文字区域,并对文字区域进行背景插值后得到原始文本图像的背景图.根据背景图把原始文本图像转换成背景规范化的文本图像,同时用拟合曲线对不同明暗背景区实行相应的对比度补偿,把前景像点与背景像点设置到较小的灰度范围,然后用全局阈值方法进行二值化处理.试验结果表明,该方法是有效的.  相似文献   

4.
通给出了一种新的视频运动目标检测算法.该算法采用差异积累的方法自适应更新背景模型,用背景差法进行运动检测,用Otsu法计算二值化阈值,给出了Otsu法类间方差简化公式的详细推导.在背景差图像阈值化的基础上,对视频帧进行网格区域划分,并定义网格矩阵,设定网格内前景点个数的阈值,对视频帧像素进行重新定义,再对网格矩阵进行连通区域合并和前景区域定位.采用不同的视频测试序列,从检测效果及耗时上研究了基于网格的视频运动目标检测算法的性能,并与区域生长法进行了比较.实验结果表明,该算法具有良好的检测效果和实时性能.  相似文献   

5.
给出了消除机械工程图扫描图像二值化产生的线的边界断裂、得到图像中完整边界的一种方法 .通过对第二层小波变换模极大值图像上的连通区域上各点的灰度 ,使用灰度平均方法进行平均 ,然后对第二层小波变换模极大值图像运用最大方差阈值法进行二值化 ,使图像中模糊之处的边界完整保留下来 ,保持了边界的连续性 .该方法速度快 ,适用于与灰度无关的线型图像 ,应用范围较广  相似文献   

6.
针对数字仪表图像噪声大、图像特征信息不足导致图像识别准确率低的问题,提出了一种基于卷积递归神经网络结合投影阈值分割和数字序列校正的高噪数字仪表图像识别方法。首先,用投影阈值分割二值化算法对图像进行预处理:使用垂直投影法将图像划分为不同区域,根据不同区域的噪声强度自适应设定二值化阈值,对图像进行二值化处理,降低噪声;其次,根据图像之间数字规律变化特点,利用数字序列校正算法将单个数字识别转换为数字序列识别,通过对比不同数字序列的识别概率得出识别结果,解决单张图像特征信息不足导致识别准确率低等问题。实验结果表明,在高噪声数据集上,相较于卷积递归神经网络模型,提出的高噪声数字仪表识别模型在准确率方面提高了约61.95%,达到93.58%。  相似文献   

7.
车牌识别中的图像提取和分割算法   总被引:1,自引:0,他引:1  
在对车牌图像中的几种主流字符提取、分割的方法进行分析、比较的基础上,对车牌图像先应用形态学中的开运算增强,再选择自适应阈值并进行二值化,以连通区域法为基础,结合投影法、固定边界法进行分割.结果表明,这种策略在增强图像分割效果的基础上,加快了图像处理速度.  相似文献   

8.
为了从含有大量物体的复杂背景图像中提取出二维条码,给出一种基于图像连通区域特征、角点特征和边缘特征的提取方法,即将灰度图像二值化后进行形态学处理,排除复杂背景中大量无关因素,对筛选出的子区域进行角点检测准确定位出二维条码的位置。通过采集大量不同光照、不同物体为背景的图像对新方法进行检测,提取结果均获成功。  相似文献   

9.
源于设计类App中图像识别技术的研究,结合图像的颜色、纹理、形状、空间关系特征,分别构造了4个特征矩阵将图片特征信息二值化,把图像识别中搜索匹配问题转化为一类线性矩阵方程计算问题。结合修正共轭梯度算法创建求这类线性矩阵方阵的迭代算法,解决了设计类App中图像搜索近似匹配问题。  相似文献   

10.
自动定位彩色图像中的文本   总被引:2,自引:0,他引:2  
提出一种适用于万维网搜索、彩色图像索引和视频索引等多种应用的彩色图像文本定位方法.算法采用多尺度图像分割方法把彩色图像分割为一系列可能包含文本的图像块,用连通区域方法确定每一个文本图像块中文本的精确位置和大小.采用多颜色图像分解方法提取具有相似颜色的连通区域,通过聚类相邻的连通区域得到文本的位置和范围.利用一个图像数据库来测试本文算法,试验表明算法具有较高的正确率.  相似文献   

11.
针对目前图像编码的研究工作更加重视信息无损性,而没有体现出社交网络图像区分度的问题,本研究提出一种新颖的基于深度卷积神经网络的社交网络图像自编码算法,将深度卷积神经网络提取特征的能力与社交网络中图像的特点相结合,得到性能良好的图像自编码。结合社交网络图片的特性与聚类算法,先将图片进行聚类得到距离信息,再利用深度卷积神经网络学习图片的距离信息,提取深度卷积神经网络中的全连接层作为编码,重复以上步骤,并得到最终的图像编码。试验结果表明,本研究提出的算法在图像搜索中的效果好于其他算法,更利于在社交网络图像搜索中使用。  相似文献   

12.
针对文本图像特有的图像特征.提出了一种基于底层图像特征组合的文本图像分类方法,该方法使用了两层C4.5决策树分类器,能将文本图像有效地分为标题文本图像、文档图像和场景文本图像.首先将样本图像转换为灰度图像,提取灰度直方图的特征,根据灰度直方图特征的不同。可以先区分文档图像:然后把余下的图像转换为二值图像,提取图像的GLCM纹理特征,根据GLCM特征区分场景文本I和标题文本图像.在开源的WEKA数据挖掘软件环境下进行仿真实验,结果表明该方法是可行的。并能够得到较高的查全率和查准率.  相似文献   

13.
提出了一种基于连通域的文本图像倾斜校正方法.使用基于连通域的分行算法对倾斜文本图像的文本行进行分行,用线性回归公式计算出每一个有效文本行的拟合直线和倾斜角,根据有效文本行的加权平均倾斜角度,对倾斜文本图像进行校正.实验结果表明该方法是有效的.  相似文献   

14.
一种在复杂背景彩色图像中划分手部图像的方法   总被引:5,自引:0,他引:5  
对面部和手部图像进行正确定位是当前图像处理领域中的重要课题 .在机器人手势识别实验中 ,我们试图利用一个BP神经网络对连续手势进行识别 .由于实时性的要求 ,我们希望找到一种尽量简单的图像划分方法 .本文通过对采集到的彩色图像进行色度变换和色调过滤 ,成功的实现了从复杂背景的彩色图像中划分出手部图像 ,并提取其轮廓以供处理 .作为计算机图像识别的预处理过程 ,这种划分方法算法简单 ,易于实现 ,十分适合于实时彩色图像的划分与识别 .  相似文献   

15.
数码相机拍摄的透视文本图像的校正   总被引:1,自引:0,他引:1  
提出了一种数码相机拍摄的透视文本图像的校正方法.文字区潜在的文本框,它在透视文本图像中是一个凸四边形,它对应于原文本中的是一个矩形.应用这种凸四边形与矩形的对应关系可以确定透视变换的单应矩阵,应用该单应矩阵实现对透视文本图像的校正.实验结果表明该方法是有效的.  相似文献   

16.
It is very important to accurately recognize and locate pulverized and block coal seen in a coal mine's infrared image monitoring system.Infrared monitor images of pulverized and block coal were sampled in the roadway of a coal mine.Texture statistics from the grey level dependence matrix were selected as the criterion for classification.The distributions of the texture statistics were calculated and analysed.A normalizing function was added to the front end of the BP network with one hidden layer.An additional classification layer is joined behind the linear layer.The recognition of pulverized from block coal images was tested using the improved BP network.The results of the experiment show that texture variables from the grey level dependence matrix can act as recognizable features of the image.The innovative improved BP network can then recognize the pulverized and block coal images.  相似文献   

17.
基于轮廓特征的图象配准研究   总被引:1,自引:0,他引:1  
图象配准的一个重要问题是多传器获取的图象配准,这些图象具有不同的灰度特征,用经典技术加区域相关等不能解决,基于轮廓在大多数情况下表达了区域的边缘信息,本文提出了基于轮廓特征的匹配方法,该方法采用区域边缘和其它强边界特征作为匹配对象,算法中参数估计理论,先用闭轮廓的特征在,现用开轮廓的突出部分进行校正。  相似文献   

18.
针对打捆钢筋的计数问题,提出了一种基于图像连通区域面积的打捆钢筋计数方法.通过对打捆钢筋端部图像进行灰度化、滤波和图像分割处理,使分割后图像中的连通区域分类为噪声、一根钢筋和多根钢筋,并将所有连通区域的钢筋求和,就可以得到图像中全部钢筋的数目.结果表明,新算法不仅缩短了运算时间,还能够较好地去除非均匀光照和噪声等因素的干扰,突出了图像内部的细节,有利于后续钢筋的识别和计数.  相似文献   

19.
图像匹配是计算机视觉和图像处理中的一个重要内容,它为人们描述或识别图像及解释图像提供了一种重要的特征依据.本文尝试利用突变理论研究图像的突变特征,从突变的角度进行图像匹配,通过尖点突变理论建立突变模型,找出图像的突变点,再对突变点粗匹配和精匹配进行匹配操作,然后判断其一致性.本文算法简洁有效.  相似文献   

20.
针对传统手工特征方法无法有效提取整体图像深层信息的问题,本文提出一种基于深度学习特征融合的场景分类新方法.利用灰度共生矩阵(GLCM)和局部二值模式(LBP)提取具有相关空间特性的纹理特征和局部纹理特征的浅层信息;通过基于AlexNet迁移学习网络提取图像的深层信息,在去除最后一层全连接层的同时加入一层256维的全连接层作为特征输出;将两种特征进行自适应融合,最终输入到网格搜索算法优化的支持向量机(GS-SVM)中对遥感图像进行场景分类识别.在公开数据集UC Merced的21类目标数据和RSSCN7的7类目标数据的实验结果表明,5次实验的平均准确率分别达94.77%和93.79%.该方法可有效提升遥感图像场景的分类精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号