首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 243 毫秒
1.
一种语义级文本协同图像识别方法   总被引:1,自引:1,他引:0  
为解决单纯依赖图像低级视觉模态信息进行图像识别准率低的问题. 考虑到许多图像中存在文本信息,提出了利用图像中的文本信息辅助图像识别的语义级文本协同图像识别方法. 该方法通过文本定位方法定位到图像中的文本块,对其进行分割、二值化、提取特征等处理;然后获取语义,提取图像底层视觉信息,计算两模态的相关性,从而得到协同后验概率; 最后,得到联合后验概率,并取其中最大联合后验概率对图像进行识别. 在自建体育视频帧数据库中,通过与以朴素贝叶斯为代表的单模态方法进行比较,方法在3种不同视觉特征下均具有更高的准确率. 实验结果表明,文本协同方法能够有效辅助图像识别,具有更好的识别性能.  相似文献   

2.
一种基于量子遗传算法的红外图像分割方法   总被引:1,自引:0,他引:1  
针对经典的二维O tsu和最大熵算法的不足,提出了一种基于量子遗传算法的海上红外图像目标分割方法.该方法同时考虑了图像像素点的灰度分布信息和像素间的空间相互信息,将基于fisher准则的类内类间距离判据作为分类依据,利用量子遗传算法进行寻优以获取最佳阈值,实现了海上红外目标图像的分割过程.选取3幅海上红外目标图像进行了仿真实验.实验结果表明,提出的方法在分割效果和计算速度上都优于传统的O tsu和最大熵法.  相似文献   

3.
工业视觉检查系统中的图像处理及模式识别   总被引:3,自引:0,他引:3  
工业视觉检查系统是对工业零件进行分类、识别的自动检查装置.该系统针对工业零件的强度图像采用图像传感器摄取原始信息,研究了图像预处理、图像分割、特征提取及分类等内容,并获得了较理想的图像,达到了对图像进行预处理的目的,为模式识别打下了基础.  相似文献   

4.
为解决经典聚类图像分割算法对聚类中心的依赖性和图像噪声的敏感性问题,提出了一种基于信息聚类的遥感图像分割方法.利用Gaussian分布建立同质区域内像素的概率分布,即假设每个同质区域内的像素都服从同一独立的Gaussian分布;结合Gaussian分布的特性建立像素对间灰度的联合分布.在此基础上,以互信息作为聚类算法的相似性测度,结合同质区域内以及同质区域间像素灰度的相似性建立目标函数,通过最大化求解上述目标函数,进而转化为迭代求解像素与同质区域的隶属度实现遥感图像分割.分别对模拟及真实遥感图像进行分割实验.结果表明:该方法不仅避免了聚类中心的选取,还降低了噪声敏感性,并且增强了图像分割的稳定性,从而验证了该方法的可行性及有效性.  相似文献   

5.
提出了利用差分盒维数与颜色特征相结合的图像识别方法来将彩色烟雾图像从森林背景中识别出来。该方法首先用差分盒维数算法来计算整幅图像的分形维数值并基于该值对图像进行分割,再以RGB空间的烟雾颜色特征为依据,对差分盒维数方法分割出的区域进行判别,识别出烟雾区域。为改善算法的计算精度,提高算法运算速度,提出了减少子窗口内盒子的覆盖数量、改变子窗口内灰度等级的改进算法。仿真实验结果表明,基于改进的差分盒维数方法,不仅运算速度提高近50%,而且能够更好地反映图像表面的纹理信息。再结合颜色特征能从森林背景中准确的识别出烟雾。该方法可用于森林火灾的预警。  相似文献   

6.
图像分割方法及性能评价综述   总被引:1,自引:0,他引:1  
图像分割是图像处理与计算机视觉的基本问题之一,是完成图像识别、目标跟踪等复杂处理任务的关键步骤。本文综述了常用的经典图像分割方法,介绍了每种方法各自的特点及在分割处理时的性能。同时,还对图像分割的性能评价方法做了简要介绍。  相似文献   

7.
针对水果自动识别过程中特征信息提取不完整的问题,本文提出一种基于改进的最大类间方差法OTSU对水果图像进行分割。通过对图像中值滤波处理降低随机噪声的干扰,增大目标图像和背景之间像素值与最佳分割阈值之间的差值,使目标图像与背景图像与各自类间中心的距离尽可能相近,达到相对方差取代绝对方差实现图像分割,然后对目标图像提取颜色特征和形状特征实现不同种类的水果图像识别。实验结果表明,改进后的OTSU所得阈值能分割到更加清晰的图像,图像分割的运行时间明显缩短,水果图像识别的平均正确识别率提高了15%左右。该研究提高了水果识别的效率,具有一定的实际应用价值。  相似文献   

8.
针对低分辨率下小尺度人脸图像缺失有效身份信息导致的识别率低的问题,提出了超分辨率重建的微小人脸识别算法。该算法首先将采集到的低分辨率人脸图像进行超分辨率重建,并采用细节增强的方法,以恢复图像的面部轮廓信息与纹理细节等高频信息,再通过一个改进的密集连接网络做特征提取,进行图像识别。实验结果表明,该方法对于小尺度的人脸图像,在图像识别率上优于其它人脸识别算法,能够有效解决现实环境中微小人脸识别率低的问题。  相似文献   

9.
足球机器人视觉系统,分图像输入和数字化、图像预处理、图像分割和图像识别几步进行其步骤分别通过CCD摄像头、图像采集卡、图像增强、去噪处理、边缘增强技术、HSI模型及基于连续图像相关性的顺序网格和种子填充相结合的目标搜索方法进行图像识别来完成.  相似文献   

10.
医学图像分割是图像分割的一个重要应用领域,也是制约医学图像在临床上广泛应用的题.对医学图像分割技术进行了综合研究,在此基础上提出了一种新的基于小波变换的医学图像分割方法.首先利用小波变换提取边缘信息,然后采用C均值聚类法把原有灰度信息和边缘信息进行聚类.仿真试验证明该方法能有效地解决过分割问题,提高了分割效率.  相似文献   

11.
为了识别RGB-D视频中的人体动作,针对视频中运动信息利用不充分的问题,提出了一种基于运动学动态图的人体动作识别方法。首先利用RGB视频序列和对应的深度图序列生成场景流特征图,基于场景流特征图计算运动学特征图序列,其中包含丰富的运动信息;使用分层排序池化将运动学特征图序列编码为运动学动态图,同时将RGB视频序列编码为外观动态图,最后将运动学动态图和外观动态图输入到双流卷积网络进行人体动作识别。结果表明:基于运动学动态图和双流卷积网络的人体动作识别方法融合了外观信息和运动信息,不仅充分表征了视频的动态,而且使用了视频中具有丰富运动信息的运动学特征;在公开的数据集上对本方法进行验证,在M2I数据集和SBU Kinect Interaction数据集的动作识别率分别为91.8%和95.2%。  相似文献   

12.
Image classification based on bag-of-words (BOW) has a broad application prospect in pattern recognition field but the shortcomings such as single feature and low classification accuracy are apparent. To deal with this problem, this paper proposes to combine two ingredients:(i) Three features with functions of mutual complementation are adopted to describe the images, including pyramid histogram of words (PHOW), pyramid histogram of color (PHOC) and pyramid histogram of orientated gradients (PHOG). (ii) An adaptive feature-weight adjusted image categorization algorithm based on the SVM and the decision level fusion of multiple features are employed. Experiments are carried out on the Caltech 101 database, which confirms the validity of the proposed approach. The experimental results show that the classification accuracy rate of the proposed method is improved by 7%-14% higher than that of the traditional BOW methods. With full utilization of global, local and spatial information, the algorithm is much more complete and flexible to describe the feature information of the image through the multi-feature fusion and the pyramid structure composed by image spatial multi-resolution decomposition. Significant improvements to the classification accuracy are achieved as the result.  相似文献   

13.
针对目前使用计算机进行人脸识别往往效率较差,且未考虑到隐私保护等问题,提出一种新的云环境中考虑隐私保护的人脸图像识别方法.对人脸图像进行简化处理以保护主要信息,并建立人脸图像主成分分析(PCA)数学模型,采用局部二值模式(LBP)方法获取人脸图像纹理特征,采用保局投影(LPP)方法选择人脸特征,并选取最常见的分数法对选择后的特征进行稳定性度量,引入深度网络法进行人脸图像的识别.结果表明,所提出的改进方法在保证人员隐私的基础上,具有较高的识别精度与识别效率.  相似文献   

14.

基于主成分分析的厚板电子束焊缝超声相控阵

扇形扫描图像特征提取

刚铁1,栾亦琳2,张弛1

(1.哈尔滨工业大学 先进焊接与连接国家重点实验室,哈尔滨 150001;

2.黑龙江科技大学 材料科学与工程学院,哈尔滨 150022)

摘 要:

为解决缺陷识别模型训练时高维数据引起的耗时巨大问题,提出一种基于主成分分析的特征提取算法。从Ti-6Al-4V厚板电子束焊缝超声相控阵扇形扫描图像中提取出7个特征值,代表了原始数据87.3%的信息量。将提取的特征值和原始数据均用于训练支持向量机缺陷识别模型,从缺陷识别准确性和训练时间两个方面评价特征提取算法的有效性。结果表明,采用特征值训练的缺陷识别模型,气孔、裂纹、未熔合和未焊透的识别率分别为93%、 90.7%、94.7% 和 89.3%,略高于采用原始数据训练的模型。采用特征值的模型训练时间相比于采用原始数据的模型训练时间大大降低了。

关键词:电子束焊缝;超声相控阵;扇形扫描图像;特征提取;主成分分析

  相似文献   

15.
Ultrasound imaging is an importantimaging modal-ity, which can be applied in procedures such as surgi-cal planning, image-guided surgery and other applica-tions that are used for both diagnosis and therapy[1].Conventional 2D ultrasound imaging is performe…  相似文献   

16.
提出一种利用基于梯度加权的灰度归一化互信息相似性测度,并采用凹函数递减的权衡比重的粒子群优化算法作为搜索策略的多模图像精确配准方法。传统的基于灰度互信息配准方法往往只考虑灰度相关性,忽略或不当引入图像空间特征信息,配准容易陷入局部极值,从而出现误配。将灰度与梯度特征有效融合,即梯度加权到灰度互信息中,同时考虑了2幅图像的灰度统计相关性和图像空间特征信息,提高了多模图像配准的精度与稳定性。通过对遥感图像的拟配准与MR-PET医学图像的实际配准,证明了该方法效果良好,算法稳定,配准的准确率和参数精度都得到明显的提高。  相似文献   

17.
Featuresubsetselection(FSS)istoselectrele vantfeaturesandcastawayirrelevantandredundantfeaturesfromtheoriginalfeaturesetaccordingtoaFSSmeasure[1].IfafeaturesubsetsatisfiestheFSSmeas ureandhastheminimumsize,itisconsideredapartoftheoptimalfeaturesubset.Comp…  相似文献   

18.
张宇苏    吴小俊    李辉    徐天阳   《南京师范大学学报》2023,(1):001-9
红外和可见光图像表征了互补的场景信息. 现有的基于深度学习的融合方法大多通过独立提取网络分别提取两个源图像特征,从而丢失了源图像之间的深度特征联系. 基于此,提出了一种新的基于无监督深度学习的红外图像与可见光图像融合算法,针对不同模态的特点采用不同的编码方式提取图像特征,利用一个模态的信息补充另一个模态的信息,并对提取到的特征进行融合,最后根据融合特征重建融合图像. 该算法可在两个模态的特征提取路径之间建立交互,不仅可预融合梯度信息和强度信息,且能增强后续处理的信息. 同时设计了损失函数,引导模型保留可见光的细节纹理,并保持红外的强度分布. 将所提算法与多种融合算法在公开数据集上进行对比实验,结果表明,所提算法获得了良好的视觉效果,客观指标评价方面对比现有的优秀算法也有一定的提升.  相似文献   

19.
为了探究图像底层视觉特征与高层语义概念存在的差异,提出可以确定图像关注重点、挖掘更高层语义信息以及完善描述句子的细节信息的图像语义描述算法. 在图像视觉特征提取时提取输入图像的全局-局部特征作为视觉信息输入,确定不同时刻对图像的关注点,对图像细节的描述更加完善;在解码时加入注意力机制对图像特征加权输入,可以自适应选择当前时刻输出的文本单词对视觉信息与语义信息的依赖权重,有效地提高对图像语义描述的性能. 实验结果表明,该方法相对于其他语义描述算法效果更有竞争力,可以更准确、更细致地识别图片中的物体,对输入图像进行更全面地描述;对于微小的物体的识别准确率更高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号