共查询到18条相似文献,搜索用时 62 毫秒
1.
针对传统的视觉词袋(bagofvisualwords,BoVW)模型忽略了视觉单词的空间位置信息的问题,文章提出一种基于视觉单词共生矩阵的图像分类方法。首先对整幅图像进行空间金字塔分解,得到一系列图像块;然后针对每一图像块中的SIFT点,在其空间邻域范围内构建视觉单词共生矩阵(visual words co—oeeurrenee matrix,VWCM)单元,并得到该图像块对应的视觉单词共生矩阵;最后设计出一种新的空间金字塔共生矩阵核(spatial pyramideo—occurrence matrixkernel,SPCMK),并将其用于图像分类。该方法能够有效地刻画视觉单词的绝对和相对位置信息,极大地增强了图像表达的完整度与准确度。实验结果表明,文章方法确实能够大幅度提高图像分类的准确率。 相似文献
2.
基于空间金字塔的BoW模型图像分类方法 总被引:1,自引:0,他引:1
《西安邮电学院学报》2018,(3):31-37
针对不同场景图像下词袋(bag of words,BoW)模型的图像分类准确率较低的问题,提出了一种基于空间金字塔BoW模型的图像分类方法。该方法通过尺度不变特征变换(scale-invariant feature transform,SIFT)算法提取原始图像像素特征点作为视觉特征,对相似视觉特征进行聚类形成视觉词袋,并采用空间金字塔方法对视觉词袋进行划分,构建空间金字塔的BoW模型,通过支持向量机分类器对分层后的视觉词袋进行图像分类。分别使用BoW模型和空间金字塔的BoW模型分类方法对网络图像数据库进行分类实验对比,结果表明,空间金字塔BoW模型能有效提高BoW模型的图像分类准确率。 相似文献
3.
针对矢量量化编码的量化误差严重,而稀疏编码只是一种浅层学习模型,容易导致视觉词典对图像特征缺乏选择性的问题,提出了一种基于深度学习特征编码模型的图像分类方法。首先,采用深度学习网络无监督的受限玻尔兹曼机(RBM)代替传统的K-Means聚类及稀疏编码等方法对SIFT特征库进行编码学习,生成视觉词典;其次,对RBM编码添加正则化项分解组合每个特征的稀疏表示,使得生成的视觉单词兼具稀疏性和选择性;然后,利用训练数据的类别标签信息有监督地自上而下对得到的初始视觉词典进行微调,得到图像深度学习表示向量,以此训练SVM分类器并完成图像分类。实验结果表明,本文方法能有效克服传统矢量量化编码及稀疏编码等方法的缺点,有效地提升图像分类性能。 相似文献
4.
5.
依靠单一特征核函数不能很好地表示图像语义内容的融合,导致其图像分类算法只具备一般的判别能力。针对上述问题,采用基于图像簇模型的图像分类方法,研究将给定样本图像类别中具有相似形状、纹理或颜色特征的样本图像聚类到一个图像簇中,确保图像分类的准确性;该方法解决了样本图像簇和单个样本目标之间的关系,即样本图像中单个图像之间的差异,使学习模型获得较高的判别能力。经实验验证,图像簇多核学习模型能很好地减弱类内差异性和类间相似性的影响,且得到鲁棒性更强的图像分类模型。 相似文献
6.
提出一种新的框架用于改进传统词袋模型效率较低的问题。该方法建立在通过小波变换获取的低尺度图像表示上,利用在低尺度图像上提取单尺度的SIFT特征,建立低尺度视觉词典。由于大幅度减少了图像初始特征维数,该方法可以快速建立视觉词典,并且有效地降低后续图像分类所花费的时间。通过对Caltech101数据集全部8 677张图像的分类测试显示,该方法可以在保证分类性能的同时,有效地提升基于传统词袋模型的图像分类效率。实验结果表明,该方法可以全面提升金字塔匹配的词袋模型分类性能和分类效率,普遍用于传统词袋模型及其衍生方法。 相似文献
7.
本文通过描述信息设计学科的概要,以及分析这一领域内视觉语言意义的构建、信息的传播与接受的主要问题,对信息设计视觉语言的初步理论框架进行研究与探讨。 相似文献
8.
基于内容的图像检索技术克服了文本检索方式主观片面的缺陷,客观地描述了图像的本质特征,然而却丢掉了文本方式下对图像的语义描述,导致检索准确率降低.借鉴数据挖掘技术中的图像分类方法,提出了结合视觉特征与图像语义描述以提高检索系统性能的思想,主要进行了图像显著特征选择、图像分类算法特征约简以及检索系统优化设计3方面工作,以提高检索系统的人机界面和交互性能. 相似文献
9.
避开图像相似度大小的定义,通过决策表理论解决图像的分类与检索问题.颜色的特征提取主要依据颜色的面积排序,同时考虑了颜色的空间分布关系.然后基于关系理论,得到一种图像的约简方法. 相似文献
10.
为了有效地组织、管理和浏览大规模的图像资源,提出了一种利用局部特征进行图像分类的方法。通过深入分析和比较常见的局部特征,选用合适的局部特征构建视觉单词库。这些视觉单词具有很好的平移、旋转、尺度不变性,并对噪声有一定的抵抗能力。借鉴文本分类领域的向量空间模型进行图像的表示,并设计出了相应的分类算法。标准图像库上的实验结果表明,该方法在图像分类中有效,有较高的实用价值。 相似文献
11.
将油气田井口图像实时地传输到油气田基地,实现基地对现场多个分散目标的实时监控是现代化生产管理的重要手段.介绍了一种基于Cyclone系列EP1C12的FPGA图像采集与远程传输系统,阐述了系统的硬件组成、工作原理,并详细描述了图像解码单元、图像压缩处理单元、图像编码单元和图像输出单元等的结构和算法设计.实验证明系统性能稳定,完全满足现场实时性的要求. 相似文献
12.
秦安建 《四川烹饪高等专科学校学报》2014,(4):60-63
乡村酒店的视觉形象设计不但要考虑经济效益,而且更要强调地域生态效益。乡村酒店的的品牌形象打造不仅需要把握酒店的服务功能,而且还需要从视觉设计角度强化其形象特征。因此,乡村酒店的建筑视觉符号设计和VI视觉识别系统等视觉形象设计应强调其自身的独特性,遵循与地域生态协调、凸显地域文化的独特性与强调休闲娱乐的参与性原则,给消费者以深刻的视觉体验,才有利于酒店的品牌形象传播。 相似文献
13.
提出了利用小波分解建立多分辨率图像锥和Hausdorff距离的医学图像配准方法。先利用小波方法建立多分辨率图像锥,然后根据梯度向量幅度提取分层图像的特征点,利用Hausdorff距离进行特征点集的匹配。该方法提高了配准的速度和精度,而且具有鲁棒性。 相似文献
14.
距离泥浆输送管道系统粗糙系数作现场检测,对检测数据进行统计,得出符合工程实际的输送泥浆钢管的粗糙系数值,对疏浚工程中输送泥浆管道的布置与加压泵站布设提供了符合实际的技术依据,避免了仅凭经验与感觉决策的盲目性,对降低疏浚工程中泥浆输送成本,提高疏浚工程的经济效益有一定的现实意义. 相似文献
15.
从人眼视觉的生理特性和人的心理特性出发,分析了ICT(工业CT)图像的灰度分辨能力和图像结构的敏感性。根据测试结果得到了在复杂背景下视觉对目标的分辨能力,建立了相应的数学模型和具体实现方法。将该方法应用于ICT图像处理系统中,提高了图像质量,增加了缺陷判断的准确性。 相似文献
16.
长输管道泄漏检测和定位技术 总被引:8,自引:0,他引:8
随着石油、天然气等工业的发展,管道输送在国民经济中的地位越来越重要,特别是长距离输送管道的优势更是明显.同时,由于管道泄漏不仅造成资源浪费,而且污染环境,所以长距离输送管道的在线实时泄漏检测和定位技术巳显得异常重要,而且也是一个亟待解决的问题.文中介绍了长距离输送管道的泄漏检测性能指标及目前泄漏检测和定位方法的现状,并指出了泄漏检测和定位技术的发展方向. 相似文献
17.
基于多级空间上下文LR—CRFs模型的高分辨率影像分类 总被引:1,自引:0,他引:1
充分表达和利用目标空间上下文及语义信息是提高高空间分辨率影像分类精度的关键技术,而条件随机场(CRFs)在目标空间上下文建模以及分类预测方面有其独特优势。但是,基于单一尺度分析的CRFs模型存在不能反映目标多层次空间结构及语义关系的问题,因此针对城区高分辨率影像土地利用/覆盖分类问题,在面向对象分类框架下,提出了一种多级空间上下文LR-CRFs模型。该模型定义如下:首先,将影像进行对象层?目标层及场景层的分层表达及分层特征提取,并进行“对象目标场景”的逐层关联;其次,采用逻辑回归(LR)分类器定义CRFs模型的关联势函数,利用分层特征加权的Potts函数定义交互势函数;采用最大积消息传递算法对该模型进行近似推理。利用IKONOS多光谱影像及大比例尺真彩色航空影像进行试验的结果表明:多级空间上下文LR-CRFs模型分类精度高于单一尺度的基于像素层或对象层分割的LR-CRFs模型,其精度平均分别提高了4.63%和2.22%;该方法在一定意义上也缓解了面向对象分类方法中分类结果对分割尺度的依赖程度。 相似文献
18.
为了有效地对数字图像中的目标物体进行分割,提出了一种结合人类视觉注意机制的距离正则化水平集演化的图像分割方法,首先,利用数据融合获得视觉注意机制的显著图,进而获得曲线演化的初始轮廓,解决了演化曲线对初始位置敏感及不能自适应地决定向内还是向外运动的问题;然后,利用自定义的图像边缘指示函数,通过优化函数的演化速度参数及噪声敏感度控制参数,加快了曲线演化速度;最后,利用距离正则化水平集演化至目标物体的边界,完成图像分割,仿真结果表明:该方法能够有效地检测单个及多个目标物体的边界,提高了边界定位精度,抗噪能力较强. 相似文献