首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 515 毫秒
1.
目的 食物图片具有结构多变、背景干扰大、类间差异小、类内差异大等特点,比普通细粒度图片的识别难度更大。目前在食物图片识别领域,食物图片的识别与分类仍存在精度低、泛化性差等问题。为了提高食物图片的识别与分类精度,充分利用食物图片的全局与局部细节信息,本文提出了一个多级卷积特征金字塔的细粒度食物图片识别模型。方法 本文模型从整体到局部逐级提取特征,将干扰较大的背景信息丢弃,仅针对食物目标区域提取特征。模型主要由食物特征提取网络、注意力区域定位网络和特征融合网格3部分组成,并采用3级食物特征提取网络的级联结构来实现特征由全局到局部的转移。此外,针对食物图片尺度变化大的特点,本文模型在每级食物特征提取网络中加入了特征金字塔结构,提高了模型对目标大小的鲁棒性。结果 本文模型在目前主流公开的食物图片数据集Food-101、ChineseFoodNet和Food-172上进行实验,分别获得了91.4%、82.8%、90.3%的Top-1正确率,与现有方法相比提高了1%~8%。结论 本文提出了一种多级卷积神经网络食物图片识别模型,可以自动定位食物图片区分度较大的区域,融合食物图片的全局与局部特征,实现了食物图片的细粒度识别,有效提高了食物图片的识别精度。实验结果表明,该模型在目前主流食物图片数据集上取得了最好的结果。  相似文献   

2.
目标识别一直是人工智能领域的热点问题. 为了提高目标识别的效率,提出了基于卷积神经网络多层特征提取的目标识别方法. 该方法将图像输入卷积神经网络进行训练,在网络的每个全连接层分别进行特征提取,将得到的特征依次输入到分类器,对输出结果进行比较. 选取经过修正线性单元relu函数激活的低层全连接层作为特征提取层,比选取高层全连接层特征提取的识别率高. 本文构建了办公用品数据集,实现了基于卷积神经网络多层特征提取的办公用品识别系统. 选择AlexNet卷积神经网络模型的relu6层作为特征选取层,选择最优训练图像数量和最优分类器构建系统,从而证明了该方法的可行性.  相似文献   

3.
张绍兵 《计算机测量与控制》2008,16(12):1994-1995,2002
针对无指针式仪表表盘的数字识别问题,提出一种基于特征提取和粗糙集特征约简的神经网络数字识别方法;该方法首先利用数字图像预处理技术处理图像并利用特征提取方法提取数字图像特征,然后利用粗糙集理论进行特征约简,最后将约简后的信息输入到训练好的神经网络进行识别;实验表明,相对于传统方法,该方法具有识别率高、速度快的特点,具有较高的实用价值;并且该方法在保留神经网络高鲁棒性的同时,为快速准确地进行数字识别开辟了新的途径。  相似文献   

4.
针对无指针式仪表表盘的数字识别问题,提出一种基于特征提取和粗糙集特征约简的神经网络数字识别方法.该方法首先利用数字图像预处理技术处理图像并利用特征提取方法提取数字图像特征,然后利用粗糙集理论进行特征约简,最后将约简后的信息输入到训练好的神经网络进行识别.  相似文献   

5.
为了更有效地提取图像的局部特征,提出了一种基于2维偏最小二乘法(two-dimensional partial leastsquare,2DPLS)的图像局部特征提取方法,并将其应用于面部表情识别中。该方法首先利用局部二元模式(localbinary pattern,LBP)算子提取一幅图像中所有子块的纹理特征,并将其组合成局部纹理特征矩阵。由于样本图像被转化为局部纹理特征矩阵,因此可将传统PLS方法推广为2DPLS方法,用来提取其中的判别信息。2DPLS方法通过对类成员关系矩阵的构造进行相应的修改,使其适应样本的矩阵形式,并能体现出人脸局部信息重要性的差异。同时,对于类成员关系协方差矩阵的奇异性问题,也推导出了其广义逆的解析解。基于JAFFE人脸表情库的实验结果表明,该方法不但可以有效地提取图像局部特征,并能取得良好的表情识别效果。  相似文献   

6.
7.
主成分分析与线性判别分析是人脸识别的重要识别方法,它们都通过求解特征值问题实现特征提取,但由于维数灾难会导致小样本和奇异性问题。提出了一种简单的人脸识别方法,无需进行奇异值分解,能有效地降低计算代价。首先将图像划分成块,然后计算多项式系数,得到友阵用于特征提取。基于两张不同图像的多项式系数友阵来计算对称阵。最后通过计算对称阵的零空间的零化度识别相似的人脸图像。为验证提出方法的有效性,在ORL、Yale和FERET人脸数据库上进行了实验。结果表明,该方法对于有较大姿态与光照变化的人脸识别具有较高的识别性能。  相似文献   

8.
目的 现有的车标识别方法尽管取得了不错的识别效果,但最终的识别率容易遇到瓶颈,很难得到提升。车标识别是智能交通系统中至关重要的一部分,识别率的微小提升也能带来巨大的社会价值。通过挖掘与分析车标识别中潜在的问题和难点,发现未能得到正确分类的图像大部分为模糊车标图像。针对车标图像中存在的成像模糊等情况,本文提出一种基于抗模糊特征提取的车标识别方法。方法 构建车标图像金字塔模型,分别提取图像的抗纹理模糊特征和抗边缘模糊特征。抗纹理模糊特征的提取使用局部量化的LPQ(local phase quantization)模式,可以增强原始特征的鲁棒性,抗边缘模糊特征的提取基于局部块弱梯度消除的HOG(histogram of oriented gradient)特征提取方法,可以在描述车标图像边缘梯度信息的同时,提升特征的抗模糊能力。最后利用CCA(canonical correlation analysis)方法进行两种抗模糊特征的融合并用于后续的降维与分类。结果 本文方法在多个数据集上均取得了很好的识别效果,在20幅训练样本下,本文方法在公开车标数据集HFUT-VL(vehicle logo dataset from Hefei University of Technology)上取得了99.04%的识别率,在本文构建的模糊车标数据集BVL(blurring vehicle logo dataset)上也取得了97.19%的识别率。而在难度较大的XMU(Xiamen University vehicle logo dataset)上,本文方法在100幅训练样本下也达到了96.87%的识别率,识别效果高于一些具有较好表现的车标识别方法,表现出很强的鲁棒性和抗模糊性。结论 本文方法提高了对成像质量欠缺的车标图像的识别能力,从而提升了整体识别效果,更符合实际应用中车标识别的需求。  相似文献   

9.
一种有效的人脸识别方法   总被引:6,自引:0,他引:6  
人脸识别是模式识别领域中一个相当困难而又有重要理论价值的研究课题.本文首先引 入表示人脸的特征图像和投影图像的概念,提出利用投影图像在特征图像上投影的坐标作为 描述人像本质属性的特征矢量,并导出了基于投影图像的人脸特征抽取方法.最后构造了一 个层次的距离分类器进行人脸的识别.实验结果表明基于投影图像的特征矢量具有很好的稳 定性、鉴别能力和识别率.  相似文献   

10.
本文提出了一种便于自动生成识别规则的图象基元抽取方法。并将其用于手写字符的识别。结果表明,用本方法得到的图象基元链(句子)对图象的位置、大小、局部形变不敏感,降低了语言的信息冗余度。因而易于由样本图象直接生成识别规则.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号