首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 281 毫秒
1.
用单词标注图像会产生歧义或噪声,故采用句子标注商品图像,以准确刻画商品特性.现有商品图像句子标注方法存在特征学习不充分的问题,针对该问题,提出基于核特征模型抽取图像的形状、颜色和梯度3种核特征,并在多核学习模型内融合生成新特征,基于新特征完成商品图像分类,检索视觉相似的训练图像,摘录其标题中的关键文本标注商品图像.最后,从信息检索和机器翻译两个角度分别评价标注性能.实验表明:基于新特征能获取最优的商品图像分类性能,图像分类缩小了图像检索范围,有助于改善检索性能;标注模型的MAP(Mean Average Precision)值和P-R(Precision-Recall)指标均优于基线;所标句子与图像内容语义相关,且连贯性和流畅性更优.  相似文献   

2.
针对传统分类方法的局限性,提出了一种深度学习结合知识挖掘的零样本图像自适应控制图像分类算法.利用对图像属性的深度学习来实现图像深层次特征及属性的学习和预测,基于图像的属性-类别映射使分类器性能有较大差异,通过稀疏表示模型挖掘图像类别和属性之间的关系并设计自适应控制的属性分类器实现对图像的分类操作.结果表明,与DBN和SVM算法相比,在监督模式和零样本模式下,该算法具有较高的属性预测准确度.在零样本情况下对Shoes数据集进行分类时,该算法具有最高的准确分类识别率,比其他算法的分类识别率提高了15%.  相似文献   

3.
Gist特征是根据稀疏网格划分提取图像全局特征,它可以很好地描述单一场景,但是对于同一图像可能包含的多个场景,该特征的区分性能有所下降;而PHOG特征,提取的是图像局部轮廓特征,对Gist特征有一定的补充.本文以此提出基于Gist特征与PHOG特征融合的场景分类技术,首先分别提取图像的Gist特征和PHOG特征,然后将两种特征串接起来形成融合特征,最后使用SVM分类器进行场景训练和分类.在OT数据集上,考察了单一特征的分类精度和融合特征的分类精度,以及训练样本数对分类性能的影响,通过实验对比发现特征融合能够有效地提高场景分类的正确率.  相似文献   

4.
垃圾网页检测存在数据不平衡、特征空间维度较高的问题,为此,提出一种基于随机混合采样和遗传算法的集成分类算法.首先,使用随机混合采样技术,通过随机抽样,减少多数类样本数量,用少数类样本合成过采样技术方法生成少数类样本,获得多个平衡的训练数据子集;然后使用改进的遗传算法对训练数据集进行降维,得到多个具有最优特征的训练数据子集;使用极端梯度算法(XGBoost)作为分类器,训练多个平衡数据子集,用简单投票法对多个分类器进行集成,得到新的分类器;最后对测试集进行预测,得到最终预测结果.实验结果表明,提出算法的分类结果与XGBoost的结果相比,准确率提高了约19.25%,且减少了建立学习模型的时间,提高了分类性能,是一种较好的分类算法.  相似文献   

5.
基于空间金字塔的BoW模型图像分类方法   总被引:1,自引:0,他引:1  
针对不同场景图像下词袋(bag of words,BoW)模型的图像分类准确率较低的问题,提出了一种基于空间金字塔BoW模型的图像分类方法。该方法通过尺度不变特征变换(scale-invariant feature transform,SIFT)算法提取原始图像像素特征点作为视觉特征,对相似视觉特征进行聚类形成视觉词袋,并采用空间金字塔方法对视觉词袋进行划分,构建空间金字塔的BoW模型,通过支持向量机分类器对分层后的视觉词袋进行图像分类。分别使用BoW模型和空间金字塔的BoW模型分类方法对网络图像数据库进行分类实验对比,结果表明,空间金字塔BoW模型能有效提高BoW模型的图像分类准确率。  相似文献   

6.
通过研究图像分类过程中特征选择和分类器构建问题,提出了一种基于最优特征加权的图像分类算法.首先提取图像的颜色和纹理特征,接着采用混沌粒子群优化算法对特征的权值进行求解,确定每一个特征对图像分类的贡献,最后采用相关向量机对加权的图像样本集进行学习,构建分类器,从而实现图像的分类.实验结果表明,相对于当前较流行的图像分类模型,该模型不仅能够提高图像的分类准确率,而且能够大幅度减少了图像的分类时间,具有一定的实际应用价值.  相似文献   

7.
针对矢量量化编码的量化误差严重,而稀疏编码只是一种浅层学习模型,容易导致视觉词典对图像特征缺乏选择性的问题,提出了一种基于深度学习特征编码模型的图像分类方法。首先,采用深度学习网络无监督的受限玻尔兹曼机(RBM)代替传统的K-Means聚类及稀疏编码等方法对SIFT特征库进行编码学习,生成视觉词典;其次,对RBM编码添加正则化项分解组合每个特征的稀疏表示,使得生成的视觉单词兼具稀疏性和选择性;然后,利用训练数据的类别标签信息有监督地自上而下对得到的初始视觉词典进行微调,得到图像深度学习表示向量,以此训练SVM分类器并完成图像分类。实验结果表明,本文方法能有效克服传统矢量量化编码及稀疏编码等方法的缺点,有效地提升图像分类性能。  相似文献   

8.
针对如何有效地利用图像视觉信息与标注信息进行图像聚类的问题,提出了一种基于视觉单词与标注单词共生的聚类算法.在视觉特征空间,采用K-means算法对图像聚类,得到表征图像视觉信息的视觉单词,即聚类中心.在图像标注字空间,计算各聚类中心下标注单词的统计分布,建立视觉单词与标注单词共生矩阵,进而针对图像提取嵌入有视觉信息的标注词特征LDA(latent dirichlet allocation)主题模型作为最终聚类算法完成图像的聚类.通过对Pascal VOC 2007标注图像数据库进行的实验仿真以及对比试验结果表明,基于视觉单词与标注单词共生的聚类算法可以有效地利用图像的视觉信息与标注信息的互补特性,提高聚类算法的性能.  相似文献   

9.
针对目标类语义属性描述的局限性,提出一种基于自适应加权融合特征的零样本图像分类算法。首先,随机初始化融合权重,利用神经网络融合文本的语义词向量特征和语义属性;然后,利用粒子群算法优化特征融合的权重;最后,把加权融合的特征作为零样本图像分类的迁移知识。实验结果表明,基于自适应加权融合的零样本图像分类算法在动物属性数据集(AWA)上测试的准确率达到88.9%,验证了该方法的有效性。同时与融合特征算法相比,亦提高了零样本图像分类模型的稳定性。  相似文献   

10.
为进一步提高高校资助工作的精准度,构建基于组合核函数的支持向量机(SVM)高校经济困难生分类模型。根据在校生的消费数据、人员信息及历史资助信息抽取样本特征,利用径向基(RBF)核函数的局部拟合能力及多项式核函数的泛化能力,构建基于RBF核函数及多项式核函数的组合核函数SVM分类模型;采用多重网格搜索法训练模型获取最优核参数和组合核函数的权系数,并对高校经济困难生进行分类预测。实验结果表明:采用构建的模型可对高校经济困难生进行分类预测,与单核核函数SVM、逻辑回归模型、最近邻算法(KNN)相比,其分类准确率显著提升;使用融合特征可增加不同类别样本数据的差异性,有助于提高分类准确率。  相似文献   

11.
为解决在计算机辅助诊断(computer aided diagnosis, CAD)中采用人工提取医学影像特征的弊端,在ImageNet数据集上预训练深度神经网络模型Alexnet,通过迁移学习再训练后的Alexnet模型对医学影像进行特征提取,利用集成学习方法训练分类器进行分类。试验结果表明,基于Alexnet和随机森林方法的分类器正确率达到了0.87±0.03,集成分类器的分类性能优于单一分类器。  相似文献   

12.
基于LBP和极限学习机的脑部MR图像分类   总被引:1,自引:1,他引:0  
为解决磁共振(magnetic resonance, MR)脑部图像来源不一以及病变位置和形态不固定造成MR脑部图像分类精度不高的问题,提出基于局部二值模式(local binary pattern, LBP)的纹理特征提取,并用极限学习机(extreme learning machine, ELM)对MR图像分类。计算图像感兴趣区域(region of interest, ROI)的掩码,将图像分成扇形的子区域,统计掩码坐标下各块子区域的LBP直方图,连接所有LBP直方图作为特征向量通过ELM进行分类。相比以前的方法,该方法能够计算颅脑内局部纹理特征,能分类来源不一以及多种病变的图像。对脑部MR图像分类进行试验,对所有样本分类正确率超过92%,正类样本正确率超过93%,负类样本正确率超过91%。试验结果表明,该方法能够对较为复杂的MR图像进行正确分类。  相似文献   

13.
针对机械图样几何特征种类多、线条线型易混淆、人工制图风格多样导致校对效率低、误检、漏检等问题,提出基于迁移学习的机械制图智能评阅方法. 对机械图样进行预处理,采用改进的阀值迭代算法去除背景、噪点和干扰,完成图样图像的分割,提取机械图样的特征投影图像. 通过训练源领域图片的特征提取器,将特征提取器的网络权值迁移到机械图样评阅模型中,完成相似领域的知识迁移. 训练逻辑回归分类器,建立基于神经网络权重参数自适应的智能评阅模型,对几何特征、投影特征、图线、剖面符号等机械图样的制图标准要素进行识别. 实验结果表明,所提出的机械制图智能评阅方法具有较高的错误识别率和鲁棒性能,单个测试样本平均评阅时间为0.95 s,机械图样的平均评阅正确率为98.82%;与人工评阅相比,所提方法能够在提高评阅效率的同时具有较高准确率.  相似文献   

14.
在跨媒体检索中,准确利用异构媒体间的语义相关性是制约检索性能优劣的关键因素之一。提出改进的核典型相关分析(modified kernel canonical correlation analysis, MKCCA)模型,以改善跨媒体检索性能:抽取图像的尺度不变特征变换(scale invariant feature transform, SIFT)与描述灰度纹理的空间包络特征(GIST),抽取文本的词频(term frequency, TF)特征;精选映射核,把图像、文本特征映射到高维可分空间中,生成核矩阵;基于典型相关分析(canonical correlation analysis, CCA)方法挖掘图像、文本核矩阵间的非线性语义相关性;设置语义相关度阈值,降低语义噪声干扰并优选核心典型相关分量,更准确、鲁棒地刻画图像与文本间的语义关联。试验表明:SIFT-TF特征组合整体表现最好,而MKCCA模型与高斯核(gauss kernel)配合可获取最优跨媒体检索性能,其图像检索文本与文本检索图像的平均精度均值(mean average precision, MAP)较次优指标分别提升3.06%和1.18%。  相似文献   

15.
涡轮叶片是燃气轮机中工作环境最恶劣的部件,叶片状态的实时监测与诊断至关重要。针对XGBoost(eXtreme gradient boosting)易受其超参数的影响,提出了一种改进萤火虫算法(IFA)优化XGBoost的故障诊断方法。将种群多样性的位置更新策略和动态步长更新措施引入萤火虫算法(FA)中,解决其收敛速度慢、易陷入局部最优等问题,使其能够更好地确定模型参数。实验结果表明,与未优化的XGBoost模型和FA-XGBoost模型相比,建立的IFA-XGBoost模型具有很好的识别效果,准确率达到96.87%,能更好地应用于叶片故障诊断。  相似文献   

16.
Liang  Ye  Lu  Shuai  Weng  Rui  Han  ChengZhe  Liu  Ming 《中国科学:技术科学(英文版)》2020,63(8):1406-1415
The rich data provided by satellites and unmanned aerial vehicles bring opportunities to directly model aerial image features by extracting their spatial and structural patterns. Although convolutional autoencoders(CAEs) have been attained a remarkable performance in ideal aerial image feature extraction, they are still challenging to extract information from noisy images which are generated from capture and transmission. In this paper, a novel CAE-based noise-robust unsupervised learning method is proposed for extracting high-level features accurately from aerial images and mitigating the effect of noise. Different from conventional CAEs, the proposed method introduces the noise-robust module between the encoder and the decoder. Besides,several pooling layers in CAEs are replaced by convolutional layers with stride=2. The performance of feature extraction is evaluated by the prediction accuracy and the accuracy loss in image classification experiments. A 5-classes aerial optical scene and a 9-classes hyperspectral image(HSI) data set are utilized for optical image and HSI feature extraction, respectively. Highlevel features extracted from aerial images are utilized for image classification by a linear support vector machine(SVM)classifier. Experimental results indicate that the proposed method improves the classification accuracy for noisy images(Gaussian noise 2D σ=0.1, 3D σ=60) in both optical images(2D 87.5%) and HSIs(3D 85.6%) compared with the traditional CAE(2D 78.6%, 3D 84.2%). The accuracy loss in classification experiments increases with the increment of noise. Compared with the traditional CAE(2D 15.7%, 3D 11.8%), the proposed method shows the lower classification accuracy loss in experiments(2D 0.3%, 3D 6.3%). The proposed unsupervised noise-robust feature extraction method attains desirable classification accuracy in ideal input and enhances the feature extraction capability from noisy input.  相似文献   

17.
为了快速、准确地标注大型图像数据集中的图片,提出了一种利用图像分割和基于kNN(k-nearest neighbor)图的半监督学习来标注图像的算法.该算法先将图像分割为若干个局部区域,使用局部敏感的哈希表来构建图像局部区域的kNN图,并基于图像局部区域的kNN图来构建原始图像的kNN图,利用基于图的半监督标签传递算法来标注未标注的图像.在具有269 648张图像的大型图像数据集NUS-WIDE和具有5 000张图像的Corel数据集上的实验结果表明,该算法能获得较快的标注速度和标注精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号