期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

缪永伟林融鲍陈张旭东陈佳舟《计算机辅助设计与图形学学报》2019,31(1)

针对传统利用图像特征信息进行图像检索中难以从语义层次上理解图像相似性的问题,基于深度学习框架,提出一种结合类别分类和精确特征匹配的基于手绘轮廓图的移动端图像检索方法.首先在预处理阶段建立具有输入层、隐藏层以及Softmax输出层的神经网络分类模型,并利用训练数据集对模型进行训练,使其不断优化网络结构权值,实现输入图像的分类预测并提取分类图像标签;然后利用VGG16模型与ResNet50模型分别提取各个分类图像集下的精确特征,得到精确特征向量;最后将归一化并经组合后的特征向量与各个分类图像标签建立映射关系,实现移动端图像检索.采用移动端-服务器架构,用户在移动端输入手绘轮廓图后,系统进行自动预处理并与图像服务器实现交互,图像服务器进行分类预测和精确特征匹配得到检索结果,移动端展示最终检索结果.基于Keras深度学习开发框架,结合VGG16模型与ResNet50模型,实验结果表明,该方法能够根据手绘轮廓图高效、便捷地检索得到目标图像. 相似文献

2.

基于自监督增强特征的直推式零样本图像分类

王浩宇张欣然王雪松程玉虎《控制与决策》2024,39(5):1707-1717

图像的视觉特征对实现零样本图像分类有至关重要的作用.尽管目前VGG、GoogLeNet和ResNet等网络提取的深度特征在图像分类领域获得了广泛的应用,但其在零样本图像分类问题上的表现并不理想,仍旧存在较大的提升空间.此外,由于零样本学习场景下训练集与测试集不相交的设定,导致分类网络不可避免地存在领域偏移问题.为此,提出一种基于自监督增强特征的直推式零样本图像分类框架.首先,通过辅助任务构造伪标签,利用自监督学习获得图像的自监督特征并将其与无监督深度特征进行特征融合;然后,将融合特征嵌入语义空间中进行零样本图像分类,并获得未见类的初始预测标签;最后,利用未见类特征和预测标签迭代地优化视觉-语义映射.所提出框架组件可选择,框架组件自监督网络、主干网络和降维网络分别选用CFN、VGG16和PCA构成网络.在CUB、SUN和AwA2数据集上的实验结果表明,所提出网络能够增强特征的判别能力,在零样本图像分类问题上表现良好. 相似文献

3.

基于卷积神经网络的植物图像分类方法研究 总被引：1，自引：0，他引：1

左羽陶倩吴恋王永金《物联网技术》2020,(3):72-75

近年来,卷积神经网络已经成为图像分类领域的应用研究热点,其对图像特征进行自提取、自学习,解决了以往图像分类方法的图像低层特征到高层概念之间存在的语义鸿沟。为了解决植物图像的自动分类问题,该文提出一种基于卷积神经网络(CNN)的植物图像分类方法,以植物图像为研究对象,将经典卷积神经网络VGG16与全卷积网络(FCN)相结合,把VGG16中两个通道数为4096的全连接层改为卷积层,构造一个新的VGG16模型为植物图像分类模型。文中制作了一个由43类每类500张总共21500张植物图像组成的图像数据集,作为植物图像分类模型的训练数据集。实验结果表明,所提方法在植物的图像分类上的准确率达到97.23%。应用文中提出的卷积神经网络对植物图像进行分类可以取得目前最好的植物图像分类效果。相似文献

4.

基于遮挡感知卷积神经网络的面部表情识别模型

王军赵凯程勇《计算机工程》2021,47(10):242-251

针对面部遮挡情况下表情特征难以提取的问题,提出一种双通道遮挡感知神经网络模型。设计区域遮挡判定单元并集成到VGG16网络中形成遮挡感知神经网络,提取面部图像中未遮挡区域及遮挡较少区域的表情特征。运用迁移学习算法对卷积层参数进行预训练,减轻训练数据样本不足带来的过拟合问题。通过优化残差网络提取全脸表情相关特征,在此基础上加权融合遮挡感知神经网络和残差网络的输出以识别表情。在CK+、RAF-DB、SFEW这3个公开数据库上进行对比实验,结果表明,该模型平均准确率分别达到97.33%、86%、61.06%,与OPCNN、ResNet、VGG16等传统卷积神经网络模型相比,有效提高了面部遮挡情况下的表情识别精度。相似文献

5.

基于特征融合和代价敏感学习的图像标注方法

厍向阳车子豪董立红《计算机工程与设计》2021,42(11):3114-3120

针对图像标注数据集中存在的标注对象比例不一致和标签分布不平衡问题,提出基于特征融合和代价敏感学习的图像标注方法.在卷积神经网络中加入特征融合层,改进VGG16原有的网络结构,特征融合层结合注意力机制,对网络中不同卷积层提取的多尺度特征进行选择性融合,提升对不同尺度对象的标注精度;将代价敏感学习融入损失函数对网络模型进行训练,提升网络的泛化性能.实验结果表明,该方法能提升图像标注的准确率,增加对低频标签的召回率. 相似文献

6.

基于多特征融合的深层网络图像语义识别方法

下载免费PDF全文

王哲杨鹏飞杨雅茹姚蓉杨雄李海芳《计算机工程与应用》2019,55(24):141-146

图像是一种用来传达情感的重要工具,人类的情感会因不同的视觉刺激而异。采用了一种基于小数据集的数据扩充方式,并将图像的手工提取的低级特征（颜色特征、纹理特征）和网络自动提取到的高级特征（图像对象类别特征和图像深层情感特征）融合的方法,识别图像的复合情感。最终输出包含图像和对象在内的高级语义描述性短语。在公共数据集IAPS和GAPED上进行了实验,并与传统手工提取方法和VGG16、Fine-tune Alexnet两种已有模型进行了比较,该方法在测试性能上优于其他的识别方法,情感识别准确率能达到66.54%。相似文献

7.

基于注意力机制的CycleGAN服装局部风格迁移研究

陈佳董学良梁金星何儒汉《计算机工程》2021,47(11):305-312

针对复杂背景下服装图像局部区域风格迁移难以控制及迁移后容易产生边界伪影的问题,提出一种基于注意力机制的CycleGAN服装局部风格迁移方法。通过VGG16网络分别提取服装图像的内容特征与风格特征,将其输入基于注意力机制的CycleGAN生成器中,应用注意力机制在复杂背景下的各个服装区域分配概率分布信息,获得注意力分布更多的区域及相关度更高的区域,并采用改进的损失函数校正边界伪影,对该区域进行风格迁移得到所需的风格迁移服装图像。实验结果表明,与CNN、FCN、BeautyGAN图像局部风格迁移方法相比,该方法不仅可以突出服装图像局部风格迁移效果,而且增强了图像细节,有利于提高输出图像的真实性和艺术性。相似文献

8.

基于SR-VGG19的人脸表情识别算法研究

张业杨词慧张杰妹蒋沅《计算机与数字工程》2021,49(9):1889-1894,1898

针对人脸表情识别率低、泛化能力弱的问题,提出一种基于改进卷积神经网络的表情识别算法.对VGG19网络模型进行优化,采用改进的区域候选网络(Improved Regional Proposal Network,IRPN)代替滑动窗口以避免图像特征的重复提取;在输出层之前使用空间金字塔池化(Spatial Pyramid Pooling,SPP)来提高图像特征的表达能力.通过应用Dropout和批归一化(Batch Normalization,BN)策略来解决过拟合问题,并提高网络模型的泛化能力.采用经典的FER2013和CK+人脸表情数据库对该算法与2013年Kaggle比赛前十名的算法和最近几年提出的人脸表情识别算法分别进行对比实验.结果表明,论文提出的算法人脸表情识别率优于上述算法,分别为73.1％(FER2013)和98.99％(CK+),可实现较好的人脸表情识别效果. 相似文献

9.

基于稀疏化双线性卷积神经网络的细粒度图像分类

马力王永雄《模式识别与人工智能》2019,32(4):336-344

针对双线性卷积神经网络(B-CNN)在细粒度图像分类中因参数过多、复杂度过高而导致的过拟合问题,提出稀疏化B-CNN.首先对B-CNN的每个特征通道引入比例因子,在训练中采用正则化方法对其稀疏.然后利用比例因子的大小判别特征通道的重要性.最后将不重要特征通道按一定比例裁剪,消除网络过拟合,提高关键特征的显著性.稀疏化B-CNN属于弱监督学习,可实现端到端训练.在FGVC-aircraft、Stanford dogs、Stanford cars这3个细粒度图像数据集上的实验表明,稀疏化B-CNN的准确率高于B-CNN,也优于或基本接近其它通用的细粒度图像分类算法. 相似文献

10.

基于改进Faster RCNN的变电站红外图像多目标识别

王妤《传感技术学报》2021,34(4):522-530

为解决变电站红外图像中多种高压电气设备识别问题,文中提出一种基于改进Faster RCNN的变电站红外图像多目标识别方法.该方法通过VGG16提取红外图像中的多种电气设备图像特征,通过区域建议网络生成区域建议并通过边框回归调整区域建议,ROI Pooling将不同尺度的区域建议映射到尺寸固定的输出向量后送入Softmax进行分类,并按照区域建议包含关系对识别错误的部位类别进行修正.实验选取27586张红外图像制作成VOC2007格式红外数据集,并对测试集中5517张红外图像的识别结果进行统计,实验结果表明改进Faster RCNN识别准确率达到92.8％,较改进前提高了9.7％,具有较高的工程实用价值. 相似文献