首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 390 毫秒

1.  自适应增强卷积神经网络图像识别  
   刘万军  梁雪剑  曲海成《中国图象图形学报》,2017年第22卷第12期
   目的 为了进一步提高卷积神经网络的收敛性能和识别精度,增强泛化能力,提出一种自适应增强卷积神经网络图像识别算法。方法 构建自适应增强模型,分析卷积神经网络分类识别过程中误差产生的原因和误差反馈模式,针对分类误差进行有目的地训练,实现分类特征基于迭代次数和识别结果的自适应增强以及卷积神经网络权值的优化调整。自适应增强卷积神经网络与多种算法在收敛速度和识别精度等性能上进行对比,并在多种数据集上检测自适应卷积神经网络的泛化能力。结果 通过对比实验可知,自适应增强卷积神经网络算法可以在很大程度上优化收敛效果,提高收敛速度和识别精度,收敛时在手写数字数据集上的误识率可降低20.93%,在手写字母和高光谱图像数据集上的误识率可降低11.82%和15.12%;与不同卷积神经网络优化算法对比,误识率比动态自适应池化算法和双重优化算法最多可降低58.29%和43.50%;基于不同梯度算法的优化,误识率最多可降低33.11%;与不同的图像识别算法对比,识别率也有较大程度提高。结论 实验结果表明,自适应增强卷积神经网络算法可以实现分类特征的自适应增强,对收敛性能和识别精度有较大的提高,对多种数据集有较强的泛化能力。这种自适应增强模型可以进一步推广到其他与卷积神经网络相关的深度学习算法中。    

2.  多通道卷积的图像超分辨率方法  
   李云飞  符冉迪  金炜  纪念《中国图象图形学报》,2017年第22卷第12期
   目的 超分辨率技术在实际生活中具有较为广泛的应用。经典的基于卷积神经网络的超分辨率(SRCNN)方法存在重建图像纹理结构模糊以及网络模型训练收敛过慢等问题。针对这两个问题,在SRCNN的基础上,提出一种多通道卷积的图像超分辨率(MCSR)算法。方法 通过增加残差链接,选择MSRA初始化方法对网络权值进行初始化,加快模型收敛;引入多通道映射提取更加丰富的特征,使用多层3×3等小卷积核代替单层9×9等大卷积核,更加有效地利用特征,增强模型的超分辨率重构效果。结果 MCSR迭代4×106次即可收敛,在Set5与Set14数据集上边长放大3倍后的平均峰值信噪比分别是32.84 dB和29.28 dB,与SRCNN相比提升显著。结论 MCSR收敛速度更快,并且可以生成轮廓清晰的高分辨率图像,超分辨率效果更加优秀。    

3.  从阴影恢复形状的径向基函数反射模型研究  
   杨志明  赵红东《中国图象图形学报》,2017年第22卷第11期
   目的 为解决传统阴影恢复形状(SFS)算法由于光源方向初始信息估计不准确,恢复的物体表面过于光滑,3维表面形状误差较大等问题,建立了基于径向基函数神经网络的反射模型,并对传统的神经网络进行了改进。方法 建立的基于径向基函数(SFS)神经网络的从阴影恢复形状反射模型代替了传统方法中采用的理想朗伯体表面反射模型。该模型利用径向基函数优秀的局部映射和函数逼近能力来处理SFS问题,通过网络训练过程中的权值代替物体所受到的初始光源信息,解决了传统算法在进行计算时,必须已知光源参数的限制。在该网络模型中添加自适应学习率算法,加速网络的收敛和训练速度。结果 针对SFS问题处理的两幅经典合成图像以及两幅实际图像进行了实验,实验结果表明,改进后的算法在3维视觉效果和3维形状信息的恢复方面都明显优于传统算法。归一化后的3维高度误差结果相比传统算法缩小了60%以上,而且同时适用合成图像和实际图像;自适应学习率的加入,使得网络的训练速度大大加快,对一幅128×128像素的图像,运算速度提升了50%。结论 本文针对SFS问题建立了基于RBF神经网络的从阴影恢复形状反射模型,利用网络模型中的参数代替SFS问题中的初始光源信息,通过最优化方法求解SFS问题。并针对传统的神经网络固定学习率造成网络收敛速度慢,容易陷入局部极小值的问题,加入了自适应学习率算法。实验结果表明,改进后的算法在处理该SFS问题时表现了优秀的性能,适用范围更广,收敛速度更快。    

4.  基于Fast R-CNN的车辆目标检测  
   曹诗雨  刘跃虎  李辛昭《中国图象图形学报》,2017年第22卷第5期
   目的 在传统车辆目标检测问题中,需要针对不同图像场景选择适合的特征。为此提出一种基于快速区域卷积神经网络(Fast R-CNN)的场景图像车辆目标发现方法,避免传统车辆目标检测问题中需要设计手工特征的问题。方法 该方法基于深度学习卷积神经网络思想。首先使用待检测车辆图像定义视觉任务。利用选择性搜索算法获得样本图像的候选区域,将候选区域坐标与视觉任务示例图像一起输入网络学习。示例图像经过深度卷积神经网络中的卷积层,池化层计算,最终得到深度卷积特征。在输入时没有规定示例图像的规格,此时得到的卷积特征规格不定。然后,基于Fast R-CNN网络结构,通过感兴趣区域池化层规格化特征,最后将特征输入不同的全连接分支,并行回归计算特征分类,以及检测框坐标值。经过多次迭代训练,最后得到与指定视觉任务强相关的目标检测模型,具有训练好的权重参数。在新的场景图像中,可以通过该目标检测模型检测给定类型的车辆目标。结果 首先确定视觉任务包含公交车,小汽车两类,背景场景是城市道路。利用与视觉任务强相关的测试样本集对目标检测模型进行测试,实验表明,当测试样本场景与视觉任务相关度越高,且样本中车辆目标的形变越小,得到的车辆目标检测模型对车辆目标检测具有良好的检测效果。结论 本文提出的车辆目标检测方法,利用卷积神经网络提取卷积特征代替传统手工特征提取过程,通过Fast R-CNN对由示例图像组成定义的视觉任务训练得到了效果良好的车辆目标检测模型。该模型可以对与视觉任务强相关新场景图像进行效果良好的车辆目标检测。本文结合深度学习卷积神经网络思想,利用卷积特征替代传统手工特征,避免了传统检测问题中特征选择问题。深层卷积特征具有更好的表达能力。基于Fast R-CNN网络,最终通过多次迭代训练得到车辆检测模型。该检测模型对本文规定的视觉任务有良好的检测效果。本文为解决车辆目标检测问题提供了更加泛化和简洁的解决思路。    

5.  串行处理卷积神经网络的海马子区分割  
   时永刚  郝华胤  刘志文《中国图象图形学报》,2018年第23卷第1期
   目的 海马体积很小,对比度极低,传统标记融合方法选用手工设计的特征模型,难以提取出适应性好、判别性强的特征。近年来,深度学习方法取得了极大成功,基于深度网络的方法已应用于医学图像分割中,但海马结构复杂,子区较多且体积差别较大,特别是CA2和CA3子区体积极小,常见的深度网络无法准确分割海马子区。为了解决这些问题,提出一种结合多尺度输入和串行处理神经网络的海马子区分割方法。方法 针对海马中体积差距较大的子区,设计两种不同的网络,结合多种尺度图像块信息,为小子区建立类别数量均衡的训练集,避免网络被极端化训练,最后,采用串行标记的方式对海马子区进行分割。结果 在Tail,SUB和PHG子区上的准确率达到了0.865,0.81,0.773,较现有的多图谱子区分割方法有较大提高,并且将体积较小子区CA2,CA3上的准确率分别提高了6%和9%。结论 该算法将基于卷积神经网络的分类方法引入到标记融合阶段,根据海马子区特殊的灰度及结构特点,设计两种针对性网络,实验证明,该算法能提取出适应性好、判别性强的特征,提高了分割准确率。    

6.  遥感图像飞机目标分类的卷积神经网络方法  
   周敏  史振威  丁火平《中国图象图形学报》,2017年第22卷第5期
   目的 遥感图像飞机目标分类,利用可见光遥感图像对飞机类型进行有效区分,对提供军事作战信息有重要意义。针对该问题,目前存在一些传统机器学习方法,但这些方法需人工提取特征,且难以适应真实遥感图像的复杂背景。近年来,深度卷积神经网络方法兴起,网络能自动学习图像特征且泛化能力强,在计算机视觉各领域应用广泛。但深度卷积神经网络在遥感图像飞机分类问题上应用少见。本文旨在将深度卷积神经网络应用于遥感图像飞机目标分类问题。方法 在缺乏公开数据集的情况下,收集了真实可见光遥感图像中的8种飞机数据,按大致4∶1的比例分为训练集和测试集,并对训练集进行合理扩充。然后针对遥感图像与飞机分类的特殊性,结合深度学习卷积神经网络相关理论,有的放矢地设计了一个5层卷积神经网络。结果 首先,在逐步扩充的训练集上分别训练该卷积神经网络,并分别用同一测试集进行测试,实验表明训练集扩充有利于网络训练,测试准确率从72.4%提升至97.2%。在扩充后训练集上,分别对经典传统机器学习方法、经典卷积神经网络LeNet-5和本文设计的卷积神经网络进行训练,并在同一测试集上测试,实验表明该卷积神经网络的分类准确率高于其他两种方法,最终能在测试集上达到97.2%的准确率,其余两者准确率分别为82.3%、88.7%。结论 在少见使用深度卷积神经网络的遥感图像飞机目标分类问题上,本文设计了一个5层卷积神经网络加以应用。实验结果表明,该网络能适应图像场景,自动学习特征,分类效果良好。    

7.  基于卷积特征的核相关自适应目标跟踪  
   王守义  周海英  杨阳《中国图象图形学报》,2017年第22卷第9期
   目的 针对现实场景中跟踪目标的快速运动、旋转、尺度变化、遮挡等问题,提出了基于卷积特征的核相关自适应目标跟踪的方法。方法 利用卷积神经网络提取高、低层卷积特征并结合本文提出的核相关滤波算法计算并获得高底两层卷积特征响应图。采用Coarse-to-Fine方法对目标位置进行估计,在学习得到1维尺度核相关滤波器估计尺度的基础上实时更新高低两层核相关滤波器参数,以实现自适应的目标跟踪。结果 实验选取公开数据集中的典型视频序列进行跟踪,测试了算法在目标尺度发生变化、遮挡、旋转等复杂场景下的跟踪性能并与多种优秀的跟踪算法在平均中心误差、平均重叠率等指标上进行了定量比较,在Singer1、Car4、Jogging、Girl、Football以及MotorRolling视频图像序列上的中心误差分别为8.71、6.83、3.96、3.91、4.83、9.23,跟踪重叠率分别为0.969、1.00、0.967、0.994、0.967、0.512。实验结果表明,本文算法与原始核相关滤波算法相比,平均中心位置误差降低20%,平均重叠率提高12%。结论 采用卷积神经网络提取高低两层卷积特征,高层卷积特征用于判别目标和背景,低层卷积特征用于预测目标位置并通过Coarse-to-Fine方法对目标位置进行精确的定位,较好地解决了由于目标的旋转和尺度变化带来的跟踪误差大的问题,提高了跟踪性能并能够实时更新学习。在目标尺度发生变化、遮挡、光照条件改变、目标快速运动等复杂场景下仍表现出较强的鲁棒性和适应性。    

8.  卷积神经网络的多字体汉字识别  
   柴伟佳  王连明《中国图象图形学报》,2018年第23卷第3期
   目的 多字体的汉字识别在中文自动处理及智能输入等方面具有广阔的应用前景,是模式识别领域的一个重要课题。近年来,随着深度学习新技术的出现,基于深度卷积神经网络的汉字识别在方法和性能上得到了突破性的进展。然而现有方法存在样本需求量大、训练时间长、调参难度大等问题,针对大类别的汉字识别很难达到最佳效果。方法 针对无遮挡的印刷及手写体汉字图像,提出了一种端对端的深度卷积神经网络模型。不考虑附加层,该网络主要由3个卷积层、2个池化层、1个全连接层和一个Softmax回归层组成。为解决样本量不足的问题,提出了综合运用波纹扭曲、平移、旋转、缩放的数据扩增方法。为了解决深度神经网络参数调整难度大、训练时间长的问题,提出了对样本进行批标准化以及采用多种优化方法相结合精调网络等策略。结果 实验采用该深度模型对国标一级3 755类汉字进行识别,最终识别准确率达到98.336%。同时通过多组对比实验,验证了所提出的各种方法对改善模型最终效果的贡献。其中使用数据扩增、使用混合优化方法和使用批标准化后模型对测试样本的识别率分别提高了8.0%、0.3%和1.4%。结论 与其他文献中利用手工提取特征结合卷积神经网络的方法相比,减少了人工提取特征的工作量;与经典卷积神经网络相比,该网络特征提取能力更强,识别率更高,训练时间更短。    

9.  融合判别式深度特征学习的图像识别算法  
   黄旭  凌志刚  李绣心《中国图象图形学报》,2018年第23卷第4期
   目的 卷积神经网络在图像识别算法中得到了广泛应用。针对传统卷积神经网络学习到的特征缺少更有效的鉴别能力而导致图像识别性能不佳等问题,提出一种融合线性判别式思想的损失函数LDloss(linear discriminant loss)并用于图像识别中的深度特征提取,以提高特征的鉴别能力,进而改善图像识别性能。方法 首先利用卷积神经网络搭建特征提取所需的深度网络,然后在考虑样本分类误差最小化的基础上,对于图像多分类问题,引入LDA(linear discriminant analysis)思想构建新的损失函数参与卷积神经网络的训练,来最小化类内特征距离和最大化类间特征距离,以提高特征的鉴别能力,从而进一步提高图像识别性能,分析表明,本文算法可以获得更有助于样本分类的特征。其中,学习过程中采用均值分批迭代更新的策略实现样本均值平稳更新。结果 该算法在MNIST数据集和CK+数据库上分别取得了99.53%和94.73%的平均识别率,与现有算法相比较有一定的提升。同时,与传统的损失函数Softmax loss和Hinge loss对比,采用LDloss的深度网络在MNIST数据集上分别提升了0.2%和0.3%,在CK+数据库上分别提升了9.21%和24.28%。结论 本文提出一种新的融合判别式深度特征学习算法,该算法能有效地提高深度网络的可鉴别能力,从而提高图像识别精度,并且在测试阶段,与Softmax loss相比也不需要额外的计算量。    

10.  人工神经网络在乳腺癌诊断中的应用  被引次数:2
   金强  高普中《计算机仿真》,2011年第28卷第6期
   研究提高乳腺癌诊断准确率问题,对病灶进行医学影像分析会诊结果可靠.因BP神经网络在乳腺癌诊断中,由于权值和学习率固定,导致收敛速度慢、易陷入局极小,使乳腺癌的诊断的准确率低.为了提高乳腺癌诊断的准确率,提出了-种改进BP神经网络的乳腺癌诊断模型.采用附加动量对BP神经网络权值进行调整,加快了网络的收敛速度,然后对学习率进行自适应调整,减少了迭代次数,最后利用改进的BP神经网络模型对乳腺癌进行诊断.仿真结果表明,改进BP神经网减少迭代次数,加快学习速度,提高乳腺癌诊断准确率,很好的解决传统BP神经算法在乳腺癌诊断中中存在的缺陷,是一种有效的乳腺癌的辅助诊断工具.    

11.  动态背景下自适应LOBSTER算法的前景检测  
   陈树  丁保阔《中国图象图形学报》,2017年第22卷第2期
   目的 前景检测是视频监控领域的研究重点之一。LOBSTER(local binary similarity segmenter)算法把ViBe(visual background extractor)算法和LBSP(local binary similarity patterns)特征结合起来,在一般场景下取的了优良的检测性能,但是LOBSTER算法在动态背景下适应性差、检测噪声多。针对上述问题,提出一种改进的LOBSTER算法。方法 在模型初始化阶段,计算各像素的LBSP特征值,并分别把像素的灰度值和LBSP特征值添加到各像素的颜色背景模型与LBSP背景模型中,增强了背景模型的描述能力;在像素分类阶段,根据背景复杂度自适应调整每个像素在颜色背景模型和LBSP背景模型中的分类阈值,降低了前景中的噪声;在模型更新阶段,根据背景复杂度自适应调整每个像素背景模型的更新策略,提高背景模型对动态背景的适应能力。结果 本文算法与ViBe算法和LOBSTER算法进行了对比实验,本文算法的前景图像比ViBe算法和LOBSTER算法的噪声点大幅较低,本文算法的PCC指标在不同视频库中比ViBe算法提高0.736%7.56%,比LOBSTER算法提高0.77% 12.47%,FPR指标不到ViBe算法和LOBSTER算法的1%。结论 实验仿真结果表明,在动态背景的场景下,本文算法比ViBe算法和LOBSTER算法检测到的噪声少,具有较高的准确率和鲁棒性。    

12.  前列腺磁共振图像分割的反卷积神经网络方法  
   詹曙  梁植程  谢栋栋《中国图象图形学报》,2017年第22卷第4期
   目的 前列腺磁共振图像存在组织边界对比度低、有效区域少等问题,手工勾勒组织轮廓边界的传统分割方法无法满足临床实时性要求,针对这些问题提出了一种基于深度反卷积神经网络的前列腺磁共振图像分割算法。方法 基于深度学习理论,将训练图像样本输入设计好的卷积神经网络,提取具有高度区分性的前列腺图像特征,反卷积策略用于拓展特征图尺寸,使网络的输入尺寸与输出预测图大小匹配。网络生成的概率预测图通过训练一个softmax分类器,对预测图像取二值化,获得最终的分割结果。为克服原始图像中有效组织较少的问题,采用dice相似性系数作为卷积网络的损失函数。结果 本文算法以Dice相似性系数和Hausdorff距离作为评价指标,在MICCAI 2012数据集中,Dice相似性系数大于89.75%,Hausdorff距离小于1.3 mm,达到了传统方法的分割精度,并且将处理时间缩短在1 min以内,明显优于其他方法。结论 定量与定性的实验表明,基于反卷积神经网络的前列腺分割方法可以准确地对磁共振图像进行分割,相比于其他分割算法大幅度减小了处理时间,能够很好地适用于临床的前列腺图像分割任务。    

13.  结合深度学习和支持向量机的海马子区图像分割  
   时永刚  程坤  刘志文《中国图象图形学报》,2018年第23卷第4期
   目的 由于海马子区体积很小且结构复杂,传统的分割方法无法达到理想的分割效果,为此提出一种基于卷积神经网络和支持向量机的海马子区分割方法。方法 该方法构建一种新模型,将卷积神经网络和支持向量机结合起来,使用支持向量机分类器替换卷积神经网络的输出层,通过训练深层网络自动提取图像块特征,利用所提取的图像特征训练支持向量机实现图像的像素级分类。结果 实验选取美国旧金山CIND中心的32位实验者的脑部磁共振图像(MRI)进行海马子区分割测试,在定性和定量方面分别对比了本文方法与支持向量机(SVM)、卷积神经网络(CNN)和基于稀疏表示与字典学习方法的分割结果。所提方法对海马子区CA1、CA2、DG、CA3、Head、Tail、SUB、ERC和PHG的分割准确率分别为0.969、0.733、0.967、0.837、0.981、0.920、0.972、0.968和0.976。本文方法优于现有的基于稀疏表示与字典学习、支持向量机和卷积神经网络的方法,各海马子区分割准确率均有较大提升,对较大子区如Head,准确率较现有最优方法提升10.2%,对较小子区如CA2、CA3,准确率分别有36.2%和52.7%的大幅提升。结论 本文方法有效提升了海马子区的分割准确率,可用于大脑核磁共振图像中海马及其子区的准确分割,为诸多神经退行性疾病的临床诊断与治疗提供依据。    

14.  深度卷积神经网络特征提取用于地表覆盖分类初探  
   张伟  郑柯  唐娉  赵理君《中国图象图形学报》,2017年第22卷第8期
   目的 地表覆盖监测是生态环境变化研究、土地资源管理和可持续发展的重要基础,在全球资源监测、全球变化检测中发挥着重要作用。提高中等分辨率遥感影像地表覆盖分类的精度具有非常重要的意义。方法 近年来,深度卷积神经网络在图像分类、目标检测和图像语义分割等领域取得了一系列突破性的进展,相比于传统的机器学习方法具有更强的特征学习和特征表达能力。基于其优越的特性,本文进行了深度卷积神经网络对中分辨率遥感影像进行特征提取和分类的探索性研究。以GF-1的16 m空间分辨率多光谱影像为实验数据,利用预训练好的AlexNet深度卷积神经网络模型进行特征提取,以SVM为分类器进行分类。分析了AlexNet不同层的特征以及用于提取特征的邻域窗口尺寸对分类结果的影响,并与传统的单纯基于光谱特征和基于光谱+纹理特征的分类结果进行对比分析。结果 结果表明在用AlexNet模型提取特征进行地表覆盖分类时,Fc6全连接层是最有效的特征提取层,最佳的特征提取窗口尺寸为9×9像素,同时利用深度特征得到的总体分类精度要高于其他两种方法。结论 深度卷积神经网络可以提取更精细更准确的地表覆盖特征,得到更高的地表覆盖分类精度,为地表覆盖分类提供了参考价值。    

15.  利用双通道卷积神经网络的图像超分辨率算法  被引次数:2
   徐冉  张俊格  黄凯奇《中国图象图形学报》,2016年第21卷第5期
   目的 图像超分辨率算法在实际应用中有着较为广泛的需求和研究。然而传统基于样本的超分辨率算法均使用简单的图像梯度特征表征低分辨率图像块,这些特征难以有效地区分不同的低分辨率图像块。针对此问题,在传统基于样本超分辨率算法的基础上,提出双通道卷积神经网络学习低分辨率与高分辨率图像块相似度进行图像超分辨率的算法。方法 首先利用深度卷积神经网络学习得到有效的低分辨率与高分辨率图像块之间相似性度量,然后根据输入低分辨率图像块与高分辨率图像块字典基元的相似度重构出对应的高分辨率图像块。结果 本文算法在Set5和Set14数据集上放大3倍情况下分别取得了平均峰值信噪比(PSNR)为32.53 dB与29.17 dB的效果。结论 本文算法从低分辨率与高分辨率图像块相似度学习角度解决图像超分辨率问题,可以更好地保持结果图像中的边缘信息,减弱结果中的振铃现象。本文算法可以很好地适用于自然场景图像的超分辨率增强任务。    

16.  指数弹性动量卷积神经网络及其在行人检测中的应用  
   岳颀  马彩文《哈尔滨工业大学学报》,2017年第49卷第5期
   针对深度卷积神经网络存在规则化参数多、未利用浅层先验知识、参数随机初始化后易导致权值更新梯度弥散及训练早熟等问题,采用PCA非监督学习方式获取导向性初始化参数数值方法,并基于对网络误差的传播分析,提出指数自适应弹性动量参数学习方法. 以复杂场景下行人目标为例进行目标检测试验,实验表明: 与人工特征检测识别方案及传统深度卷积模型相比,该模型可有效提升目标检测精度,检测速度提升20%以上;与其他动量同源更新机制相比,该算法收敛速度更快,收敛曲线更平滑,泛化能力强,可在不同深度模型均可取得较好检测效果,准确率分别平均提高1.6%,1.8%和6.19%.    

17.  深度区域网络方法的细粒度图像分类  
   翁雨辰  田野  路敦民  李琼砚《中国图象图形学报》,2017年第22卷第11期
   目的 在细粒度视觉识别中,难点是对处于相同层级的大类,区分其具有微小差异的子类,为实现准确的分类精度,通常要求具有专业知识,所以细粒度图像分类为计算机视觉的研究提出更高的要求。为了方便普通人在不具备专业知识和专业技能的情况下能够区分物种细粒度类别,进而提出一种基于深度区域网络的卷积神经网络结构。方法 该结构基于深度区域网络,首先,进行深度特征提取任务,使用VGG16层网络和残差101层网络两种结构作为特征提取网络,用于提取深层共享特征,产生特征映射。其次,使用区域建议网络结构,在特征映射上进行卷积,产生目标区域;同时使用兴趣区域(RoI)池化层对特征映射进行最大值池化,实现网络共享。之后将池化后的目标区域输入到区域卷积网络中进行细粒度类别预测和目标边界回归,最终输出网络预测类别及回归边框点坐标。同时还进行了局部遮挡实验,检测局部遮挡部位对于分类正确性的影响,分析局部信息对于鸟类分类的影响情况。结果 该模型针对CUB_200_2011鸟类数据库进行实验,该数据库包含200种细粒度鸟类类别,11 788幅鸟类图片。经过训练及测试,实现VGG16+R-CNN (RPN)和Res101+R-CNN (RPN)两种结构验证正确率分别为90.88%和91.72%,两种结构Top-5验证正确率都超过98%。本文模拟现实环境遮挡情况进行鸟类局部特征遮挡实验,检测分类效果。结论 基于深度区域网络的卷积神经网络模型,提高了细粒度鸟类图像的分类性能,在细粒度鸟类图像的分类上,具有分类精度高、泛化能力好和鲁棒性强的优势,实验发现头部信息对于细粒度鸟类分类识别非常重要。    

18.  食材数据库统计与对比实验性能分析  
   郭礼华  罗材《中国图象图形学报》,2017年第22卷第8期
   目的 计算机智能分析用户的饮食是一项有意义的研究课题。传统的分析方法侧重于分析食物类型,可是中国是个美食之国,食物类型在各个区域间表现出极大的多样性,造成很难实现通用的食物自动分类方法。为此尝试针对食物的原材料,即食材进行自动分析收集并建立了一个真实环境下的食材图像数据库(FOOD-SCUT),此数据库包括目前中国市面上常见的70种食材类别,共8 015幅图片。方法 基于此数据库,本文尝试性地利用不同的传统特征和分类方法,对此食材图像数据库进行自动分类,以此来分析对比各种特征和分类方法的性能。对比性实验中所选用的特征包括:SIFT特征、颜色直方图特征、梯度直方图、SURF特征、LBP特征和Gabor特征等。除颜色直方图外其他特征都会利用词袋模型进行特征编码,而所选用分类方法包括:支持向量机(SVM)、朴素贝叶斯、随机森林、K-最近邻(KNN)算法。另外本文还尝试采用最近流行的深度神经网络方法对数据库进行特征学习和分类。结果 通过实验验证基于各种传统特征分类方法的实验性能,其中各种特征包括单特征和多特征组合两种方式,通过不断调整不同特征组合和分类识别算法及其参数,得到基于传统特征分类方法的最好分类性能。同时通过实验验证深度卷积神经网络模型的实验性能,深度卷积神经网络模型使用直接训练和预训练两种不同训练模式,并调整不同的网络层数和权重初始化方法后获得最好的分类识别性能。本食材数据库基于传统特征分类方法的最好分类准确率为88.98%,而基于深度神经网络分类方法上可以获得最佳的实验性能,即95.7%,这个准确率比基于传统特征分类方法高出6.72%。结论 数据库的统计结果表明此食材图像数据库类内数据具有极大的差异,可以作为分析食材的一个基础数据库。此数据库具有极高的应用价值,可以为后续各种基于食材分析应用提供相关分析数据,并且本文实验分析结果,对于后续用户开发相关的各种相关应用中,提供了模型和参数选择的建议,节省了用户选择模型和调参的实验过程。    

19.  自上而下注意图分割的细粒度图像分类  
   冯语姗  王子磊《中国图象图形学报》,2016年第21卷第9期
   目的 针对细粒度图像分类中的背景干扰问题,提出一种利用自上而下注意图分割的分类模型。方法 首先,利用卷积神经网络对细粒度图像库进行初分类,得到基本网络模型。再对网络模型进行可视化分析,发现仅有部分图像区域对目标类别有贡献,利用学习好的基本网络计算图像像素对相关类别的空间支持度,生成自上而下注意图,检测图像中的关键区域。再用注意图初始化GraphCut算法,分割出关键的目标区域,从而提高图像的判别性。最后,对分割图像提取CNN特征实现细粒度分类。结果 该模型仅使用图像的类别标注信息,在公开的细粒度图像库Cars196和Aircrafts100上进行实验验证,最后得到的平均分类正确率分别为86.74%和84.70%。这一结果表明,在GoogLeNet模型基础上引入注意信息能够进一步提高细粒度图像分类的正确率。结论 基于自上而下注意图的语义分割策略,提高了细粒度图像的分类性能。由于不需要目标窗口和部位的标注信息,所以该模型具有通用性和鲁棒性,适用于显著性目标检测、前景分割和细粒度图像分类应用。    

20.  结合全卷积网络和GrowCut的肾皮质分割算法  
   时永刚  钱梦瑶  刘志文《中国图象图形学报》,2017年第22卷第10期
   目的 肾脏图像分割对于肾脏疾病的诊断有着重要意义,临床上通过测量肾皮质的体积和厚度可判断肾脏是否有肿瘤、慢性动脉硬化性肾病和肾移植急性排斥反应等。现有的肾脏分割算法大多针对一种模态,且只能分割出肾脏整体。本文提出一种基于全卷积网络和GrowCut的肾皮质自动分割算法,用于多模态肾脏图像分割。方法 首先用广义霍夫变换对肾脏进行检测,提取出感兴趣区域,通过数据增强扩充带标签数据;然后用VGG-16预训练模型进行迁移学习,构建适用于肾皮质分割的全卷积网络,设置网络训练参数,使用扩充数据训练网络。最后用全卷积网络分割图像,提取最后一层卷积层的特征图得到种子点标记,结合肾脏图像的先验知识纠正错误种子点,将该标记图作为GrowCut初始种子点可实现肾皮质准确分割。结果 实验数据为30组临床CT和MRI图像,其中一组有标记的CT图像用于训练网络并测试算法分割准确性,该文算法分割准确率IU(region intersection over union)和DSC(Dice similarity coefficient)分别达到91.06%±2.34%和91.79%±2.39%。与全卷积网络FCN-32s相比,本文提出的网络参数减少,准确率更高,可实现肾皮质分割。GrowCut算法考虑像素间的邻域信息,与全卷积网络结合可进一步将分割准确率提高3%。结论 该方法可准确分割多模态肾脏图像,包括正常和变异肾脏的图像,说明该方法优于主流方法,能够为临床诊断提供可靠依据。    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号