首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
《微型机与应用》2017,(20):61-64
显著性检测在图像处理领域应用广泛,当前显著性检测主要有自底而上与自顶而下及一些相关或改进算法,它们各有优势和缺陷。提出了一种基于卷积神经网络的显著性检测算法,利用卷积神经网络在图像处理方面强大的功能提取图像特征,进行特征融合,最后得到显著性图,用于显著性检测。将本文方法与传统的显著性检测方法进行对比,发现本文方法效果显著。  相似文献   

2.
海面环境容易受到云雾等气象因素影响,采集到的海面图像对比度减小,噪声干扰较多,导致目标显著性提取时较难准确完整地获取显著性区域。针对以上问题,提出了一种基于改进的Deeplabv3网络的海面显著性目标检测方法。引用空洞卷积和全局注意力模块提取更多的特征信息。将不同空洞率特征矩阵进行并联,融合图像上下文特征信息。对二分类交叉熵损失函数添加约束项来对云雾遮挡的显著性特征进行约束。通过对大型数据集预训练及海面云雾遮挡数据集的训练后,保存其模型。实验结果表明:提出方法获取的受云雾遮挡干扰时显著性区域变化较小且能够较为完整地描述显著性目标。在遮挡程度为30、50、70情况下,该方法的F-measure值相比于其他几种对比算法平均提高了22.12%、15.83%、13.30%。  相似文献   

3.
针对当前基于深度学习的显著性对象检测算法不能准确保存对象边缘的区域,从而导致检测出的显著性对象边缘区域模糊、准确率不高的问题,提出了一种基于多任务深度学习模型的显著性对象检测算法。首先,基于深度卷积神经网络(CNN),训练一个多任务模型分别学习显著性对象的区域和边缘的特征;然后,利用检测到的边缘生成大量候选区域,再结合显著性区域检测的结果对候选区域进行排序和计算权值;最后提取出完整的显著性图。在三个常用标准数据集上的实验结果表明,所提方法获得了更高的准确率,其中F-measure比基于深度学习的算法平均提高了1.9%,而平均绝对误差(MAE)平均降低了12.6%。  相似文献   

4.
针对显著性检测过程中特征选择的个人主观片面性和预测过程中特征权重的难以协调性问题,提出了一种基于全卷积神经网络和多核学习的监督学习算法。首先通过MSRA10K图像数据库训练出的全卷积神经网络(FCNN),预测待处理图像的初步显著性区域图;然后在多尺度上选择置信度高的前景、背景超像素块作为多核SVM分类器的训学习样本集,选择并提取八种典型特征代表对应样本训练SVM,接着通过多核SVM分类器预测各超像素显著值;最后融合初步显著图和多核学习显著图,改善FCNN网络输出图的不足,得到最终的显著性目标。方法在SOD数据库和DUT-OMRON数据库上有更高的AUC值,F-Measure值,综合性能均优于对比方法,验证了方法在显著性检测中准确性的提高,为目标识别、机器视觉等应用提供更可靠的预处理结果。  相似文献   

5.
RGB-D图像显著性检测旨在提取三维图像中的显著目标.为解决当前显著性检测算法难以检测出光线干扰场景内的目标和低对比度的目标等问题,提出了基于跳层卷积神经网络的RGB-D图像显著性检测方法.利用VGG网络分离出RGB图像和深度图像的浅层与深层特征,而后进行特征提取;以跳层结构为基础连接提取到的特征,实现融合深度、颜色、...  相似文献   

6.
目的 显著性检测问题是近年来的研究热点之一,针对许多传统方法都存在着特征学习不足和鲁棒检测效果不好等问题,提出一种新的基于深度卷积神经网络的显著性检测模型.方法 首先,利用超像素的方法聚类相似特征的像素点,仿人脑视皮层细胞提取目标边缘,得到区域和边缘特征.然后,通过深度卷积神经网络学习图像的区域与边缘特征,获取相应的目标检测显著度置信图.最后,将深度卷积神经网络输出的置信度融入到条件随机场,求取能量最小化,实现显著性与非显著性判别,完成显著性检测任务.结果 在两个常用的视觉检测数据库上进行实验,本文算法的检测精度与当前最好的方法相比,在MSAR数据库上检测精度相对提升大约1.5%,在Berkeley数据库上提升效果更加明显,达到了5%.此外,无论是自然场景还是人工建筑场景、大目标与小目标,检测的效果都是最好的.结论 本文融合多特征的深度学习方法与单一浅层人工特征的方法相比更有优势,它避免了手工标定特征所带来的不确定性,具有更好的鲁棒性与普适性,从主观视觉愉悦度和客观检测准确度两方面说明了算法的有效性.  相似文献   

7.
医学图像语义分割是计算机视觉和医疗领域的重要研究方向。基于全卷积神经网络的医学图像分割已经取得了显著进展,并在健康监测、疾病诊断和治疗方面得到广泛应用。文章总结了该领域的主要数据集和评价指标,回顾了现有的研究方法,尤其对于有突出贡献和技术引领的模型进行了详细介绍,并指出了现存的挑战和一系列有前景的研究方向。  相似文献   

8.
基于全卷积神经网络与低秩稀疏分解的显著性检测   总被引:1,自引:0,他引:1  
张芳  王萌  肖志涛  吴骏  耿磊  童军  王雯 《自动化学报》2019,45(11):2148-2158
为了准确检测复杂背景下的显著区域,提出一种全卷积神经网络与低秩稀疏分解相结合的显著性检测方法,将图像分解为代表背景的低秩矩阵和对应显著区域的稀疏噪声,结合利用全卷积神经网络学习得到的高层语义先验知识,检测图像中的显著区域.首先,对原图像进行超像素聚类,并提取每个超像素的颜色、纹理和边缘特征,据此构成特征矩阵;然后,在MSRA数据库中,基于梯度下降法学习得到特征变换矩阵,利用全卷积神经网络学习得到高层语义先验知识;接着,利用特征变换矩阵和高层语义先验知识矩阵对特征矩阵进行变换;最后,利用鲁棒主成分分析算法对变换后的矩阵进行低秩稀疏分解,并根据分解得到的稀疏噪声计算显著图.在公开数据集上进行实验验证,并与当前流行的方法进行对比,实验结果表明,本文方法能够准确地检测感兴趣区域,是一种有效的自然图像目标检测与分割的预处理方法.  相似文献   

9.
针对纹身图像的特点和卷积神经网络(CNN)在全连接层对图像特征抽取能力的不足问题,提出一种三通道的卷积神经网络纹身图像检测算法,并进行了三方面的改进工作。首先,针对纹身图像的特点改进图像预处理方案;其次,设计了一个基于三通道全连接层的卷积神经网络进行特征提取,并对特征建立索引,有效地提高了网络对不同尺度下空间信息的提取能力,实现了对纹身图像的高效检测;最后,通过两个数据集验证了算法的泛化能力。实验结果表明,对NIST数据集所提预处理方案比Alex方案有总正确率提高0.17个百分点,纹身图像正确率提高0.29个百分点。在所提预处理方案下,提出的算法在标准的NIST纹身图像集上具有明显的优势,正确率从NIST公布的最优值96.3%提高到99.1%,提高了2.8个百分点;相对于传统的CNN算法,正确率从98.8%提高到99.1%,提高了0.3个百分点。在Flickr数据集上也有相应的性能提升。  相似文献   

10.
《计算机工程》2017,(6):225-229
现有的显著性检测算法多基于图像底层特征,在内容复杂的图像上应用时容易受到干扰。为此,提出一种加入类别先验信息的显著性检测算法。基于深度神经网络生成的特征图谱,选择对预训练集分类结果有正向贡献的部分加权重组,根据保留的空间信息生成显著性图像,结合颜色对比和图像过分割算法进行显著性目标分割。在网络图像组成的公开测试集上的实验结果表明,与IT,SR等算法相比,该算法的平均正确率、召回率和F值都有明显提高。  相似文献   

11.
针对实际场景中桥梁裂缝检测精度不高的问题,提出一种基于卷积神经网络与条件随机场的裂缝检测算法。使用特征提取网络对原图进行处理,提取适合裂缝检测的特征;通过区域推荐网络对原始图片中存在裂缝的候选区域进行初步定位;将得到的候选区域作为分类与回归网络的输入,利用条件随机场对该区域的空间特性进行建模,综合判定该区域是否属于裂缝。实验结果表明,该算法相较于常用的Faster-RCNN和滑窗扫描法在查准率上分别提高了9.01%和9.31%,在查全率上分别提高了7.72%和10.45%,精度均值分别提高了0.091和0.175。  相似文献   

12.
实体链接是知识图谱领域的重要研究内容,现有的实体链接模型研究大多集中在对手工特征的选择上,不能很好地利用实体间的语义信息来实现更高效的实体链接效果。故提出一个基于深度语义匹配模型和卷积神经网络的实体链接模型,候选实体生成阶段采用构造同名字典,并基于上下文进行字典扩充,通过匹配来选择候选实体集。通过卷积神经网络来捕获深层语义信息,进行特征提取,并将其作为语义匹配模型的输入,通过模型训练学习选择出最佳参数,并输出语义相似度最高的候选实体作为实体链接的结果。在NLP & CC2014_ERL 数据集上较Ranking SVM模型准确率提升了3.9%,达到86.7%。实验结果表明了提出的新模型性能优于当前的主流模型。  相似文献   

13.
对路面图像块预标记,根据预标记结果对路面图像进行强度归一化预处理,在保留裂缝信息的同时,减少背景光照不均的影响.将预处理后的路面图像输入卷积神经网络(CNN)模型实现路面图像裂缝的检测.由于路面裂缝分布复杂,在训练网络时,使用不同尺度和不同角度的路面图像进行模型训练,使得网络能够检测不同裂缝形状.实验结果显示:裂缝检测结果较好.  相似文献   

14.
医学图像对疾病的诊断、治疗和评估均有所帮助,准确分割医学图像中的器官对于辅助医生的诊断具有重要的实际意义.由于医学图像中各器官部位与周围组织的图像对比度低,不同器官的边缘和形状也会存在很大差异,从而增加了分割的难度.针对这些问题,本文提出了一种基于卷积神经网络和Transformer的医学图像语义分割网络,有效提高了医学图像语义分割的精度.特征提取部分使用ResNet-50网络结构,在特征提取后使用Transformer模块来扩大感受野.在上采样过程中加入多个跳跃连接层,充分利用各阶段的特征提取信息,来恢复至与输入图像相近的分辨率.在胃肠道医学图像分割数据集上的实验结果证明本文的方法可以有效分割医学图像中的器官组织,提升分割准确率.  相似文献   

15.
图像质量客观评价广泛应用在图像处理任务中,参考深度学习技术的研究成果,提出了一种基于并行小规模卷积神经网络的无参考图像质量评估算法。卷积操作和并行的多尺度输入能学习到丰富和细微的图像失真特征,首先利用高斯图像金字塔获取不同尺度的失真图像做为4路小规模单层卷积神经网络的输入,经过卷积和池化处理后,输出4路特征矢量,把学习到的特征矢量融合后,通过全连接回归映射为图像质量预测分数。参数优化分2个阶段完成,提高了模型精度。实验测试结果表明,设计的网络模型简单有效,提出的算法性能高于当前主流算法,具有很好的稳定性和较强的泛化能力。   相似文献   

16.
基于卷积神经网络的目标检测研究综述   总被引:1,自引:0,他引:1  
随着训练数据的增加以及机器性能的提高,基于卷积神经网络的目标检测冲破了传统目标检测的瓶颈,成为当前目标检测的主流算法。因此,研究如何有效地利用卷积神经网络进行目标检测具有重要的价值。首先回顾了卷积神经网络如何解决传统目标检测中存在的问题;其次介绍了卷积神经网络的基本结构,叙述了当前卷积神经网络的研究进展以及常用的卷积神经网络;然后重点分析和讨论了两种应用卷积神经网络进行目标检测的思路和方法,指出了目前存在的不足;最后总结了基于卷积神经网络的目标检测,以及未来的发展方向。  相似文献   

17.
Semantic image parsing, which refers to the process of decomposing images into semantic regions and constructing the structure representation of the input, has recently aroused widespread interest in the field of computer vision. The recent application of deep representation learning has driven this field into a new stage of development. In this paper, we summarize three aspects of the progress of research on semantic image parsing, i.e., category-level semantic segmentation, instance-level semantic segmentation, and beyond segmentation. Specifically, we first review the general frameworks for each task and introduce the relevant variants. The advantages and limitations of each method are also discussed. Moreover, we present a comprehensive comparison of different benchmark datasets and evaluation metrics. Finally, we explore the future trends and challenges of semantic image parsing.  相似文献   

18.
图像在日常生活中广泛存在,图像分类具有重要的现实意义。针对当前多标签图像分类中因神经网络模型复杂以及提取到的图像特征信息不足而导致分类准确率较低、计算复杂度高等问题,提出一种融合卷积神经网络与交互特征的多标签分类方法,即MLCNN-IF模型。MLCNN-IF模型主要分成2步,首先参考传统CNN基本结构搭建一个仅有9层的轻量级神经网络(MLCNN),用于处理图像数据并提取特征;其次基于MLCNN提取的特征,通过交互特征方法产生各独立特征的组合特征,以此获得新的更丰富的特征集。实验结果表明,MLCNN-IF模型对比Alex Net、Goog Le Net和VGG16在4种多标签图像数据集上取得了更好的分类结果,其准确率和精准率分别平均提高9%和4.8%;同时MLCNN网络结构相对更简洁,有效降低了模型参数量和时间复杂度。  相似文献   

19.
为了提高行人检测方法的准确率,针对行人图像特征,提出一种基于深度残差网络和YOLO(You Only Look Once)方法的行人检测方法。以加强行人特征表达为目的,通过分析行人在图像中的表达和分布特征,提出一种不影响实时性的矩形输入深度残差网络分类模型以改进YOLO检测方法,使模型能够更好的表征行人;为了进一步提高模型的准确率和泛化能力,采用了混合行人数据集训练的方式,提取VOC数据集的行人数据与INRIA数据集组成混合数据集进行训练,明显降低了漏检率;并且利用聚类分析预测框的方法重新设计了初始预测框,提高行人定位能力并加快收敛。经公开的INRIA数据集的测试实验证明,本方法较主流的行人检测方法每张图片误检率有明显改善,降低至13.86%,有1.51%至58.62%不同程度的提升,并且本方法拥有良好的实时性和泛化能力,实用性强。  相似文献   

20.
针对图像失真分类问题,提出了一种基于Gabor小波和卷积神经网络(convolutional neural network,CNN)的失真类型判定算法。该算法先利用Gabor小波的良好特性对图像进行特征粗提取,再通过改进的CNN进一步提取关键特征。算法步骤包括:首先对图像进行预处理(包括标签设定、样本均衡和样本扩充);然后对预处理后的图像进行八方向的Gabor小波变换,并将不同方向的子带叠加构成输入样本;最后通过自行设计的CNN和Softmax分类器对样本进行训练,训练过程中采用随机梯度下降和反向误差传播的方法对卷积核参数进行优化得到最终模型。对训练好的模型进行失真类型判定实验,在LIVE标准图像库上分类正确率达95.62%,表明本算法具有较高的准确性和鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号