共查询到18条相似文献,搜索用时 171 毫秒
1.
针对目前人工抠图工作量大,而自动抠图无法区分多个实例的问题,提出了一种注意力机制和特征融合的自动抠图算法.该算法由预分割模块和Alpha抠图模块2部分组成,分别采用了不同的网络结构.其中预分割模块是使用迁移学习方法对Mask Scoring R-CNN进行微调实现了对多实例自然图像的实例分割,从而得到输入图像前景个体的二值化分割图.而Alpha抠图模块在此基础上首先对二值化分割图预处理生成三分图,然后将三分图与原输入图像一起输入Alpha抠图模块网络.通过为Alpha抠图模块设计不同的解码策略和注意力机制,实现了对图像细节信息的精确恢复.在后续对自制车辆数据集的无人工交互前景车辆Alpha估计对比实验中,相比现有DIM算法,该算法的SAD降低19.2%, MSE降低26.3%,达到了更高的抠图精度. 相似文献
2.
王宸昊张慧 《计算机辅助设计与图形学学报》2022,(9):1432-1440
针对抠图算法中的“溢色”现象,提出一种同时预测前景、背景和透明度图的算法,并设计了一个结合粗糙语义的自动抠图网络.该算法包括2个阶段:粗糙语义生成阶段和同时预测前背景的抠图阶段.在粗糙语义生成阶段,利用语义分割网络得到中间结果,再通过一个粗糙语义信息融合模块,在多个尺度上对语义信息进行粗略估计;在抠图阶段,利用一个编码器-解码器结构的神经网络对粗糙的语义信息进行编解码,最终得到前景、背景和透明度图的预测.上述2阶段网络可以更加准确地提取出前景物体,得到的透明度图可直接应用于影视特效、图像处理等下游任务.在Adobe数据集和Distinction-646数据集上的实验结果表明,所提算法的绝对误差和分别为42.5和50.3,梯度误差分别为27.1和28.0;抠图的细节也更为准确. 相似文献
3.
4.
针对自然图像抠图方法中存在对先验知识过度依赖和交互输入繁琐的问题,为了扩展自然图像抠图方法的使用范围,提升自然图像抠图方法的自动化程度,提出一种融合多线索信息的数字图像抠图方法。利用原始自然图像所对应的深度信息和视觉显著度信息进行感兴趣区域粗分割;利用形态学的膨胀与腐蚀算法对感兴趣区域的分割结果进行粗分割区域膨胀和粗分割区域腐蚀操作,从而得到抠图过程所需的三分元素图;利用彩色纹理图像和三分元素图,并结合使用相似性传递抠图方法获得精细的前景目标抠图结果。实验结果表明,该方法不仅能够得到较为理想的抠图效果,而且大大提升了自然图像抠图方法的自动化程度。 相似文献
5.
通过对图像分割与图像抠图的比较和分析,从图划分的角度考虑抠图问题,提出一种具有纠偏性的图像抠图的全局优化方法.该方法在最小化前景对象与背景相互分离的软分割开销的同时,最大化前景对象的内部关联度.理论分析和实验结果表明,与其他形式的抠图优化目标函数相比,文中方法能够更有效地提取出全局最优的抠图结果,有利于实现自动或半自动的抠图处理. 相似文献
6.
针对抠图任务中人物抠图完整度低、边缘不够精细化等繁琐问题,提出了一种基于深度学习
的人物肖像全自动抠图算法。算法采用三分支网络进行学习,语义分割分支(SSB)学习 图的语义信息,细节
分支(DB)学习 图的细节信息,混合分支(COM)将 2 个分支的学习结果汇总。首先算法的编码网络采用轻量
级卷积神经网络(CNN) MobileNetV2,以加速算法的特征提取过程;其次在 SSB 中加入注意力机制对图像特
征通道重要性进行加权,在 DB 加入空洞空间金字塔池化(ASPP)模块,对图像的不同感受野所提取的特征进
行多尺度融合;然后解码网络的 2 个分支通过跳级连接融合不同阶段编码网络提取到的特征进行解码;最后
将 2 个分支学习的特征融合在一起得到图像的 图。实验结果表明,该算法在公开的数据集上抠图效果优于
所对比的基于深度学习的半自动和全自动抠图算法,在实时流视频抠图的效果优于 Modnet。 相似文献
7.
针对堆叠密集的堆垛货箱出现的漏检情况以及难以分割出每个货箱的精确边缘而造成的难以准确抓取的问题,对深度学习实例分割算法YOLACT进行了相应的改进;使用工业相机采集货箱的堆垛图像,利用Labelme标注图像制作数据集,并且通过数据增强方法扩充数据集;为了提高模型的分割准确率,分别对掩码真值和YOLACT中的原型掩码输出分支(Protonet)的预测掩码使用Canny边缘检测算子,并取二者的二值交叉熵损失作为损失函数加入到原网络中训练;使用训练好的最优模型对测试集图像数据进行试验;结果表明,改进后的模型预测掩码mAP0.5:0.95可以达到0.543,比原模型提高2.2%,同时货箱边缘的分割精度也得到了一定的提升,模型推理速度可达10.2帧/秒,可以满足精度要求和生产节拍要求。 相似文献
8.
自然图像抠图效果取决于待分离图像的α掩图的精度.基于改进的人工免疫调节网络的自然抠图算法是为未知区域中的象素点定义一个即反映颜色适应度也反映空间信息的权值函数,利用人工免疫网络在前景和背景的全局范围内搜索,以得到该像素点对应的最佳的样本对(F,B),从而得到α掩图.通过实验与其他算法比较,该算法对用户输入的依赖较少,对复杂背景图像的抠图精度高,稳定性好,且对于细长头发丝区域及毛发类的边界区域的划分特别有效. 相似文献
9.
10.
提出了一种基于图论的自然图像抠图方法。该算法首先在图像上建立图的模型,并用不同颜色标记目标种子点和背景种子点;接着采用有重启概率的随机游走方法计算像素点之间的相似性,进而提出一个线性概率模型;最后求解模型并分别估计前景和背景物体。与目前的抠图方法相比,该算法具有以下特点:将RWR方法结合图论用于自然图像抠图中;减小了RWR算法在图像分割中迭代求逆的高复杂度,大大提高了抠图速度;解决了“弱”边界的问题。 相似文献
11.
针对无监督抠图因视觉信息较少而存在抠图结果视觉偏差较大的问题,提出一种基于视觉统计概率的无监督抠图模型。该方法根据视觉统计概率模型训练SVM分类器,得到区分背景区域与视觉显著度较高的前景目标区域的SIFT特征点,根据特征点生成结构合理的Trimap,并利用Trimap实现无监督抠图。实验结果表明,在无用户交互的情况下,该模型生成的[α]掩像无较大视觉偏差,对前景目标边缘及透明度做出良好估计并且具有较好的鲁棒性。 相似文献
12.
自然抠图从背景复杂的彩色图像中根据已知像素进行未知像素的透明度估计以实现前景的准确提取,是图像处理和影视制作的关键技术之一。由于自然图像透明度值的求解具有高度不确定性,目前对颜色和结构复杂的图像抠图效果并不理想。提出一种改进的鲁棒抠图算法。该方法根据trimap的已知前景和背景区域减少未知像素个数;计算前景-背景对的可靠性,选择可信赖的样本对获得透明度的初始值和信心值;优化基于图拉普拉斯的二次目标函数并确定未知像素最终透明度值。自然抠图实验结果表明,与几种主要抠图算法相比,所提方法能提取到具有更好视觉效果和均方误差的前景。 相似文献
13.
Infrared pedestrian classification plays an important role in advanced driver assistance systems. However, it encounters great difficulties when the pedestrian images are superimposed on a cluttered background. Many researchers design very deep neural networks to classify pedestrian from cluttered background. However, a very deep neural network associated with a high computational cost. The suppression of cluttered background can boost the performance of deep neural networks without increasing their depth, while it has received little attention in the past. This study presents an automatic image matting approach for infrared pedestrians that suppresses the cluttered background and provides consistent input to deep learning. The domain expertise in pedestrian classification is applied to automatically and softly extract foreground objects from images with cluttered backgrounds. This study generates trimaps, which must be generated manually in conventional approaches, according to the estimated positions of pedestrian’s head and upper body without the need for any user interaction. We implement image matting by adopting the global matting approach and taking the generated trimap as an input. The representation of pedestrian is discovered by a deep learning approach from the resulting alpha mattes in which cluttered background is suppressed, and foreground is enhanced. The experimental results show that the proposed approach improves the infrared pedestrian classification performance of the state-of-the-art deep learning approaches at a negligible computational cost. 相似文献
14.
15.
16.
17.
Gui-Lin Yao 《计算机科学技术学报》2017,32(1):122-138
Pre-processing is an important step in digital image matting, which aims to classify more accurate foreground and background pixels from the unknown region of the input three-region mask (Trimap). This step has no relation with the well-known matting equation and only compares color differences between the current unknown pixel and those known pixels. These newly classified pure pixels are then fed to the matting process as samples to improve the quality of the final matte. However, in the research field of image matting, the importance of pre-processing step is still blurry. Moreover, there are no corresponding review articles for this step, and the quantitative comparison of Trimap and alpha mattes after this step still remains unsolved. In this paper, the necessity and the importance of pre-processing step in image matting are firstly discussed in details. Next, current pre-processing methods are introduced by using the following two categories: static thresholding methods and dynamic thresholding methods. Analyses and experimental results show that static thresholding methods, especially the most popular iterative method, can make accurate pixel classifications in those general Trimaps with relatively fewer unknown pixels. However, in a much larger Trimap, there methods are limited by the conservative color and spatial thresholds. In contrast, dynamic thresholding methods can make much aggressive classifications on much difficult cases, but still strongly suffer from noises and false classifications. In addition, the sharp boundary detector is further discussed as a prior of pure pixels. Finally, summaries and a more effective approach are presented for pre-processing compared with the existing methods. 相似文献
18.
为了提高跟踪精度,提出一种基于局部抠像的融合图像全自动精确跟踪算法。首先采用帧间差分法获取运动目标的大致区域,并自动生成局部抠像框,由此采集目标、背景代表颜色集合;在此基础上自动生成抠像所需的草图,实现对目标的抠像;最后对抠像产生的前景映射图进行边缘检测即可获取精确的目标轮廓,并可根据跟踪结果对模型进行更新。对于实验的图像序列,与目标实际中心相比较,抠像跟踪误差均值为0.9像素,传统均值漂移跟踪误差均值为5.2像素。实验结果表明,该方法跟踪结果能完整、清晰地表示目标轮廓,很好地解决了跟踪中的漂移问题,提升了跟踪精度 相似文献