排序方式: 共有45条查询结果,搜索用时 0 毫秒
1.
在多数现有图像标注图像库中,关键字只标注在图像级而非区域级,使有监督学习方法在图像标注中难以应用.基于量子粒子群优化算法(quantum-behaved particle swarm optimization,QPSO)提出了一种新的多示例学习(multi-instance learning,MIL)算法--QPSO-MIL算法,在多示例学习的框架下将基于区域的图像标注问题描述成一个有监督的学习问题.该方法将图像当作包,分割的区域当作包中的示例,利用多样性密度(DD)函数,定义了粒子的适应度向量.在示例空间,利用QPSO方法在各个维度上同时搜索DD函数的全局极大值点,作为关键字的概念点,然后根据Bayesian后验概率最大准则(MAP)对图像进行标注.通过ECCV 2002图像库的实验结果表明,QPSO-MIL算法是有效的. 相似文献
2.
提出了一种基于深度融合的深度图像修 复算法。对于单幅深度图像,首先利用形态学操作进行空洞区域优化,消除深度图像中的间 隙和随机噪声;然后针对迭 代滤波过程,提出一种新的深度融合策略计算深度值,并通过对空洞区域的分析,判断深度 图像中空洞区 域类型,自适应选择结构元进行迭代操作;最后利用局部深度值重建方法对受损的边缘处深 度值进行修复。 实验结果表明,本文算法在较好的修复深度图像中存在空洞和间隙的同时,能够保持原始深 度图深度值分 布规律,克服修复过程中存在的深度值失真,边缘模糊等不足。基于标准数据集Middlebury 的对比试验结果表明,本文算法与其它算法相比,获得了良好的效果。 相似文献
3.
针对红外人脸识别问题,提出一种新的基于尺度不变特征转换(SIFT)与多示例学习(MIL)相结合的算法。该算法将图像当作多示例包,SIFT描述子当作包中的示例,利用聚类的方法对训练集中的所有SIFT描述子进行聚类,建立"视觉词汇表",再根据"视觉字"在多示例训练包中出现的频率,建立"词-文档"矩阵,采用潜在语义分析(LSA)的方法获得多示例包(图像)的潜在语义特征,将MIL问题转化成标准的有监督学习问题,即在潜在语义空间用支持向量机(SVM)求解MIL问题。基于OTCBVS标准数据集的对比实验结果表明,所提算法是可行的,且识别率明显高于其他方法。 相似文献
4.
Pedestrian attribute recognition is often considered as a multi-label image classification task. In order to make full use of attribute-related location information, a saliency guided sel-attention network ( SGSA-Net) was proposed to weakly supervise attribute localization, without annotations of attribute-related regions. Saliency priors were integrated into the spatial attention module ( SAM ). Meanwhile,channel-wise attention and spatial attention were introduced into the network. Moreover, a weighted binary cross-entropy loss ( WCEL) function was employed to handle the imbalance of training data. Extensive experiments on richly annotated pedestrian ( RAP) and pedestrian attribute ( PETA) datasets demonstrated that SGSA-Net outperformed other state-of-the-art methods. 相似文献
5.
在基于视觉的目标跟踪过程中,当目标被遮挡时,跟踪算法精度往往下降。针对该问题,在SAMF跟踪算法基础上,提出一种基于图像分块重检测的改进算法。通过寻找最佳目标位置的方法优化SAMF算法,提高目标跟踪的准确率。利用图像分块及样本逐一测试的方法设计重检测模块,当目标因遮挡而无法稳定跟踪时,启动重检测模块,根据重检测后的最大响应值找出目标中心点,并引入模型自动更新策略对目标位置进行更新,避免出现跟踪漂移的现象。采用9个目标跟踪标准测试集进行对比实验,结果表明,该算法较SAMF算法平均距离精度提高了38%,且优于KCF、CN、CSK等其他目标跟踪算法。 相似文献
6.
轮胎花纹图像检索在交通事故处理及刑事案件侦破中是获取破案信息的重要手段,虽然基于内容的图像检索技术已发展数十年,但由于轮胎花纹图像数据的来源及应用场景特殊等因素,目前这方面的研究文献并不多。在研究近年来轮胎花纹图像检索领域相关文献的基础上,对该领域的技术现状进行总结分析。首先,围绕轮胎花纹纹理特征提取和高层语义特征提取两项关键技术描述了该领域的主要研究成果,并总结了轮胎花纹数据库以及检索性能评价指标。然后,分别针对轮胎花纹低层特征和高层特征提取进行实验对比并分析结果。最后,结合现有技术及实际应用需求,分析了该领域的技术发展趋势并指出了未来的研究方向。 相似文献
7.
由于卷积操作的局限性,现有的皮肤病变图像分割网络无法对图像中的全局上下文信息建模,导致其无法有效捕获图像的目标结构信息,本文设计了一个融入交叉自注意力编码的U型混合网络,用于皮肤病变图像分割。首先,将设计的多头门控位置交叉自注意力编码器引入到U型网络的最后两个层级中,使其能够在图像中学习语义信息的长期依赖关系,弥补卷积操作全局建模能力的不足;其次,在跳跃连接部分引入一个新的位置通道注意力机制,用于编码融合特征的通道信息并保留位置信息,提高网络捕获目标结构的能力;最后,设计一个正则化Dice损失函数,使网络能够在假阳性和假阴性之间权衡,提高网络的分割结果。基于ISBI2017和ISIC2018数据集的对比实验结果表明,本文网络的Dice分别为91.48%和91.30%,IoU分别为84.42%和84.12%,分割精度在整体上优于其他网络,且具有较低的参数量和计算复杂度,即本文网络能够高效地分割皮肤病变图像的目标区域,可为皮肤疾病辅助诊断提供帮助。 相似文献
8.
根据人类视觉系统的特点,提出一种融合谱残差和多分辨率分析的显著目标检测方法。该方法通过在不同尺度上计算图像的亮度、颜色以及方向特征的谱残差,构建多分辨率显著性图谱序列,然后用线性插值方法将不同分辨率的特征显著图叠加得到3个特征显著图,再利用k均值聚类算法将每个特征显著图聚为两类,选择聚类中心距离最大的特征显著图作为最终的显著图,最后经过动态阈值处理获得图像的显著目标区域。基于自然图像的显著目标检测实验结果表明,该方法具有较强的稳定性和实用性,得到较为满意的检测结果。 相似文献
9.
集成模糊LSA与MIL的图像分类算法 总被引:1,自引:0,他引:1
针对自然图像的分类问题,提出一种基于模糊潜在语义分析(LSA)与直推式支持向量机(TSVM)相结合的半监督多示例学习(MIL)算法.该算法将图像当作多示例包,分割区域的底层视觉特征当作包中的示例.为了将MIL问题转化成单示例问题进行求解,首先利用K-Means方法对训练包中所有的示例进行聚类,建立"视觉词汇表";然后根据"视觉字"与示例之间的距离定义模糊隶属度函数,建立模糊"词-文档"矩阵,再采用LSA方法获得多示例包(图像)的模糊潜在语义模型,并通过该模型将每个多示例包转化成单个样本;采用半监督的TSVM训练分类器,以利用未标注图像来提高分类精度.基于Corel图像库的对比实验结果表明,与传统的LSA方法相比,模糊LSA的分类准确率提高了5.6%,且性能优于其他分类方法. 相似文献
10.
为了解决实际高光谱解混(HU)中噪声对解混精度的影响和光谱、空间信息利用不足的问题,提出了一种改进的基于光谱距离聚类的群稀疏非负矩阵分解的解混算法。首先,引入了基于最小误差的高光谱信号辨识算法(Hysime),通过计算特征值的方式估计信号矩阵和噪声矩阵;然后,提出了一种简单的基于光谱距离的聚类算法,对多个波段生成的光谱反射率距离值小于某一值的相邻像元进行合并聚类生成空间群结构;最后,在生成的群结构基础上进行稀疏化非负矩阵分解。实验分析表明,对于模拟数据和实际数据而言,该算法都比传统算法产生更小的均方根误差(RMSE)和光谱角距离(SAD),能够产生优于同类算法的解混效果。 相似文献