首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
场景图生成旨在给定一张图片,通过目标检测模块得到实体和实体间关系的视觉三元组形式,即主语、关系和宾语,构建语义结构化表示。场景图可应用于图像检索和视觉问答等下游任务。然而,由于数据集中的实体间关系呈长尾分布,因此现有模型在预测关系时更偏向于粗粒度的头部关系。这样的场景图无法对下游任务起到辅助性作用。以往工作普遍采用再平衡策略,如重采样和重加权的方法,来解决长尾问题。但模型反复学习尾部关系样本,易出现过拟合现象。为了解决上述问题,文中提出了一种自适应正则化无偏场景图生成方法。具体来说,该方法通过设计一个基于先验关系频率的正则项,自适应地调整模型全连接分类器权重,从而实现对模型的平衡预测。所提方法在场景图VG(Visual Genome)数据集上进行了实验,实验结果表明,该方法不仅能防止模型过拟合,也能缓解关系长尾分布问题对场景图生成的负面影响,且最先进的场景图生成方法在结合所提方法后能更有效地改善无偏场景图生成的性能。  相似文献   

2.
郭迎春  冯放  阎刚  郝小可 《自动化学报》2022,48(11):2744-2756
无监督跨域的行人重识别旨在将从有标签的源域中学习到的知识迁移到无标签的目标域, 具有实用性和有效性而得到广泛关注. 基于聚类的跨域行人重识别可以生成伪标签并对模型进行优化使得其表现较其他方法更优, 然而这类方法由于过于依赖聚类伪标签的准确性, 忽略了对伪标签噪声的处理, 导致噪声随着网络迭代而不断扩大, 影响模型的鲁棒性. 针对这个问题, 提出了基于自适应融合网络的方法, 利用双网络结构共同学习, 并将学习到的知识进行融合得到融合网络; 为了区分两个网络的学习能力, 设计了自适应融合策略; 同时, 利用细粒度风格转换模块对目标域数据集进行处理, 降低行人图像对相机变换的敏感度. 在行人重识别基准数据集Market1501、DukeMTMC-ReID和MSMT17上, 通过评估指标平均精度均值和Rank-n与主流的方法进行了对比实验, 验证了该方法的有效性.  相似文献   

3.
刘刚  翟春伟  戴明 《计算机工程》2011,37(23):192-194
不精确的配准参数会使图像重建结果不理想.为此,提出一种基于权值的自适应正则化超分辨率算法.自适应局部区域权值根据该区域的可靠性进行自适应运算,利用分水岭分割将参考图像分成不同区域,由此提升重建质量.对真实视频序列的实验结果证明该算法有效.  相似文献   

4.
在训练集存在噪声标签或类别不平衡分布的情况下,深度神经网络具有过度拟合这种有偏差的训练数据的不良趋势。通过设计适当的样本权重,使用重加权策略是解决此问题的常用方法,但不适当的重加权方案会给网络学习引入额外的开销和偏差,仅使用重加权方法很难解决有偏差分布下网络的过拟合问题。为此,建议将标签平滑正则化和类裕度正则化与重加权结合使用,并提出了一种基于自适应重加权和正则化的元学习方法(ensemble meta net,EMN),模型框架包括用于分类的基本网络和用于超参数估计的集成元网。该方法首先通过基本网络获得样本损失;然后使用三个元学习器基于损失值以集成的方式估计自适应重加权和正则化的超参数;最终利用三个超参数计算最终的集成元损失更新基本网络,进而提高基本网络在有偏分布数据集上的性能。实验结果表明,EMN在CIFAR和OCTMNIST数据集上的准确率高于其他方法,并通过策略关联性分析证明了不同策略的有效性。  相似文献   

5.
张文林  张连海  牛铜  屈丹  李弼程 《自动化学报》2012,38(12):1950-1957
将正则化方法应用于本征音说话人自适应算法中,有效地解决了说话人子空间基的先验选择问题. 通过对似然函数引入适当的正则项,在优化过程中从候选本征音基矢量中自动选择最佳的本征音进行线性组合. 本文讨论了三种正则化因子,并给出了其数学优化算法. l1正则化可以得到说话人因子的稀疏解,其非零项即对应最佳本征音基矢量; l2正则化可以提高解的稳健性,在某种程度上减少了子空间维数的先验选择对识别率的影响;而弹性网正则化则通过线性组合在二者之间取得折衷.有监督说话人自适应实验表明,新方法与本征音方法的最好结果相比,在少量的自适应数据条件下(10s以下),识别率相对提高了近1%~2%.三种方法中, l1正则化略优于l2正则化,而在引入弹性网正则化后,系统性能有了进一步提高.  相似文献   

6.
针对行人重识别中已有方法难以解决行人图像光照、视角变化大的问题,提出了一种基于特征融合的行人重识别方法。首先利用Retinex变换对图像进行预处理;然后将CN特征与原有的颜色和纹理特征融合,并通过区域和块划分的方式提取直方图获得图像特征;最后采用不同的距离学习方法在4个数据集上进行行人重识别。实验结果表明,融合后的特征对行人图像具有更好的表述能力,实现了重识别精度的较大提升,验证了方法的有效性。  相似文献   

7.
Andriy Myronenko提出了一种自适应正则化的方法并将其应用于非刚性图像的配准,该方法在配准速度和配准精确度方面都取得了比较好的效果。但该方法对变形场初始值比较敏感,选择不当则会陷入局部极小值而不能得到理想的配准结果。为了使原始算法得到更广泛的应用,本文引入了基于特征点的粗配准方法,得到了与真实变形场更加接近的初始变形场,从而摆脱了局部极小值的困扰,得到了正确的配准结果。实验证明,改进后的算法在应用范围和配准精度上都有了提高。  相似文献   

8.
针对图像重建过程中噪声去除问题,提出一种自适应加权编码L1/2正则化重建算法。首先,考虑到许多真实图像中不仅含有高斯噪声,而且含有拉普拉斯噪声,设计一种改进的L1-L2混合误差模型(IHEM)算法,该算法兼顾了L1范数与L2范数的各自优点;其次,由于迭代过程中噪声分布会发生改变,设计一种自适应隶属度算法,该算法可以减少迭代次数和运算时间;利用一种自适应加权编码方法,该方法可以有效地去除含有重尾分布特性的拉普拉斯噪声;另外,设计一种L1/2正则化算法,该算法可以得到较稀疏的解。实验结果表明,相比IHEM算法,自适应L1/2正则化图像重建算法的峰值信噪比(PSNR)平均提高了3.46 dB,结构相似度(SSIM)平均提高了0.02,对含有多种噪声的图像处理具有比较理想的效果。  相似文献   

9.
基于卷积神经网络的正则化方法   总被引:2,自引:0,他引:2  
正则化方法是逆问题求解中经常使用的方法.准确的正则化模型在逆问题求解中具有重要作用.对于不同类型的图像和图像的不同区域,正则化方法的能量约束形式应当不同,但传统的L1,L2正则化方法均基于单一先验假设,对所有图像使用同一能量约束形式.针对传统正则化模型中单一先验假设的缺陷,提出了基于卷积神经网络的正则化方法,并将其应用于图像复原问题.该方法的创新之处在于将图像复原看作一个分类问题,利用卷积神经网络对图像子块的特征进行提取和分类,然后针对不同特征区域采用不同的先验形式进行正则化约束,使正则化方法不再局限于单一的先验假设.实验表明基于卷积神经网络的正则化方法的图像复原结果优于传统的单一先验假设模型.  相似文献   

10.
车辆重识别目的是通过不同的摄像机来识别同一辆车.但是由于车辆图像类内差异性大、类间相似性大,使得车辆重识别成为一个极具挑战性的任务.本文提出了一个基于双分支网络特征融合的车辆重识别方法来解决这一问题.该方法使用2个分支和批擦除策略提取并融合全局特征和局部特征,以突出车辆图像的类内相似性和类间差异性;并且采用圆损失代替传...  相似文献   

11.
针对目前行人重识别技术的缺点,提出一种基于Siamese网络的行人重识别方法.首先使用Dropout算法对卷积神经网络进行改良,降低发生过拟合问题的概率;而后构造一个Siamese网络,将CNN (Convolution Neural Network)中特征提取和检验相融合,提高图像识别的效率和准确率;最后利用度量学习算法中的马氏距离作为检索图像匹配相似度的评价指标.实验结果表明:针对Market-1501数据集,该方法可以有效提高采用卷积神经网络的行人重识别方法识别效率和准确率.  相似文献   

12.
针对BP神经网络算法训练过程中出现的过拟合问题,提出了利用一阶原点矩,二阶原点矩,方差和极大似然估计概念的推广来计算L2正则化中正则化参数λ值的方法。该方法通过对算法数据集[X,Y]中的X矩阵进行运算得到的四个λ值,BP神经网络算法训练时通常采用的是贝叶斯正则化方法,贝叶斯正则化方法存在着对先验分布和数据分布依赖等问题,而利用上述概念的推广计算的参数代入L2正则化的方法简便没有应用条件限制;在BP神经网络手写数字识别的实验中,将该方法与贝叶斯正则化方法应用到实验中后的算法识别结果进行比较,正确率提高了1.14-1.50个百分点;因而计算得到的λ值应用到L2正则化方法与贝叶斯正则化方法相比更能使得BP神经网络算法的泛化能力强,证明了该算法的有效性。  相似文献   

13.
为解决相关滤波类视觉跟踪算法中的边界效应问题,提出一种基于自适应空间正则化的视觉跟踪算法.在经典滤波模型中引入自适应空间正则化项,通过建立正则权重在相邻帧之间的关联,自适应调整当前帧的模型正则化权重,减小边界效应的影响.采用自适应宽高比的尺度估计策略,以及基于颜色直方图相似度的模型更新策略,抑制模型漂移,提高跟踪准确性.实验显示,该算法在UAV123,OTB2013,OTB2015这3个数据集上的跟踪成功率和精确度均高于所有对比的算法,且即使在复杂场景中也能保持良好的跟踪效果.特别是在出现运动模糊和目标在平面内旋转2种情况时,该算法的跟踪成功率较排名第2的算法分别提升了9.72个百分点和9.03个百分点,说明所提出的算法具有较好的适应性.  相似文献   

14.
徐龙壮  彭力  朱凤增 《计算机工程》2021,47(1):239-245,254
针对基于局部特征的行人重识别方法在行人错位和姿态变化时识别精度较低的问题,提出一种采用多任务金字塔重叠匹配特征的重识别方法。在训练阶段,使用改进的ResNes50作为主干网络提取特征图,将其切分组合形成金字塔重叠匹配网络,获得全局特征向量并经全局平均池化得到包含多尺度特征的多个局部特征向量,联合使用Softmax损失函数、三元组损失函数和中心损失函数学习全局和局部特征向量,并利用特征归一化层减少损失函数学习目标冲突的影响。在推理阶段,将多个局部特征向量融合为一个新特征向量进行相似性匹配,以获取更好的匹配结果。在Market1501、DukeMTMC-reID和CUHK03数据集上的实验结果表明,与PSE、MultiScale等主流重识别方法相比,该方法重识别精度更高,提取的特征具有较好的鲁棒性和识别度。  相似文献   

15.
为提升车辆重识别算法的性能,提出一种基于车辆组件特征与多注意力融合的特征学习方法.首先,修改深度残差网络以获取具有丰富语义信息的特征图,同时应用语义分割网络将车辆图像划分为车辆正面、背面、顶面、侧面及背景区域,以实现组件特征提取并消除视角变化的影响.然后,设计多注意力融合模块,基于面积注意力与特征注意力实现组件特征的自适应融合.最后,在多任务学习框架下,优化车辆重识别的三元组损失与辅助分类任务的交叉熵与焦点损失,对网络参数进行训练.在多个数据集上的实验结果表明,提出的方法在大多数性能指标上均超越了现有方法.进一步的消融实验证明了多注意力融合模块与多任务损失函数在特征提取上的有效性.  相似文献   

16.
行人重识别是指利用计算机视觉技术在给定监控的图像中识别目标行人,受拍摄场景视角和姿势变化、遮挡等因素的影响,现有基于局部特征的行人重识别方法所提取的特征辨别力差,从而导致重识别精度较低。为有效地利用特征信息,提出一种多尺度多粒度融合的行人重识别方法MMF-Net。通过多个分支结构学习不同尺度和不同粒度的特征,并利用局部特征学习优化全局特征,以加强全局特征和局部特征的关联性。同时,在网络的低层引入语义监督模块以提取低层特征,并将其作为行人图像相似性度量的补充,实现低层特征和高层特征的优势互补。基于改进的池化层,通过结合最大池化和平均池化的特点获取具有强辨别力的特征。实验结果表明,MMF-Net方法在Market-1501数据集上的首位命中率和mAP分别为95.7%和89.1%,相比FPR、MGN、BDB等方法,其具有较优的鲁棒性。  相似文献   

17.
董亚超  刘宏哲  徐成 《计算机工程》2021,47(6):234-244,252
由于背景信息复杂、遮挡等因素的影响,现有基于局部特征的行人重识别方法所提取的特征不具有辨别力和鲁棒性,从而导致重识别精度较低,针对该问题,提出一种基于显著性检测与多尺度特征协作融合的SMC-ReID方法.利用显著性检测提取行人中具有判别力的特征区域,融合显著性特征与全局特征并完成不同尺度的切块,将上述不同尺度的特征进行...  相似文献   

18.
行人重识别任务旨在识别不相交摄像头视图下的相同行人.这项任务极具挑战性,尤其是当数据集中每个行人仅仅有几张图片时.针对行人重识别数据集中行人图片数量不足的问题,提出一个从原始数据集中生成额外训练数据的方法.在这项工作之中存在2个挑战:1)如何从原始数据集之中获取更多的训练数据;2)如何处理这些新生成的训练数据.使用深度卷积生成对抗网络来生成额外的无标签行人图片,并采用标签平滑正则化来处理这些新生成的无标签行人图片.为了进一步提升行人重识别准确度,提出了一种新的无监督重排序框架.此框架既不需要为每组图像对重新计算新的排序列表,也不需要任何人工交互或标签信息.在Market-1501,CUHK03和DukeMTMC-reID数据集上的实验验证了所提方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号