共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
在实际应用中,面向不平衡数据的数据分类一直是研究热点.基于生成模型的方法为该问题提供了新的的思路.为了利用生成对抗网络扩充不平衡数据,提出一种新的生成对抗网络衍生模型.该模型基于已知的不平衡数据进行训练,最后生成平衡数据用于分类任务.该模型分别在合成数据集和手写体识别数据集MNIST上完成了实验,实验结果表明了该模型能... 相似文献
3.
推荐系统利用用户的历史记录、物品的基础信息等数据进行建模来捕获用户的偏好,有效缓解了信息过载等问题,虽然其已应用广泛,但整个推荐领域面临的挑战却依旧存在,其中数据稀疏这一问题对于推荐性能有举足轻重的影响。近年来,大量研究表明基于社交信息的推荐算法能够有效缓解数据稀疏问题,但它们也仍然存在一定的局限。线上的社交网络是非常稀疏的,并且线上社交网络中的“朋友”通常包括同学、同事、亲戚等,因此,拥有显式朋友关系的用户不一定拥有相似的偏好,即直接利用显式朋友的兴趣偏好进行推荐会存在噪声问题。此外,大部分基于隐式反馈的算法通常直接对用户没有交互过的物品进行随机采样,然后将其作为用户实际交互过的物品的负样本来优化模型,然而用户没有交互过的物品并不代表用户不喜欢,这种粗粒度的采样策略忽略了用户的真实偏好,同样也带来了一定程度的噪声。生成对抗网络(GANs)因其在训练中捕获复杂数据分布的能力以及强大的鲁棒性被广泛应用到推荐系统中,为了减弱上述噪声问题带来的影响,本文基于生成对抗网络提出了一种细粒度的对抗采样推荐模型(ASGAN),包括一个生成器和判别器。其中,生成器首先利用图表示学习技术初始化社交网络,接着为用户生成一个与其偏好相似的朋友,然后再从该朋友喜欢的物品集中同时生成该用户喜欢的物品和用户不喜欢的物品。判别器则尽可能区分出用户实际交互过的物品和生成器生成的两类物品。随着对抗训练的进行,生成器能更有效地进行社交朋友采样和物品采样,而判别器能够良好地捕获用户的真实偏好分布。最后,在三个公开的真实数据集上与现有的六个工作进行对比,实验结果证明:ASGAN拥有更好的推荐性能,通过重构社交网络和细粒度采样有效缓解了社交信息和物品采样策略带来的噪声问题。 相似文献
4.
5.
针对非平衡数据集中类分布信息不对称现象,提出一种新的过采样算法DB_SMOTE(Distance-based Synthetic Minority Over-sampling Technique),通过合成少数类新样本解决样本不足问题。算法基于样本与类中心距离,结合类聚集程度提取种子样本。根据SMOTE(Synthetic Minority Over-sampling Technique)算法思想,在种子样本上实现少数类新样本合成。根据种子样本与少数类中心距离构造新样本分布函数。基于此采样算法并在多个数据集上进行分类实验,结果表明DB_SMOTE算法是可行的。 相似文献
6.
对抗样本能够作为训练数据辅助提高模型的表达能力,还能够评估深度学习模型的稳健性.然而,通过在一个小的矩阵范数内扰乱原始数据点的生成方式,使得对抗样本的规模受限于原始数据.为了更高效地获得任意数量的对抗样本,探索一种不受原始数据限制的对抗样本生成方式具有重要意义.鉴于此,提出一种基于生成对抗网络的对抗样本生成模型(multiple attack generative adversarial networks, M-AttGAN).首先,将模型设计为同时训练2组生成对抗网络,分别对原始数据样本分布和模型潜在空间下的扰动分布进行建模;然后,训练完成的M-AttGAN能够不受限制地高效生成带有扰动的对抗样本,为对抗训练和提高深度神经网络的稳健性提供更多可能性;最后,通过MNIST和CIFAT-10数据集上的多组实验,验证利用生成对抗网络对数据分布良好的学习能力进行对抗样本生成是可行的.实验结果表明,相较于常规攻击方法,M-AttGAN不仅能够脱离原始数据的限制生成高质量的对抗样本,而且样本具备良好的攻击性和攻击迁移能力. 相似文献
7.
近年来,随着深度学习模型及其衍生模型在故障诊断领域中的成功应用,基于深度学习的故障诊断方法开始成为研究主流.但是当训练数据不均衡时,通过深度学习从不平衡的数据中提取的故障特征是不准确的,训练得到的神经网络模型的分类结果往往倾向多数类,极大影响了分类效果.针对这种情况,本文结合卷积神经网络设计了一种新的生成对抗网络模型(Convolutional Wasserstein Generative Adversarial Network,CWGAN).首先卷积神经网络从故障样本中提取故障特征,并将其作为对抗网络的输入,然后由解码器网络解码来自生成器的故障特征向量来生成故障样本,同时将提取的故障特征和训练过程中的故障诊断误差添加至生成器训练的损失函数中.实验表明本文提出的方法相比于基线模型(GAN-CNN)的平均F1值提高4%,较好地解决数据不平衡的分类问题. 相似文献
8.
针对直接使用高维、高频、含有噪声的现实世界数据进行数据处理时会导致估计器不可靠的问题,提出一种基于生成对抗网络(GAN)的数据不确定性量化方法。首先,通过GAN重构原始数据分布,构建噪声空间到原始数据空间的映射分布;其次,使用马尔可夫链蒙特卡洛(MCMC)方法抽取样本,从而得到基于原始数据分布的新样本;然后,基于指定的函数定义样本的不确定性置信区间;最后,使用置信区间对原始数据进行不确定性估计,并选择置信区间内的数据作为估计器使用的数据。实验结果表明,与使用原始数据相比,使用置信区间内的数据进行估计器训练达到性能上限所需要的样本数减少了50%;同时,对比原始训练数据,置信区间内的数据在达到相同测试精度时所需要的样本数平均降低了30%。 相似文献
9.
10.
11.
12.
深度学习在视觉任务中的良好表现很大程度上依赖于海量的数据和计算力的提升,但是在很多实际项目中通常难以提供足够的数据来完成任务。针对某些情况下红外图像少且难以获得的问题,提出一种基于彩色图像生成红外图像的方法来获取更多的红外图像数据。首先,用现有的彩色图像和红外图像数据构建成对的数据集;然后,基于卷积神经网络、转置卷积神经网络构建生成对抗网络(GAN)模型的生成器和鉴别器;接着,基于成对的数据集来训练GAN模型,直到生成器和鉴别器之间达到纳什平衡状态;最后,用训练好的生成器将彩色图像从彩色域变换到红外域。基于定量评估标准对实验结果进行了评估,结果表明,所提方法可以生成高质量的红外图像,并且相较于在损失函数中不加正则化项,在损失函数中加入L1和L2正则化约束后,该方法的FID分数值平均分别降低了23.95和20.89。作为一种无监督的数据增强方法,该方法也可以被应用于其他缺少数据的目标识别、目标检测、数据不平衡等视觉任务中。 相似文献
13.
14.
在深度学习中,数据是三大核心要素之一.尤其在某些领域,数据的稀有、人工标注造成大量人力的浪费、数据好坏对产出结果的影响,都显现出数据的重要性.鉴于在动漫领域中,人物的制作需要花费大量的人力和时间,所以从动漫头像出发,基于生成对抗网络,结合编码器、残差网络、解码器,经过编码器改变图像的维度,最后利用解码器将提取到的特征数... 相似文献
15.
深度学习在分类任务上取得了革命性的突破,但是需要大量的有标签数据作为支撑.当数据匮乏的时候,神经网络极易出现过拟合的问题,这种现象在小规模数据集上尤为明显.针对这一难题,本文提出了一种基于生成对抗网络的数据增强方法,并将其应用于解决由于数据匮乏,神经网络难以训练的问题.实验结果表明,合成的数据和真实的数据相比既具有语义上的相似性,同时又能呈现出文本上的多样性;加入合成的数据后,神经网络能够更加稳定地训练,而且分类的准确度也有了进一步的提高.将提出的算法和其他一些数据增强的技术对比,我们的方法结果最好,从而证明了这种技术的可行性和有效性. 相似文献
16.
目前没有能够使用简单的网络结构生成高质量特定图像的生成模型,针对这一项任务,本文结合边界平衡生成对抗网络(boundary equilibrium generative adversarial network,BEGAN)的优点,添加附加条件特征以及均方误差损失,建立了条件边界平衡生成对抗网络(conditional-BEGAN,C-BEGAN),使用这种方法提取其中的生成模型用于特定图像的生成,实验结果表明,该方法相比于其他监督类生成模型可以使用更简单的网络达到更快的收敛速度并且能够生成具有更好质量以及多样性的图片。 相似文献
18.
训练基于深度学习的计算机辅助诊断系统可以有效地从肺部CT图像中检测出是否受到COVID-19感染, 但目前面临的主要问题是缺乏高质量带标注的CT图像用于训练. 为了有效的解决该问题, 本文提出了一种基于生成对抗网络来扩增肺部CT图像的方法. 新方法通过生成不同感染区域的标签并通过泊松融合以增加生成图像的多样性; 通过训练对抗网络模型实现图像的转换生成, 以达到扩增CT图像的目的. 为验证生成数据的有效性, 基于扩增数据进一步做了分割实验. 通过图像生成实验和分割实验, 结果都表明, 本文提出的图像生成方法取得了较好的效果. 相似文献
19.
20.
基于生成对抗网络和差分隐私提出一种文本序列数据集脱敏模型,即差分隐私文本序列生成网络(DP-SeqGAN)。DP-SeqGAN通过生成对抗网络自动提取数据集的重要特征并生成与原数据分布接近的新数据集,基于差分隐私对模型做随机加扰以提高生成数据集的隐私性,并进一步降低鉴别器过拟合。DP-SeqGAN 具有直观通用性,无须对具体数据集设计针对性脱敏规则和对模型做适应性调整。实验表明,数据集经DP-SeqGAN脱敏后其隐私性和可用性明显提升,成员推断攻击成功率明显降低。 相似文献