共查询到20条相似文献,搜索用时 15 毫秒
1.
机器学习的飞速发展使其成为数据挖掘领域最有效的工具之一,但算法的训练过程往往需要大量的用户数据,给用户带来了极大的隐私泄漏风险.由于数据统计特征的复杂性及语义丰富性,传统隐私数据发布方法往往需要对原始数据进行过度清洗,导致数据可用性低而难以再适用于数据挖掘任务.为此,提出了一种基于生成对抗网络(Generative Adversarial Network,GAN)的差分隐私数据发布方法,通过在GAN模型训练的梯度上添加精心设计的噪声来实现差分隐私,确保GAN可无限量生成符合源数据统计特性且不泄露隐私的合成数据.针对现有同类方法合成数据质量低、模型收敛缓慢等问题,设计多种优化策略来灵活调整隐私预算分配并减小总体噪声规模,同时从理论上证明了合成数据严格满足差分隐私特性.在公开数据集上与现有方法进行实验对比,结果表明本方法能够更高效地生成质量更高的隐私保护数据,适用于多种数据分析任务. 相似文献
2.
大数据应用能够为人们的生活和工作方式提供便捷,但包含消费记录、社交关系、地理位置等个人隐私信息的数据在发布过程中可能被服务提供商收集,用户隐私面临巨大威胁.本文首次提出了一个基于神经网络的多集群分布式差分隐私数据发布方法,能够显著缓解单服务器的数据处理压力.同时,利用神经网络算法进行隐私参数预测明显提高了预测精度和预测效率,并且集群之间不同的隐私参数也保证了方案的灵活性.此外,由于中心服务器存储的是经过差分隐私处理后的统计数据,即使中心服务器由于遭受攻击导致存储的数据泄露,也能确保用户数据隐私.实验对比分析表明,我们的方法在隐私处理效率、隐私保护强度、预测精度和预测效率等方面都有明显优势. 相似文献
3.
大数据应用能够为人们的生活和工作方式提供便捷,但包含消费记录、社交关系、地理位置等个人隐私信息的数据在发布过程中可能被服务提供商收集,用户隐私面临巨大威胁.本文首次提出了一个基于神经网络的多集群分布式差分隐私数据发布方法,能够显著缓解单服务器的数据处理压力.同时,利用神经网络算法进行隐私参数预测明显提高了预测精度和预测效率,并且集群之间不同的隐私参数也保证了方案的灵活性.此外,由于中心服务器存储的是经过差分隐私处理后的统计数据,即使中心服务器由于遭受攻击导致存储的数据泄露,也能确保用户数据隐私.实验对比分析表明,我们的方法在隐私处理效率、隐私保护强度、预测精度和预测效率等方面都有明显优势. 相似文献
4.
为了解决基于位置的服务(Location Based Service,LBS)在收集用户位置数据时造成的隐私泄露,提出一种本地化差分隐私位置发布模型.首先,该模型采用了灵活的位置隐私保护方案(个性化隐私设置),即由用户选择已设定的多种隐私策略或定制隐私策略,在此基础上设计了定制隐私策略位置扰动算法(Customized Privacy policy Location Perturbation algorithm,CPLP);其次,提出并设计一种基于隐马尔可夫模型的时序关联位置隐私发布算法(Temporal Relational Location Privacy publishing algorithm,TRLP),解决发布时序位置时产生的隐私泄露;最后,在GeoLife数据集和Gowalla数据集上通过对比实验验证了该模型的有效性. 相似文献
5.
6.
7.
8.
为解决群体感知数据交易模式下参与者数据隐私泄露的问题,提出了一种隐私保护的群体感知数据交易算法。首先,为实现对参与者的隐私保护,设计了基于差分隐私的聚合方案,参与者不再需要上传原始数据,而是按照任务需求对收集的数据进行分析和计算,将任务结果按照平台分配的隐私预算添加噪声后发送给平台;其次,为确保参与者的可信性,构建了参与者的信誉模型;最后,为激励消费者和参与者参与交易,在考虑消费者对结果偏差的容忍约束和参与者的隐私泄露补偿的基础上构建了交易优化模型以优化平台的收益,并给出了基于遗传算法的收益优化算法(POA)来求解该模型。仿真结果表明,POA不仅保护了参与者的隐私,而且在平台的收益方面相比于VENUS和DPDT分别提高了29.27%和20.45%。 相似文献
9.
针对目前聚类数据收集与发布安全性不足的问题,为保护聚类数据中的用户隐私并提高数据质量,基于混洗差分隐私模型,提出一种去可信第三方的K-Modes聚类数据收集和发布的隐私保护方法。首先,使用K-Modes聚类数据收集算法对用户数据进行采样并加噪,再通过填补取值域随机排列发布算法打乱采样数据的初始顺序,使恶意攻击者不能根据用户与数据之间的关系识别出目标用户。然后,尽可能减小噪声的干扰,利用循环迭代的方式计算出新的质心完成聚类。最后,从理论层面上分析了以上3种方法的隐私性、可行性和复杂度,并利用3个真实数据集和近年来具有权威性的同类算法KM、DPLM、LDPKM等进行准确率、熵值的对比,验证所提方法的有效性。实验结果表明,所提方法的隐私保护和发布数据质量均优于当前同类算法。 相似文献
10.
11.
在大数据时代,随着信息通信技术和互联网科技的快速发展,移动设备已经成了人们接收与发布信息的重要平台.手机APP成为公民日常生活中不可或缺的一部分,它在带给我们生活便利的同时,也在记录着我们的生活数据,使公民隐私泄露问题变得更加突出.如何在网络信息环境中,提供更好的信息服务的同时保障用户的个人隐私成了亟待解决的问题. 相似文献
12.
针对现有群智感知平台在数据和酬金交付过程中存在的安全风险和隐私泄露问题,该文提出一种基于Tangle网络的分布式群智感知数据安全交付模型。首先,在数据感知阶段,调用局部异常因子检测算法剔除异常数据,聚类获取感知数据并确定可信参与者节点。然后,在交易写入阶段,使用马尔科夫蒙特卡洛算法选择交易并验证其合法性,通过注册认证中心登记完成匿名身份数据上传,并将交易同步写入分布式账本。最后,结合Tangle网络的累计权重共识机制,当交易安全性达到阈值时,任务发布者可进行数据和酬金的安全交付。仿真试验表明,在模型保护用户隐私的同时,增强了数据和酬金的安全交付能力,相比现有感知平台降低了时间复杂度和任务发布成本。 相似文献
13.
位置轨迹大数据的安全分享、发布需求离不开位置轨迹隐私保护技术支持。在差分隐私出现之前,K-匿名及其衍生模型为位置轨迹隐私保护提供了一种量化评估的手段,但其安全性严重依赖于攻击者所掌握的背景知识,当有新的攻击出现时模型无法提供完善的隐私保护。差分隐私技术的出现有效地弥补了上述问题,越来越多地应用于轨迹数据隐私发布领域中。该文对基于差分隐私理论的轨迹隐私保护技术进行了研究与分析,重点介绍了差分隐私模型下位置直方图、轨迹直方图等空间统计数据发布方法,差分隐私模型下轨迹数据集发布方法,以及连续轨迹实时发布隐私保护模型。与此同时,在对现有方法对比分析的基础上,提出了未来的重点发展方向。 相似文献
14.
图像数据开放共享是促进大数据在工业领域应用发展的关键,其打破业务壁垒和“数据孤岛”现象,实现信息的跨部门、跨层级共享。但在共享过程中存在图像数据隐私信息泄露的风险。因此针对无法实现数据直接共享的图像数据,将生成对抗网络的变体深度卷积生成对抗网络(deep convolutional generative adversarial networks,DCGAN)与差分隐私进行结合,设计了带有差分隐私的深度卷积生成对抗网络(deep convolutional generative adversarial networks with dif ferential privacy,DP-DCGAN)模型。所提出的模型通过给DCGAN中从判别器传递回生成器的梯度上加噪以减小真实数据对生成器的贡献,实现在隐私保护的基础上生成高质量的数据,并将生成数据进行共享。 相似文献
15.
16.
17.
18.
针对用户连续位置查询请求服务中未考虑语义信息而导致用户敏感语义泄露问题,为了实现对道路网络上客户端的查询隐私、位置隐私和语义位置隐私保护,本文提出一种离线轨迹聚类和语义位置图相结合的算法来进行隐藏用户的选择,使隐藏用户的位置具有明显的多样性和不同的语义以及多样化的服务请求,有效保护客户端的语义和位置隐私.在具有2个定义指标的真实地图上评估了该算法的有效性,整个连续查询道路网络服务的过程中,有很好的成功率和查询处理时间.同时与现有的其他可信第三方模型算法进行了对比分析,验证了本文算法的有效性. 相似文献
19.
为了解决用户轨迹数据发布时的活动模式泄露问题,本文提出了一种基于差分隐私的活动模式保护与时空数据发布方法 DPAP-STTP(Differentially Private Activity Pattern and Spatial-Temporal Trajectory Publication),该方法即保护了用户时空数据中活动模式的隐私,又可以保证所发布时空轨迹在服务建议生成上的有效性.在DPAP-STTP中,用户的活动模式表示为个人代表性轨迹的动静态信息,包括代表性轨迹的时空密度分布、时空路径分布、移动模式以及时空跨度.另外,DPAP-STTP通过隐私保护预算与隐私保护阈值对该动静态信息进行调控,然后根据调控后的动静态信息依次划分时空网格、重构轨迹所处时空区间、时空轨迹点随机采样,最终生成满足群体差分隐私的时空轨迹进行发布.本文的实验比较了DPAP-STTP与DP-STAR(Differential Private Synthetic Trajectory Publisher)、BNA(Bounded Noise-Adding)所生成的轨迹在特定时空范围内的有效性,证明DPAP-ST... 相似文献