首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
随着差分隐私研究及其应用的不断拓展,其在轨迹数据发布的隐私保护领域应用受到了广泛关注,现有研究方法大多采用Kmeans聚类方法对轨迹进行聚类划分,但由于差分隐私约束下的轨迹数据集受到噪声的扰动,导致现有的聚类方法无法保证最后的收敛效果。本文提出了一种基于方向控制的差分隐私保护轨迹数据发布方法。首先,提出了基于SKmeans||聚类的轨迹泛化算法,在聚类迭代过程中针对质心的更新,加入方向控制机制,设计指数机制中的打分函数控制质心的收敛,保证高维数据聚类的质量。其次,设计了一个基于有界阶梯噪声机制的轨迹数据发布算法,其中的有界阶梯噪声机制保证了在隐藏轨迹点真实计数的同时,提高了发布后轨迹数据的可用性。最后,通过实验验证了本文所提出方法的有效性。  相似文献   

2.
KACA是一种基于局域泛化的K-匿名化方法.基于该算法,结合敏感属性隐私保护度,提出了一种S-KACA算法.该算法能够更有针对性地保护敏感隐私属性,而且使发布后数据的可用性较高,但由于其在保护敏感隐私信息时设置了一个隐私保护度的参数,会影响算法执行效率,使大规模的数据集应用有一定的局限性.为解决这个问题,引入一个高效的聚类算法——K-Prototypes算法,并将其与S-KACA算法相结合,提出一种K-Prototypes-SKACA算法.该算法首先通过聚类算法K-Prototypes将整个微数据集划分成几个较大的簇,然后再采用S-KACA算法对这些簇的微数据进行匿名化处理.实验验证K-Prototypes-S-KACA算法在隐私保护程度和数据可用性的大小与S-KACA算法相近,但是算法运行效率却得到了很大的提高.  相似文献   

3.
针对当前用户轨迹隐私信息易泄露的问题,提出了一种差分隐私轨迹数据保护方案。该方案在基于位置服务请求用户身份匿名化处理的基础上,采用差分隐私技术对用户的轨迹数据集进行加噪生成轨迹噪声数据集;然后用轨迹加噪后的伪用户替代真实用户执行基于位置的服务请求,从而实现用户身份、轨迹和查询信息的隐私保护。通过安全性分析,所提方案具有匿名性、不可伪造性和抗假冒攻击等安全特性。仿真实验表明,所提方案不仅具有较好的数据可用性,也有一定的效率优越性。  相似文献   

4.
为解决大数据中个性化检索技术所潜在的用户隐私安全和提升个性化信息检索性能之间的矛盾,提出了基于差分隐私与p-link技术相结合的用户兴趣模型匿名化方法.首先对用户的准标示符进行泛化并添加噪音满足差分隐私保护要求,最大化统计数据库中的查询精度,同时最小化识别个体及属性的概率;其次根据用户兴趣之间的相似性将其微聚为满足p-link的等价组,并计算微聚后等价组兴趣条目的权值和等价组质心;最后发布匿名化的数据.大量实验证明:该方法结合差分隐私与p-link两者的特性,实现用户兴趣模型匿名化且用户兴趣基本不发生改变,既能保护用户的隐私信息,又能保证个性化检索性能.  相似文献   

5.
查询日志的发布会泄露用户的隐私。提出一种基于差分隐私的查询日志匿名化算法:首先构建用户查询项模型进行相似度计算并利用所求结果对用户查询项模型进行聚类,其次在聚类过程中添加指数噪音来满足差分隐私,最后发布匿名化数据。实验表明:该算法有效地提高了查询日志的实用性和隐私保护程度。  相似文献   

6.
针对传统差分隐私保护方案以剩余隐私预算的一半逐层分配,即等比分配隐私预算,被应用于决策树时,随着决策树高度的增加,分配至顶层的隐私预算过小,随机噪声过大,分类准确率受到影响的问题,作者提出以差分隐私保护结合主流决策树C4.5分类方法为基本思路,依据决策树高度等差分配隐私预算的方案。差分隐私中的Laplace机制和指数机制确保决策树分类的安全性。作者利用大数据Hadoop平台的MapReduce框架,主程序进行MapReduce参数配置以及外层循环。在执行到每一个节点时,主程序将数据集属性的统计任务交给Mapper类,Reducer类接收Mapper类的统计结果并利用Laplace机制添加随机噪声,加噪结果返回主程序中作为计算信息增益率的参数。主程序利用指数机制选择最佳细分方案,递归过程直至样本数为0时停止。实验采用UCI数据库的car数据集进行测试,在不同隐私预算下将等比分配与等差分配两种方案得到的分类结果准确率进行对比。实验结果表明:本文算法在可接受的分类准确率降低的情况下满足差分隐私保护;与传统隐私预算分配相比,本文算法在相同隐私预算下提高了分类准确率;对于car数据集,本文算法在隐私预算为0.7或0.8时可较好兼顾数据集的安全性和有效性。因此,在一定程度上依据决策树高度等差分配隐私预算的方案可改善分类准确率,可实际应用于决策树分类算法。  相似文献   

7.
基于位置的各种大数据服务在为用户提供便利的同时,也导致了各种隐私泄露的风险。本地化差分隐私模型避免了对可信第三方数据收集平台的依赖,使得用户能够依据个人需求处理和保护敏感信息,因此更适用于位置隐私保护的场景。针对现有本地化差分隐私位置保护方法编码机制复杂、位置数据可用性低等问题,提出一种基于希尔伯特编码的本地化差分隐私位置保护方法。用户端根据本地化差分隐私模型对自身所处网格的希尔伯特编码进行随机响应扰动处理,实现原始位置的隐私保护;服务器端收集大量用户的扰动位置编码并进行希尔伯特解码,进而判断用户所处的网格位置,实现对用户数量和分布密度的统计分析。通过实际位置数据集合上的实验证明,所提方法能够在实现用户位置本地化差分隐私保护的基础上提供更好的位置数据可用性和运行效率。  相似文献   

8.
针对现有数据扰动方法难以维持原始数据的聚类可用性问题,提出了一种隐私保护数据扰动算法DPTPE.基于邻域拓扑势熵将节点划分为不同类型,对于邻域分散型节点,以该节点的k邻域中节点坐标的均值替换其原始坐标;对于邻域紧密型节点,在其安全邻域中随机选择一个节点替换该节点。实验结果表明,DPTPE算法可以保护数据的隐私安全,还能够较好地维持数据集的聚类可用性。  相似文献   

9.
传统的社交网络差分隐私保护方法由于直接对隐私数据进行了分类,导致方法的应用效果不佳。因此,设计一种基于生成对抗网络反馈的社交网络差分隐私保护方法。通过计算差分隐私的预算参数,构建差分隐私风险量化模型,对数据隐私泄露的风险量化。在生成对抗网络反馈的作用下,将隐私数据分类过程划分为数据分类和判别过程,通过计算隐私数据的信息熵,提高数据分类的精确度,实现社交网络差分隐私的保护。和以往的社交网络差分隐私保护方法相比,本文设计的基于生成对抗网络反馈的社交网络差分隐私保护方法的执行时间平均为123.2 ms,执行时间更短,应用效果更好。  相似文献   

10.
为提高差分隐私保护下推荐算法的准确性,提出了一种考虑差分隐私保护的基于Bhattacharyya系数(BC)的聚类推荐算法.以BC作为项目相似性度量的标准,根据BC相似性对项目进行K-medoids聚类,并在聚类簇中进行私有项目邻居选择.最后,根据最近邻居集信息,对用户的评分进行预测和Top-n推荐.提出的方案有效地克服了已有方法中存在的相似性度量依赖于共同评分的问题,提高了相似性度量的准确性,有效避免了因隐私保护而造成的最近邻居集质量下降的问题.理论分析和实验测试的结果表明,该方法在实现隐私保护的同时还能有效保证推荐的高质量,较好地实现了隐私保护和数据效用之间的平衡,具有良好的应用潜力.  相似文献   

11.
针对基于位置服务中移动终端用户轨迹隐私安全及用户个性化需求的问题,提出一种个性化差分隐私的k匿名轨迹隐私保护方案。所提方案根据用户的个性化差异分配不同的隐私预算,利用差分隐私技术对用户轨迹多次添加拉普拉斯噪声,生成2k个噪声轨迹;利用轨迹相似性度量方法确定最优的k-1个噪声用户,将其与真实用户组成k匿名用户组,然后随机选取一个代理用户代替真实用户执行位置服务请求,从而实现对用户身份和轨迹的隐私性保护。通过安全性分析得出方案具有匿名性、不可伪造性和抗假冒攻击等安全特性。仿真实验结果表明,所提方案在隐私保护效果上有明显的优势,且具有较高的执行效率。  相似文献   

12.
电动汽车频繁接入充电桩充电而产生的位置数据对优化充电桩布置、指导电力调度具有重要意义。然而充电位置数据对于汽车用户来说属于隐私信息。为防止汽车用户的隐私泄露,亟需探索研究隐私汇聚充电位置数据的方法。采用局部差分隐私技术保护电动汽车充电位置数据,通过引入贝叶斯随机多伪隐私算法设计一种基于分区的隐私保护充电位置数据汇聚方法。该方法利用贝叶斯随机多伪隐私算法设计了一个用于本地化扰动充电位置数据的局部混淆算法,然后,结合随机多伪算法的重构算法设计了满足稀疏、样本量小等特点的充电位置数据的隐私汇聚方法。同时,在保证隐私保护水平的前提下,通过对位置域进行划分以缩小隐私位置域,进一步提高汇聚结果的可用性。对所设计方法的隐私性进行分析。最后,在正态分布、均匀分布、峰值分布和随机分布4种不同的合成数据集以及公开的Gowalla数据集上进行验证。实验结果表明:在相同隐私水平的条件下,所设计的方法在可用性方面优于基于随机映射矩阵的隐私汇聚方法。  相似文献   

13.
为了解决维度灾难所引起的隐私保护数据发布计算复杂度高、可用性低的问题,提出基于差分隐私采样机制和贝叶斯网络的DPSM-Bayes算法。利用贝叶斯网络模型,将高维联合概率分布转化为多个低维边缘概率分布,结合差分隐私采样机制和更适合高维概率分布加噪的IMLaplace机制,生成可用性更高的高维合成数据集。实验结果证明,在提供相同差分隐私保护的前提下,DPSM-Bayes算法能够有效地处理高维数据集的发布问题,与现有的方法相比发布的数据集具有更高的质量和可用性。  相似文献   

14.
智能网联汽车的高维轨迹数据被广泛用于从车辆的行驶轨迹中发现不同运动模式,从而降低交通风险、提高通行效率. 然而,数据利用过程中的隐私问题日益受到关注,如何在隐私保护的前提下进行算法的研究和应用是当前面临的一大挑战. 针对车辆轨迹数据分散在不同持有方且出于隐私保护无法共享数据的背景,利用差分隐私联邦学习框架来构建序列自编码网络提取轨迹序列的低维表示,并进一步利用轨迹的低维空间向量来发现不同时段下车辆的频繁路线. 提出的框架既通过本地训练避免了用户隐私数据的分享,又能通过高斯差分隐私机制防止模型信息的泄露. 该框架在真实的轨迹数据集上进行了验证,利用LSTM自编码作为嵌入学习网络,与非联邦、非差分加密的模型进行了对比分析,最后对三种得到的轨迹嵌入通过聚类分析发现该框架下学习的模型在充分尊重了隐私保护的前提下,仍然能够找出有效的频繁轨迹.  相似文献   

15.
为了解决相似轨迹挖掘中的隐私保护、轨迹数据简化和在线处理问题,提出了一种能够保护用户原始轨迹数据隐私的在线挖掘相似轨迹的方法.该方法首先利用随机投影技术压缩和扰动原始轨迹数据,然后通过基于密度的聚类方法判定各个时间段内相似的移动对象,采用局部敏感哈希技术寻找在足够多的时间段内都相似的移动对象,避免了传统方法中的交集运算,实现快速估计轨迹间相似度.实验结果表明: 该方法能够有效的发现相似轨迹,并且时间开销较小.  相似文献   

16.
针对连续查询场景中用户实时位置的隐私保护问题,设计了一种基于客户端的假轨迹生成方法.该方法使用网格划分地理空间,统计网格划分后每个网格内的历史查询数据.通过分析网格内的历史查询数据构建实时预测用户移动轨迹的重力模型.在重力模型基础上结合历史查询概率定义了轨迹熵度量轨迹隐私保护等级,并在最大运行速度限制下,提出了一种具有最大轨迹熵的基于k-匿名的假轨迹隐私保护算法.实验结果验证了所设计的假轨迹生成方法能够有效地保护真实轨迹的隐私.  相似文献   

17.
k-means是一种快速有效的聚类算法,但是随着数据量的增加,k-means算法的局限性日益突出。该文从数据预处理,初始聚类中心的选取,最佳聚类数的确定等几个方面优化了k-means算法。仿真实验表明,优化后的k-means算法在稳定性和准确性方面都有很大的提高,证明提出的算法有一定的价值。  相似文献   

18.
针对现有的K-匿名模型中存在泛化属性选取不唯一和数据过度泛化的问题,提出多属性泛化的K-匿名算法。在K-匿名模型实现的过程中,引入属性近似度概念,定量刻画准标识符属性的离散程度,进而确定泛化的准标识符属性;同时采用广度优先泛化的方法,避免数据被过度泛化,最终实现数据表的K-匿名要求。实验结果表明,多属性泛化的K-匿名模型可以提高泛化后数据精度,其处理效率和Datafly算法相当。该算法有效地解决了取值最多准标识符属性存在多个时的泛化属性选取问题,并且防止属性被过度泛化,提高数据的可用性。  相似文献   

19.
基于微聚集技术的κ-匿名化MDAV算法没有考虑数据属性的分布情况和数据属性重要性在聚类中的作用,易产生不合理的划分,从而对数据的保护程度与数据可用性之间关系带来影响.针对这个问题本文提出一种基于属性重要度和密度聚类的MDAV改进方法实现对数据集κ-匿名化.首先采用基于密度聚类DENCLUE方法对数据表进行聚集成簇,然后对每个簇采用基于粗糙集属性重要度作为加权距离的权值来计算相似样本,实现对数据集的κ-划分.与MDAV算法比较测试,所改进的方法改善了发布数据的可用性.  相似文献   

20.
时间序列分类是数据挖掘中的重要主题,现有的大部分时间序列分类方法较少考虑到序列形状对分类结果的影响。该文提出了一种基于k-shape的时间序列模糊分类方法。该方法通过使用k-shape聚类算法对时间序列训练数据集各类别的成员进行聚类,获得各类别的聚类中心并形成聚类中心群,将每个类别的聚类中心群作为时间序列数据模糊分类的初始聚类中心,根据隶属度最大原则确定测试时间序列数据的类别标签。在30个时间序列公开数据集上的分类实验结果表明,该方法相较于SVM、Bayes、EAIW和TLCS这4种分类算法具有更好的分类性能,对具有扭曲和位移特征的时间序列数据分类有更好的可用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号