首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
差分隐私保护研究综述   总被引:2,自引:0,他引:2  
差分隐私保护通过添加噪声使数据失真,从而起到保护隐私的目的,对于一个严格定义下的攻击模型,其具有添加噪声少、隐私泄露风险低的优点。介绍了差分隐私保护的理论基础和最新研究进展,详细阐述了分类、聚类等差分隐私学习方法的最新研究情况,介绍了一个差分隐私保护的应用框架PINQ(privacy integratedqueries),并对未来的研究发展方向进行了展望。  相似文献   

2.
随着车联网不断地发展,车联网为驾乘者提供便捷服务的同时,也带来了相应的隐私保护问题.轨迹数据发布将可能泄露用户位置隐私,从而危害用户人身安全;为改变已有差分隐私保护方法中添加随机噪音的弊端,提出一种基于统计差分隐私的轨迹隐私保护方法.车辆行驶轨迹具有Markov过程的特点,根据车辆轨迹的特征计算轨迹中位置节点敏感度;并根据位置敏感度,统计阈值和敏感度阈值添加适量Laplace噪音;使用平均相对误差评价轨迹数据的可用性大小.实验证实了基于统计差分隐私的轨迹隐私保护方法的可用性和有效性.  相似文献   

3.
针对异构数据发布的隐私保护以及数据挖掘泛化性问题,提出一种用于聚类分析的异构数据差分隐私发布方案.为了解决处理隐私信息后缺乏正确引导的问题,将原始数据分组为集群,并利用集群标签对数据的集群结构进行编码,还为异构数据定制了一个同时考虑关系属性和集值属性的距离度量集群.在保留集群结构的同时迭代地概括原始数据.进一步在原始数据中加入噪声从而满足ε-差分隐私的要求.在满足差分隐私原则的前提下,提出一种同时处理关系数据和集值数据的不确定性算法,不同类型的数据以类似的方式进行匿名化.通过实验验证了该方法能够有效解决异构数据发布问题.  相似文献   

4.
为解决大型社交网络隐私保护中的复杂度过高及可用性差的问题,提出一种基于随机投影及差分隐私的社交网络隐私保护算法。利用随机投影对社交网络图的邻接矩阵进行指定投影数量的降维,进一步在降维后的矩阵中加入少量高斯噪声生成待发布矩阵。该算法满足(ε,δ)-差分隐私定义且能保持用户间欧氏距离的可计算性不变。实验和对比分析结果表明,该算法较传统差分隐私能大幅提升数据可用性且计算复杂性较小,适用于大规模社交网络隐私保护。  相似文献   

5.
差分隐私是目前应用较为广泛的工具,由于它忽略攻击者的任意背景知识,提供了强大的理论隐私保障,能够在数据发布期间保护数据的隐私。直方图发布作为直观的数据发布方法之一,也有着隐私披漏的风险。针对该问题,本文提出了一种基于差分隐私保护的直方图发布方法,实验结果证明,将这种方法应用到统计上可大大提高隐私的安全性和数据发布的可靠性。  相似文献   

6.
面向数据发布和分析的差分隐私保护   总被引:2,自引:0,他引:2  
随着数据分析和发布等应用需求的出现和发展,如何保护隐私数据和防止敏感信息泄露成为当前面临的重大挑战.基于k-匿名或者划分的隐私保护方法,只适应特定背景知识下的攻击而存在严重的局限性.差分隐私作为一种新出现的隐私保护框架,能够防止攻击者拥有任意背景知识下的攻击并提供有力的保护.文中对差分隐私保护领域已有的研究成果进行了总结,对该技术的基本原理和特征进行了阐述,重点介绍了当前该领域的研究热点:差分隐私下基于直方图的发布技术、基于划分的发布技术以及回归分析技术.在对已有技术深入对比分析的基础上,指出了差分隐私保护技术的未来发展方向.  相似文献   

7.
差分隐私保护及其应用   总被引:3,自引:0,他引:3  
数据发布与数据挖掘中的隐私保护问题是目前信息安全领域的一个研究热点.作为一种严格的和可证明的隐私定义,差分隐私近年来受到了极大关注并被广泛研究.文中分析了差分隐私保护模型相对于传统安全模型的优势,对差分隐私基础理论及其在数据发布与数据挖掘中的应用研究进行综述.在数据发布方面,介绍了各种交互式和非交互式的差分隐私保护发布方法,并着重从精确度和样本复杂度的角度对这些方法进行了比较.在数据挖掘方面,阐述了差分隐私保护数据挖掘算法在接口模式和完全访问模式下的实现方式,并对这些算法的执行性能进行了分析.最后,介绍了差分隐私保护在其它领域的应用,并展望未来的研究方向.  相似文献   

8.
9.
差分隐私是2006年由DWORK提出的一种新型的隐私保护机制,它主要针对隐私保护中,如何在分享数据时定义隐私,以及如何在保证可用性的数据发布时,提供隐私保护的问题,这两个问题提出了一个隐私保护的数学模型。由于差分隐私对于隐私的定义不依赖于攻击者的背景知识,所以被作为一种新型的隐私保护模型广泛地应用于数据挖掘,机器学习等各个领域。本文介绍了差分隐私的基础理论和目前的研究进展,以及一些已有的差分隐私保护理论和技术,最后对未来的工作和研究热点进行了展望。  相似文献   

10.
在电力线损的分析和降损措施研究中,大量用到电力营销、用电等数据,这些数据涉及用户隐私和商业秘密,如果开放应用将面临着较大的隐私泄露风险.结合区块链的不可篡改性和全流程可溯源的特点,考虑应用系统的安全等级差异和多方数据的整合,提出满足差分隐私要求的电力隐私数据多安全层级的共享方案.该方案能够将隐私数据泄露的风险降低到可以控制的范围,从而消除数据持有方信息安全的担忧,对电力数据的大规模开发利用有借鉴意义.  相似文献   

11.
Kohonen's self-organizing map (SOM) network maps input data to a lower dimensional output map. The extended SOM network further groups the nodes on the output map into a user specified number of clusters. Kiang, Hu and Fisher used the extended SOM network for market segmentation and showed that the extended SOM provides better results than the statistical approach that reduces the dimensionality of the problem via factor analysis and then forms segments with cluster analysis. In this study, we examined the effect of sample size on the extended SOM compared to that on the factor/cluster approach. Two sampling schemes, one with random sampling and the other one with proportionate sampling were used. Comparisons were made using the correct classification rates between the two approaches at various sample sizes. Unlike statistical models, neural networks are not dependent on statistical assumptions. Thus, the results for neural network models are stable across sample sizes but sensitive to initial weights and model specifications.  相似文献   

12.
RFID采集的车辆信息可以识别营运车辆的运行规律,采用这种方法能找出运行规律类似营运车辆的私家车,并判定为疑似非法营运车辆。应用SOM神经网络聚类时,初始化网络需要设置各种参数。为此,提出一种自适应确定网络训练次数的方法,利用权值导数来判断是否停止训练。利用UCI数据集对传统的和改进后的网络进行测试并对比,发现改进后的网络优于传统网络。最后,将改进后的网络用在车辆运行规律识别中,得到预期的效果。  相似文献   

13.
基于人工神经网络的多模型综合预报方法   总被引:3,自引:1,他引:3  
根据天气系统非线性变化及天气变化受大气多种内外因素综合影响的特点,文中提出了用ANN的前馈网络(BP算法)串入竞争自组织映射网络(SOM网络)方法对同一预报量进行不同结构类型的MOS模型、动力诊断模型和人工智能模型的综合预报。利用这一系统对样本进行了先聚类后训练的预报。结果表明,BP SOM网络实现多模型(异型)综合预报系统具有很好的应用前景。  相似文献   

14.
利用SOM网络模型进行聚类研究   总被引:2,自引:0,他引:2  
自组织特征映射(SOM)是Kohonen提出的一种人工神经网络模型,其整个学习过程是在输入样本空间内进行.并以欧氏距离为度量。本文先介绍了SOM网络模型的来源,接着对SOM网络的结构与学习过程进行了介绍,最后给出了一个SOM网络模型在聚类中的程序实例。  相似文献   

15.
郑建国  王翔  刘荣辉 《软件学报》2012,23(9):2374-2387
差分进化(differential evolution,简称DE)算法解决约束优化问题(constrained optimization problems,简称COPs)时通常采用可行解优先的比较规则,但是该方法不能利用种群中不可行解的信息.设计了可以利用不可行解信息的ε-DE算法.该算法通过构造一种比较准则,使得进化过程可以充分利用种群中优秀不可行解的信息.该准则通过引入种群约束允许放松程度的概念,在进化初始阶段使可行域边界上且拥有较优目标函数的不可行解进入种群;随着进化代数增加,种群约束允许放松程度不断减小,使得种群中不可行解数量减少,直到种群约束允许放松程度为0,种群完全由可行解组成.此外,还选择了一种改进的DE算法作为搜索算法,使得进化过程具有较快的收敛性.13个标准Benchmark函数实验仿真的结果表明:ε-DE算法是目前利用DE算法解决COPs问题中效果最好的.  相似文献   

16.
异常值的检测问题是时下数据挖掘领域的研究热点。目前已经有许多种成熟的异常值检测方法,但当数据是高维混合型属性,或者存在成片孤立点时,这些方法就变得很不理想甚至不再适用。因此,针对这些现有方法的不足之处,提出了新的孤立点检测方法,并设计了时域和空域的异常值检测平台。对于时间和空间序列数据集,该平台分别采用基于互相关分析和自组织竞争(self-organizing maps, SOM)神经网络的异常值检测方法。经实验验证,检测平台具有较高的检测率和可靠性。同时,在搭建该平台时充分考虑了模块化和层次化的方式,使得平台具有良好的可扩展性和开放性。  相似文献   

17.
数据发布中的隐私保护问题是目前信息安全领域的一个研究热点.如何有效地防止敏感隐私信息泄露已成为信息安全领域的重要课题.差分隐私保护技术是最新发展起来的隐私保护技术,它的最大优点是不对攻击者的背景知识做任何特定假设,该技术不但能为隐私数据发布提供强有力的安全防护,而且在实践中也得到了广泛应用.现有的差分隐私保护技术并不能全面有效地处理高维隐私数据的发布问题,虽然基于贝叶斯网络的隐私数据发布方法(PrivBayes)有效地处理了高维数据集转化为低维数据集的发布问题,但这种方法也存在一定的缺陷和不足.基于对贝叶斯网络的隐私数据发布方法的分析研究和改进优化,建立了加权贝叶斯网络隐私数据发布方法(加权PrivBayes),通过理论分析和实验评估,该方法不仅能保证原始隐私发布数据集的隐私安全性,同时又能大幅提升原始隐私发布数据集的数据精确性.  相似文献   

18.
    
The increasing availability of high-dimensional data collected from numerous users has led to the need for multi-dimensional data publishing methods that protect individual privacy. In this paper, we investigate the use of local differential privacy for such purposes. Existing solutions calculate pairwise attribute marginals to construct probabilistic graphical models for generating attribute clusters. These models are then used to derive low-dimensional marginals of these clusters, allowing for an approximation of the distribution of the original dataset and the generation of synthetic datasets. Existing solutions have limitations in computing the marginals of pairwise attributes and multi-dimensional distribution on attribute clusters, as well as constructing relational dependency graphs that contain large clusters. To address these problems, we propose LoHDP, a high-dimensional data publishing method composed of adaptive marginal computing and an effective attribute clustering method. The adaptive local marginal calculates any k-dimensional marginals required in the algorithm. In particular, methods such as sampling-based randomized response are used instead of privacy budget splits to perturb user data. The attribute clustering method measures the correlation between pairwise attributes using an effective method, reduces the search space during the construction of the dependency graph using high-pass filtering technology, and realizes dimensionality reduction by combining sufficient triangulation operation. We demonstrate through extensive experiments on real datasets that our LoHDP method outperforms existing methods in terms of synthetic dataset quality.  相似文献   

19.
数据发布的隐私保护研究主要分为两类:数据单次发布和数据多次发布.目前,数据单次发布的隐私保护研究已经趋于完善.但是在真实的世界中,待发布的数据通常是动态变化的,数据多次发布的隐私保护是目前该领域的研究热点.对数据多次发布的隐私保护研究成果进行了总结,介绍了关系数据和社会网络数据的隐私保护模型,深入地分析了现有的关系数据和社会网络数据多次发布的各种方法,并指明了该领域的未来研究方向.  相似文献   

20.
利用自组织映射神经网络(SOM)技术对散乱数据点集进行B样条曲面重建时,往往存在网络学习时间过长和学习效果不理想等问题。提出了一种新的神经元初始化方法和分块学习算法,该算法首先运用主元素分析方法(PCA)对散乱数据进行分块,将拓扑结构为四边形的输出层神经元初始化在每块散乱数据的最小二乘平面上进行网络学习和训练,将分块学习得到的各网格曲面拼接成一个整体;然后对该整体网格曲面的边界和内部单独学习,得到一张逼近待重建曲面的双线性B样条曲面;最后对该B样条曲面误差进行了修正。实例证明,该算法可以明显地减少SOM网络学习时间,并改善网络学习效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号